Matnni aniqlash. Bepul dastur - FineReader-ning analogi

Pin
Send
Share
Send

Ertami-kechmi, ofis dasturlari bilan ishlaydigan har bir kishi odatiy vazifaga duch keladi - kitob, jurnal, gazetadan matnni skanerlash va bu rasmlarni matn formatiga, masalan, Word hujjatiga tarjima qilish.

Buning uchun skaner va matnni tanib olish uchun maxsus dastur kerak. Ushbu maqolada FineReader-ning bepul hamkori muhokama qilinadi -Mixxat yozuvi (FineReader-da tan olinishi haqida - ushbu maqolaga qarang).

Boshlaymiz ...

Mundarija

  • 1. CuneiForm dasturining xususiyatlari, xususiyatlari
  • 2. Matnni aniqlash misoli
  • 3. Matnni tanib olish
  • 4. Xulosa

1. CuneiForm dasturining xususiyatlari, xususiyatlari

Mixxat yozuvi

Siz uni ishlab chiqaruvchining saytidan yuklab olishingiz mumkin: //cognitiveforms.com/

Ochiq kodli matnni aniqlash dasturi. Bundan tashqari, u Windows-ning barcha versiyalarida ishlaydi: XP, Vista, 7, 8, bu yoqadi. Bundan tashqari, dasturning to'liq rus tilidagi tarjimasini qo'shing!

Taroziga soling:

- matnni dunyoning eng mashhur 20 tilida aniqlash (ushbu raqamga ingliz va rus tillari o'zi kiritilgan);

- Har xil bosma shriftlarni qo'llab-quvvatlash;

- tanilgan matn lug'atini tekshiring;

- ish natijalarini bir necha usulda tejash imkoniyati;

- hujjat tuzilishini saqlash;

- Ajoyib qo'llab-quvvatlash va stolni tanib olish.

Kamchiliklari:

- juda katta hujjatlar va fayllarni qo'llab-quvvatlamaydi (400 dpi dan ortiq);

- Ayrim turdagi skanerlarni to'g'ridan-to'g'ri qo'llab-quvvatlamaydi (bu unchalik katta ish emas, brauzer drayverlariga maxsus skaner dasturi kiritilgan);

- dizayn porlamaydi (lekin dastur muammoni to'liq hal qilsa, kim unga kerak).

2. Matnni aniqlash misoli

Biz sizni tan olish uchun kerakli suratlarni allaqachon olgan deb taxmin qilamiz (u erda skanerdan o'tkazgan yoki Internetda pdf / djvu formatda kitob yuklab olib, ulardan kerakli rasmlarni olib tashlagan. Buni qanday amalga oshirish haqida ushbu maqolaga qarang).

1) CuineForm dasturida kerakli rasmni oching (fayl / ochish yoki "Cntrl + O").

2) Tanishni boshlash uchun - avval siz turli sohalarni tanlashingiz kerak: matn, rasmlar, jadvallar va hk. Cuneiform dasturida buni nafaqat qo'lda, balki bajarish ham mumkin avtomatik ravishda! Buning uchun oynaning yuqori panelidagi "tartib" tugmachasini bosing.

3) 10-15 soniyadan keyin. Dastur avtomatik ravishda barcha ranglarni o'z ichiga olgan barcha joylarni ta'kidlaydi. Masalan, matn maydoni ko'k rang bilan ajratilgan. Aytgancha, u barcha sohalarni to'g'ri va juda tez ajratib ko'rsatdi. Rostini aytsam, undan bunday tez va to'g'ri munosabatni kutmagan edim ...

4) Avtomatik tartibga ishonmaydiganlar uchun siz qo'llanmadan foydalanishingiz mumkin. Buning uchun asboblar paneli mavjud (quyidagi rasmga qarang), buning yordamida siz tanlashingiz mumkin: matn, jadval, rasm. Boshlang'ich rasmni siljiting, kattalashtiring / kamaytiring, qirralarni kesib oling. Umuman olganda, yaxshi to'plam.

5) Barcha joylar belgilanganidan so'ng, biz davom etishimiz mumkin tan olish. Buning uchun quyidagi rasmdagi kabi xuddi shu nom bilan tugmachani bosing.

6) 10-20 soniyada tom ma'noda. Microsoft Word-da taniqli matn bilan hujjatni ko'rasiz. Qizig'i shundaki, ushbu misol uchun matnda, albatta, xatolar bo'lgan, ammo ulardan juda ozi bor! Bundan tashqari, manba materiali qanday sifatga ega ekanligini hisobga olsak - rasm.

Tezlik va sifatni FineReader bilan solishtirish mumkin!

3. Matnni tanib olish

Bir vaqtning o'zida bitta rasmni emas, balki bir nechta rasmlarni tanib olish kerak bo'lganda ushbu dastur funktsiyasi qulay bo'lishi mumkin. To'plamni aniqlashni boshlash uchun yorliq odatda boshlang'ich menyusida yashiringan.

1) Dasturni ochgandan so'ng, siz yangi paketni yaratishingiz yoki avval saqlangan paketni ochishingiz kerak. Bizning misolimizda yangisini yarating.

2) Keyingi bosqichda biz unga nom beramiz, yaxshisi olti oydan keyin unda saqlangan narsalarni esga olamiz.

3) Keyin, hujjat tilini tanlang (rus-ingliz), skaner qilingan materialingizda rasmlar va jadvallar mavjudligini ko'rsating.

4) Endi tanib olish uchun fayllar joylashgan papkani ko'rsatishingiz kerak. Aytgancha, qiziq narsa, dasturning o'zi barcha rasmlarni va boshqa grafik fayllarni topishi va ularni loyihaga qo'shishi mumkin. Siz shunchaki ortiqcha narsalarni olib tashlashingiz kerak.

5) Keyingi qadam muhim emas - tanib olingandan so'ng, dastlabki fayllar bilan nima qilishni tanlang. "Hech narsa qilmang" katagiga belgi qo'yishingizni maslahat beraman.

6) Tan olingan hujjat saqlanadigan formatni tanlashgina qoladi. Bir nechta variant mavjud:

- rtf - barcha taniqli ofislar tomonidan ochilgan so'zli hujjatdagi fayl (shu jumladan bepul, dasturlarga havola);

- txt - matn formati, unda faqat matnni saqlashingiz mumkin, rasmlar va jadvallar bo'lishi mumkin emas;

- htm - gipermatnli sahifa, sayt fayllarini skanerlash va tanib olish uchun qulay. Biz buni o'z misolimizda tanlaymiz.

7) "Finish" tugmachasini bosgandan so'ng, sizning loyihangizni qayta ishlash jarayoni boshlanadi.

8) Dastur juda tez ishlaydi. Tanib bo'lgandan keyin sizning oldingizda htm fayllari bo'lgan yorliq paydo bo'ladi. Agar siz bunday faylni bossangiz, natijalarni ko'rishingiz mumkin bo'lgan brauzer ishga tushadi. Aytgancha, paketni keyinchalik u bilan ishlash uchun saqlash mumkin.

9) Ko'rib turganingizdek, natijalar ish juda ta'sirli. Dastur rasmni osongina tanidi va uning ostida matn osongina tanib olindi. Dastur bepul bo'lishiga qaramay, umuman olganda super!

4. Xulosa

Agar siz tez-tez hujjatlarni skanerlamasangiz va tanimasangiz, unda FineReader dasturini sotib olish ma'nosizdir. Ko'pgina vazifalar CuneiForm tomonidan osonlikcha bajariladi.

Boshqa tomondan, uning kamchiliklari ham bor.

Birinchidan, natijani tahrirlash va tekshirish uchun vositalar juda oz. Ikkinchidan, ko'p rasmlarni tanib olish kerak bo'lganda, FineReader-da loyihaga qo'shilgan hamma narsani o'ng tomonda darhol ko'rish qulayroq bo'ladi: keraksizlarini tezda olib tashlang, tuzatishlar kiriting va hokazo. Va uchinchidan, CuneiForm hujjatlar tan olinishi natijasida yo'qoladi: Hujjatni yodda tutishim kerak - xatolarni tahrirlash, tinish belgilari, tirnoq belgilari va boshqalar.

Hammasi shu. Matnni aniqlaydigan boshqa biron bir munosib dasturni bilasizmi?

Pin
Send
Share
Send