Doimiy nusxalashdan foydalanib, PDF-faylidan matnni olish har doim ham imkoni yo'q. Ko'pincha bunday hujjatlar sahifalarida ularning qog'oz versiyalari mazmuni skanerlanadi. Bunday fayllarni to'liq tahrirlanadigan matnli ma'lumotlarga aylantirish uchun Optical Character Recognition (OCR) funktsiyasiga ega bo'lgan maxsus dasturlardan foydalaniladi.
Bunday qarorlarni amalga oshirish juda qiyin va shuning uchun ko'p pul talab etiladi. Agar siz PDF-dagi matnni doimiy ravishda tanib olishingiz kerak bo'lsa, tegishli dasturni sotib olish tavsiya etiladi. Kamdan kam hollarda, shunga o'xshash funktsiyalarga ega bo'lgan mavjud onlayn xizmatlardan birini ishlatish mantiqan to'g'ri keladi.
Onlayn ravishda PDF-dagi matnni qanday aniqlash mumkin
Albatta, OCR-ning onlayn xizmatlarining imkoniyatlari, to'liq ish stoli echimlariga nisbatan ancha cheklangan. Ammo siz ham bunday manbalar bilan bepul yoki nominal to'lov evaziga ishlashingiz mumkin. Asosiysi, ularning asosiy vazifasi, ya'ni matnni tanib olish bilan, tegishli veb-ilovalar ham bu vazifani bajara olishadi.
1-usul: ABBYY FineReader Online
Servisni ishlab chiqish bo'yicha kompaniya optik hujjatlarni tan olish sohasidagi etakchilardan biridir. Windows va Mac uchun ABBYY FineReader - bu PDF-ni matnga aylantirish va u bilan ishlash uchun kuchli echimdir.
Dasturning veb-asosidagi analogi, shubhasiz, funksionallik jihatidan undan kamdir. Shunga qaramay, xizmat 190 dan ortiq tillarda skanerlash va fotosuratlardagi matnlarni taniy oladi. PDF fayllarini Word, Excelga o'zgartiradi va hokazo hujjatlar qo'llab-quvvatlanadi.
ABBYY FineReader Onlayn Onlayn xizmati
- Ushbu vosita bilan ishlashni boshlashdan oldin, saytda hisob qaydnomasini yarating yoki Facebook, Google yoki Microsoft hisob qaydnomangizdan foydalanib tizimga kiring.
Avtorizatsiya oynasiga o'tish uchun tugmani bosing "Kirish" yuqori menyu satrida. - Tizimga kirganingizdan so'ng tugmani bosib kerakli hujjatni FineReader-ga import qiling "Fayllarni yuklash".
Keyin bosing "Sahifa raqamlarini tanlang" va matnni aniqlash uchun kerakli oraliqni belgilang. - Keyin hujjatda mavjud bo'lgan tillarni, natijada paydo bo'lgan fayl formatini tanlang va tugmani bosing "E'tirof etish".
- Qayta ishlashdan so'ng, uning davomiyligi to'liq hujjat hajmiga bog'liq, siz tugallangan faylni uning nomini bosish orqali matnli ma'lumotlar bilan yuklab olishingiz mumkin.
Yoki uni mavjud bulut xizmatlaridan biriga eksport qiling.
Xizmat, ehtimol rasmlar va PDF fayllaridagi matnni aniq aniqlash algoritmlari bilan ajralib turadi. Ammo, afsuski, undan bepul foydalanish oyiga beshta varaq bilan cheklangan. Ko'proq hajmli hujjatlar bilan ishlash uchun siz yillik obunani sotib olishingiz kerak bo'ladi.
Ammo, agar OCR kamdan-kam hollarda kerak bo'lsa, ABBYY FineReader Online - bu kichkina PDF-fayllardan matnlarni ajratib olish uchun juda yaxshi imkoniyat.
2-usul: Bepul onlayn OCR
Matnni raqamlashtirish uchun oddiy va qulay xizmat. Ro'yxatdan o'tmasdan, manba sizga soatiga 15 ta to'liq PDF sahifani tan olishga imkon beradi. Free Online OCR 46 tilda hujjatlar bilan to'liq ishlaydi va avtorizatsiya qilinmasdan uchta matnni eksport qilish formatlarini qo'llab-quvvatlaydi - DOCX, XLSX va TXT.
Ro'yxatdan o'tish paytida foydalanuvchi ko'p sahifali hujjatlarni qayta ishlash imkoniyatiga ega bo'ladi, ammo ushbu sahifalarning bepul soni 50 donadan iborat.
Bepul OCR onlayn xizmati
- PDF-dagi matnni "mehmon" sifatida tan olish uchun, saytdagi ma'lumotsiz saytning bosh sahifasidagi tegishli shakldan foydalaning.
Tugmani bosib kerakli hujjatni tanlang Fayl, matnning asosiy tilini, chiqish formatini belgilang, so'ng faylni yuklashni kuting va cherting O‘zgartirish. - Raqamlashtirish jarayoni oxirida, ni bosing "Chiqish faylini yuklab olish" tugallangan hujjatni kompyuterda matn bilan saqlash uchun.
Vakolatli foydalanuvchilar uchun harakatlar ketma-ketligi biroz farq qiladi.
- Tugmani ishlating "Ro'yxatdan o'tish" yoki "Kirish" mos ravishda, Free Online OCR hisobini yaratish yoki unga kirish uchun yuqori menyu satrida.
- Tasdiqlash panelida avtorizatsiyadan so'ng, tugmachani bosib ushlab turing CTRL, taqdim etilgan ro'yxatdagi dastlabki hujjatning ikki tilini tanlang.
- PDF-dan matnni chiqarib olish uchun boshqa variantlarni belgilang va ustiga bosing Faylni tanlang xizmatga hujjatni yuklash uchun.
Keyin tanishni boshlash uchun cherting O‘zgartirish. - Hujjatni qayta ishlash oxirida tegishli ustundagi chiqish faylining nomi ko'rsatilgan havolani bosing.
Tanib olish natijasi darhol kompyuteringiz xotirasida saqlanadi.
Agar siz kichkina PDF-hujjatdan matnni chiqarib olishingiz kerak bo'lsa, yuqorida keltirilgan vositadan foydalanib ishonch bilan murojaat qilishingiz mumkin. Katta hajmli fayllar bilan ishlash uchun Free Online OCR-da qo'shimcha belgilar sotib olishingiz yoki boshqa echimni ishlatishingiz kerak bo'ladi.
3-usul: NewOCR
DjVu va PDF kabi deyarli har qanday grafik va elektron hujjatlardan matnlarni olish imkonini beruvchi mutlaqo bepul OCR xizmati. Resurs tan olingan fayllarning hajmi va soniga cheklovlar qo'ymaydi, ro'yxatdan o'tishni talab qilmaydi va tegishli funktsiyalarning keng doirasini taklif etadi.
NewOCR 106 tilni qo'llab-quvvatlaydi va hatto past sifatli hujjat skanerlarini to'g'ri qayta ishlay oladi. Fayl sahifasida matnni aniqlash zonasini qo'lda tanlash mumkin.
NewOCR Onlayn xizmati
- Shunday qilib, keraksiz harakatlarsiz zudlik bilan resurs bilan ishlashni boshlashingiz mumkin.
Hujjatni saytga import qilish uchun forma asosiy sahifada joylashgan. NewOCR-ga faylni yuklash uchun tugmani ishlating "Faylni tanlang" bo'limda "Faylingizni tanlang". Keyin dalada "Tanish til (lar)" asl hujjatning bir yoki bir nechta tilini belgilang, so'ng cherting "Yuklash + OCR". - Tanlangan tanib olish parametrlarini o'rnating, matnni chiqarib olishni istagan sahifani tanlang va tugmani bosing OCR.
- Sahifani biroz pastga aylantiring va tugmani toping "Yuklab olish".
Unga bosing va ochiladigan ro'yxatda yuklab olish uchun kerakli hujjat formatini tanlang. Shundan so'ng, ajratib olingan matnli fayl kompyuteringizga yuklab olinadi.
Asbob qulay va etarlicha yuqori sifat barcha belgilarni taniydi. Shu bilan birga, import qilingan PDF hujjatning har bir sahifasini qayta ishlash mustaqil ravishda boshlanishi kerak va u alohida faylda ko'rsatiladi. Siz, shubhasiz, tanib olish natijalarini vaqtinchalik almashtirish paneliga nusxalashingiz va ularni boshqalar bilan birlashtira olasiz.
Shunga qaramay, yuqorida tavsiflangan nuansni hisobga olgan holda, NewOCR yordamida katta hajmdagi matnni olish juda qiyin. Kichik fayllar bilan xizmat portlash bilan kurashadi.
4-usul: OCR.Space
Matnni raqamlashtirish uchun oddiy va tushunarli manba bo'lib, u PDF hujjatlarini tanib olish va natijani TXT fayliga chiqarish imkonini beradi. Sahifalar soniga cheklovlar berilmaydi. Faqatgina cheklov shundaki, kirish hujjati hajmi 5 megabaytdan oshmasligi kerak.
OCR.Space Online xizmati
- Asbob bilan ishlash uchun ro'yxatdan o'tish shart emas.
Yuqoridagi havolani bosing va tugmani bosib PDF hujjatni veb-saytga kompyuterdan yuklang "Faylni tanlang" yoki tarmoqdan - ma'lumotnoma orqali. - Ochiladigan ro'yxatda "OCR tilini tanlang" Import qilingan hujjat tilini tanlang.
Keyin tugmachani bosib, matnni aniqlash jarayonini boshlang "OCR boshlash!". - Faylni qayta ishlash oxirida natijani maydonga o'qing OCR natijasi va bosing "Yuklab olish"tugagan TXT hujjatini yuklab olish uchun.
Agar siz faqat matnni PDF-dan chiqarib olishingiz kerak bo'lsa va ayni paytda uning yakuniy formatlanishi unchalik muhim bo'lmasa, OCR.Space - bu yaxshi tanlov. Bitta narsa shundaki, hujjat "bir tilli" bo'lishi kerak, chunki xizmatda bir vaqtning o'zida ikki yoki undan ortiq tilni tan olish ko'zda tutilmagan.
Shuningdek qarang: FineReader-ning bepul analoglari
Maqolada keltirilgan onlayn vositalarni baholab, shuni ta'kidlash kerakki, ABBYY dan FineReader Online OCR funktsiyasini eng aniq va samarali bajaradi. Agar matnni aniqlashning maksimal aniqligi siz uchun muhim bo'lsa, ushbu tanlovni alohida ko'rib chiqish yaxshidir. Ammo, ehtimol, buning uchun siz ham to'lashingiz kerak bo'ladi.
Agar siz kichik hujjatlarni raqamlashtirishingiz kerak bo'lsa va siz xizmatdagi xatolarni mustaqil ravishda tuzatishga tayyor bo'lsangiz, NewOCR, OCR.Space yoki Free Online OCR-dan foydalanish tavsiya etiladi.