Как да конвертирате сканирани документи в Word

Ако трябва да дигитализирате книга в текстов формат, може да имате няколко въпроса. Може ли да се направи? Какво ще кажете за качеството, добро ли е? Не само може да се направи, но има и няколко начина за конвертиране на сканиран документ в Word. Да видим:

Като сканирате документа във формат PDF и го редактирате по- късно с Adobe Acrobat XI Pro, за да го запазите във формат Word. Pro версията на Acrobat е платена, но можете да закупите безплатен 30-дневен пробен лиценз.
От уебсайта OnlineOCR.net . Това уеб приложение ви позволява да конвертирате PDF, JPG, TIFF и GIF документи в Word, Excel и текст. В безплатната версия можем да конвертираме до 15 страници на час и документи от не повече от една страница.
Като сканирате документа във формат (OCR) и го запазите като текст. След това можем да отворим Word и да го редактираме или запазим във формат .doc.
Използване на програма за оптично разпознаване на символи :
- VueScan (налично за Windows, Mac OS X и Linux)
- Kooka (за Linux)
- Офис обектив (за Android и iOS )
- CamScanner (за Android и iOS )

Най-ефективният начин от всички, които бихме могли да кажем, е чрез Adobe Acrobat Pro, но само ако сканирането е много, много чисто и с високо качество. Приложенията за оптично разпознаване на знаци са изминали дълъг път, но все пак показват някои пропуски с неща като получер или курсив и транскрипцията на някои думи в зависимост от типа шрифт на оригиналния документ може да е грешна.

Опитайте се да сканирате и да предадете този документ на Word, за да видите какво се случва

От самия скенер

Някои скенери включват функцията за оптично разпознаване (OCR) в собствената си програма за сканиране. За да сканирате документ в текст, трябва само да зададете формат за цифровизация и да погледнете такъв, който се отнася до OCR или подобен (зависи от марката / модела на скенера).

Преминете от PDF към Word с Adobe Acrobat XI Pro

След като Adobe Acrobat XI Pro бъде изтеглен и инсталиран ( ТУК имате безплатна 30-дневна пробна версия), отидете на „ Инструменти -> Разпознаване на текст -> В този файл “.

В прозореца „ Разпознаване на текст “ кликнете върху „ Редактиране “ и изберете езика на текста, стила на извеждане и разделителната способност.

Накрая се върнете към „ Инструменти -> Редактиране на съдържание -> Редактиране на текст и изображения “ и променете текста, ако трябва да коригирате някакви думи. За да завършите, кликнете върху „ Файл -> Запазване като “ и го запазете във формат Word.

OnlineOCR

OnlineOCR е уеб приложение за прехвърляне на изображения или pdfs в Word и е много лесно за използване. Ще обясня как работи: Въведете //www.onlineocr.net/ и кликнете върху „ Избор на файл “. Изберете сканирания документ и след това изберете езика и изходния формат от 2 падащи менюта, които имате в центъра на екрана.

За да завършите, кликнете върху „ Конвертиране “. Точно под него ще се появи преглед на обикновен текст, който можете да редактирате, ако трябва да коригирате някакви думи. Накрая кликнете върху „ Изтегляне на изходен файл “ и можете да изтеглите файла във формат Word. Ето пример за PDF, преобразуван в Word с OnlineOCR:

Оригинален PDF:

Конвертиран документ:

Ако това уеб приложение не ви удовлетворява, можете да опитате други подобни алтернативи като FreeOCR или Free-Online-OCR .

Програми за оптично разпознаване на символи (OCR)

Ако не искате да променяте документите си онлайн и се нуждаете от настолно приложение, можете да използвате приложения като VueScan (което също е достъпно за Mac и Linux в допълнение към повсеместния Windows).

Друга възможност е да използвате устройството си с Android или iOS, за да сканирате документа и да го преобразувате директно в текст. Има приложения като Office Lens (за Android и iOS ) или CamScanner (за Android и iOS ), които изпълняват целия процес от едно и също приложение. Препоръчително е в тези случаи да почистите изображението, преди да го преобразувате в текст. Ако искате да научите повече за този метод, погледнете ТОЗИ ПОСТ .

Според мен техниката за оптично разпознаване на символи, въпреки че се е подобрила значително през последните години, все още е на светлинни години от това да бъде перфектна техника. Много подробности, много думи, които той „превежда“ с неправилни букви и символи, които затрупват текста. Все още му липсва допълнителната интелигентност , която го кара да вижда, че " t &! $ Olog1a " не може да бъде валиден превод на която и да е дума в текст. Все още не виждам разбиране за четене, а просто визуално разпознаване на отделни букви, които образуват думи, без да ги интегрирам с останалата част от текста. Убеден съм обаче, че моментът, в който ще направим последния голям скок, се приближава всеки ден.

Имате ли инсталиран Telegram ? Получавайте най-добрата публикация за всеки ден в нашия канал . Или ако предпочитате, научете всичко от нашата Facebook страница .