Оптичното разпознаване на символи (OCR) се отнася до софтуер, който създава цифрова версия на отпечатан, напечатан или ръкописен документ, който компютрите могат да четат, без да е необходимо ръчно да въвеждат или въвеждат текста. OCR обикновено се използва за сканирани документи в PDF формат, но може също да създаде компютърно четима версия на текст в графичен файл.
Какво е OCR
OCR, наричано още разпознаване на текст, е софтуерна технология, която трансформира знаци като цифри, букви и препинателни знаци (наричани още глифове) от печатни или писмени документи в електронна форма, по-лесно разпознаваема и четена от компютри и други софтуерни програми. Някои програми за OCR правят това, когато документът се сканира или снима с цифрова камера, а други могат да приложат този процес към документи, които преди това са били сканирани или фотографирани без OCR. OCR позволява на потребителите да търсят в PDF документи, да редактират текст и да преформатират документи.
Getty Images
За какво се използва OCR?
За бързи, ежедневни нужди от сканиране OCR може да не е голяма работа. Ако правите голям обем сканиране, възможността да търсите в PDF файлове, за да намерите точния, от който се нуждаете, може да спести доста време и прави OCR функционалността във вашата програма за скенер по-важна. Ето някои други неща, с които OCR помага:
- Автоматизирана обработка на данни и въвеждане на данни (Пример: Системи за проследяване на кандидати за работа за автобиографии).
- Направете сканираните книги годни за търсене.
- Преобразуване на ръкописни сканирания в четим от компютър текст.
- Направете документите по-използваеми от програми за четене, които подпомагат потребители с увредено зрение.
- Запазване на исторически документи и вестници, като същевременно ги прави годни за търсене.
- Извличане на данни и прехвърляне към счетоводни програми (Пример: разписки и фактури).
- Индексиране на документи за използване от търсачките.
- Разпознаване на шофьорски регистрационни табели от камера за скорост и софтуер за камера за червен светофар.
- Синтезатори на реч за хора, които не могат да говорят – теоретичният физик Стивън Хокинг е може би най-известният потребител на програма за синтез на реч.
Долен ред
Защо просто не направите снимка, нали? Защото няма да можете да редактирате нищо или да търсите в текста, защото това ще бъде просто изображение. Сканирането на документа и стартирането на OCR софтуер може да превърне този файл в нещо, което можете да редактирате и да можете да търсите.
История на OCR
Докато най-ранното използване на разпознаване на текст датира от 1914 г., широко разпространеното развитие и използване на технологии, свързани с OCR, започва сериозно през 50-те години на миналия век, по-специално със създаването на много опростени шрифтове, които са по-лесни за конвертиране в цифров вид. четим текст. Първият от тези опростени шрифтове е създаден от Дейвид Шепърд и известен като OCR-7B. OCR-7B все още се използва днес във финансовата индустрия за стандартния шрифт, използван на кредитни и дебитни карти. През 60-те години на миналия век пощенските услуги в няколко държави започнаха да използват технологията OCR, за да ускорят значително сортирането на пощата, включително Съединените щати, Великобритания, Канада и Германия. OCR все още е основната технология, използвана за сортиране на поща за пощенските услуги по целия свят. През 2000 г. ключови познания за границите и възможностите на OCR технологията бяха използвани за разработване на CAPTCHA програми, използвани за спиране на ботове и спамери.
През десетилетията OCR стана по-точен и по-усъвършенстван поради напредъка в свързани технологични области като изкуствен интелект, машинно обучение и компютърно зрение. Днес OCR софтуерът използва разпознаване на образи, откриване на функции и копаене на текст, за да трансформира документи по-бързо и по-точно от всякога.
ЧЗВ
Как да сканирам документи с моя телефон или таблет?
На iOS отворете приложението Бележки и създайте нова бележка. Отворете камерата и след това докоснете Scan Documents. На Android отворете Google Drive и изберете Plus (+), след което докоснете Scan, за да сканирате документ с вашия телефон.
Как да използвам OCR в Adobe Acrobat?
Отворете PDF файл, съдържащ сканирано изображение, след което изберете Инструменти > Редактиране на PDF. Acrobat автоматично ще приложи OCR, за да можете да редактирате текста. Просто изберете къде искате да направите редакции и започнете да пишете.
Каква е разликата между OCR и OMR?
Optical Mark Recognition (OMR) е софтуер, който открива белези върху хартия, обикновено лист с мехурчета. OMR се използва за обработка на резултатите от изпити, анкети, въпросници и дори избори. За разлика от OCR, OMR не може да дешифрира знаците на страницата, а само проверява дали знаците са там.