Какво е оптично разпознаване на знаци (OCR)?

Съдържание:

Какво е оптично разпознаване на знаци (OCR)?
Какво е оптично разпознаване на знаци (OCR)?
Anonim

Оптичното разпознаване на символи (OCR) се отнася до софтуер, който създава цифрова версия на отпечатан, напечатан или ръкописен документ, който компютрите могат да четат, без да е необходимо ръчно да въвеждат или въвеждат текста. OCR обикновено се използва за сканирани документи в PDF формат, но може също да създаде компютърно четима версия на текст в графичен файл.

Какво е OCR

OCR, наричано още разпознаване на текст, е софтуерна технология, която трансформира знаци като цифри, букви и препинателни знаци (наричани още глифове) от печатни или писмени документи в електронна форма, по-лесно разпознаваема и четена от компютри и други софтуерни програми. Някои програми за OCR правят това, когато документът се сканира или снима с цифрова камера, а други могат да приложат този процес към документи, които преди това са били сканирани или фотографирани без OCR. OCR позволява на потребителите да търсят в PDF документи, да редактират текст и да преформатират документи.

Image
Image
Сканиране на исторически вестници с OCR софтуер.

Getty Images

За какво се използва OCR?

За бързи, ежедневни нужди от сканиране OCR може да не е голяма работа. Ако правите голям обем сканиране, възможността да търсите в PDF файлове, за да намерите точния, от който се нуждаете, може да спести доста време и прави OCR функционалността във вашата програма за скенер по-важна. Ето някои други неща, с които OCR помага:

  • Автоматизирана обработка на данни и въвеждане на данни (Пример: Системи за проследяване на кандидати за работа за автобиографии).
  • Направете сканираните книги годни за търсене.
  • Преобразуване на ръкописни сканирания в четим от компютър текст.
  • Направете документите по-използваеми от програми за четене, които подпомагат потребители с увредено зрение.
  • Запазване на исторически документи и вестници, като същевременно ги прави годни за търсене.
  • Извличане на данни и прехвърляне към счетоводни програми (Пример: разписки и фактури).
  • Индексиране на документи за използване от търсачките.
  • Разпознаване на шофьорски регистрационни табели от камера за скорост и софтуер за камера за червен светофар.
  • Синтезатори на реч за хора, които не могат да говорят – теоретичният физик Стивън Хокинг е може би най-известният потребител на програма за синтез на реч.

Долен ред

Защо просто не направите снимка, нали? Защото няма да можете да редактирате нищо или да търсите в текста, защото това ще бъде просто изображение. Сканирането на документа и стартирането на OCR софтуер може да превърне този файл в нещо, което можете да редактирате и да можете да търсите.

История на OCR

Докато най-ранното използване на разпознаване на текст датира от 1914 г., широко разпространеното развитие и използване на технологии, свързани с OCR, започва сериозно през 50-те години на миналия век, по-специално със създаването на много опростени шрифтове, които са по-лесни за конвертиране в цифров вид. четим текст. Първият от тези опростени шрифтове е създаден от Дейвид Шепърд и известен като OCR-7B. OCR-7B все още се използва днес във финансовата индустрия за стандартния шрифт, използван на кредитни и дебитни карти. През 60-те години на миналия век пощенските услуги в няколко държави започнаха да използват технологията OCR, за да ускорят значително сортирането на пощата, включително Съединените щати, Великобритания, Канада и Германия. OCR все още е основната технология, използвана за сортиране на поща за пощенските услуги по целия свят. През 2000 г. ключови познания за границите и възможностите на OCR технологията бяха използвани за разработване на CAPTCHA програми, използвани за спиране на ботове и спамери.

През десетилетията OCR стана по-точен и по-усъвършенстван поради напредъка в свързани технологични области като изкуствен интелект, машинно обучение и компютърно зрение. Днес OCR софтуерът използва разпознаване на образи, откриване на функции и копаене на текст, за да трансформира документи по-бързо и по-точно от всякога.

ЧЗВ

    Как да сканирам документи с моя телефон или таблет?

    На iOS отворете приложението Бележки и създайте нова бележка. Отворете камерата и след това докоснете Scan Documents. На Android отворете Google Drive и изберете Plus (+), след което докоснете Scan, за да сканирате документ с вашия телефон.

    Как да използвам OCR в Adobe Acrobat?

    Отворете PDF файл, съдържащ сканирано изображение, след което изберете Инструменти > Редактиране на PDF. Acrobat автоматично ще приложи OCR, за да можете да редактирате текста. Просто изберете къде искате да направите редакции и започнете да пишете.

    Каква е разликата между OCR и OMR?

    Optical Mark Recognition (OMR) е софтуер, който открива белези върху хартия, обикновено лист с мехурчета. OMR се използва за обработка на резултатите от изпити, анкети, въпросници и дори избори. За разлика от OCR, OMR не може да дешифрира знаците на страницата, а само проверява дали знаците са там.

Препоръчано: