Google відкрив API для оптичного розпізнавання текстів

Так-так, їх роботи у Google Books напевно принесли гарні плоди, які ми можемо починати пожинати. І зараз я вам розповім як.

Скановані документи не завжди вимагають перетворення в реальний текст. Однак іноді так хочеться не набирати яке-небудь угоду знову, а електронної копії-то і немає. Звичайно, ви могли б скористатися якою-небудь програмою дешевої OCR, що йде разом зі сканером, або навіть купити (не крали ж ви) FineReader. Але час безкоштовних настільних програм OCR проходить ще й тому, що зараз тексти все частіше фотографують, а не сканують.

Для завантаження будь-яких зображень (jpeg, png, gif) з текстом для подальшого розпізнавання Google і відкрив API Google Docs. Тепер ви можете завантажувати картинки в бібліотеку документів, а сервера Google перетворять її в текст.

Існує і додаток приклад, що ілюструє роботу API:

Google відкрив API для оптичного розпізнавання текстів

Але вам, програмісти, слід подумати про створення своїх інтерфейсів до цих можливостей. Наприклад — у вас є скани книг в PNG? Це збочення, чи не правда? Так ось вам і карти в руки — напишіть додаток яке завантажує текст посторінково, не порушує лімітів і з’єднує все завантаження в єдиний текст.

Але пам’ятайте, обмеження у API є, і головне з них, мені здається, що розпізнається тільки латиниця, поки тільки вона. Крім того потрібно слідкувати щоб висота символів була не менше 10 пікселів, а загальний розмір картинки не перевищував 10 мегапікселів.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *