Категории

Распознавание текста

Оцифровка документов вручную – это долгий и нудный труд, отнимающий время. Для удобства этот процесс автоматизирован: существует множество программ, которые могут распознать текст с фотографии и перевести его в электронный вариант. От человека может потребоваться только простое редактирование, но основной пласт работы за него все равно выполнит компьютер.

Программы-распознаватели могут:

  • оцифровывать печатный или рукописный текст с фотографии или скана документа;
  • конвертирование графических форматов в текстовые (например, можно перевести текст с DjVu в DOC);
  • распознавание многих языков, а не только русского;
  • редактирование полученных результатов (исправление неточностей и ошибок, что особенно актуально для рукописных вариантов);
  • проверка орфографии и выявление незнакомых слов;
  • ведение пользовательских словарей (алгоритм в этом случае сможет распознавать даже локальные названия, прозвища, специфическую лексику и прочее);
  • простая верстка текста;
  • многое другое в зависимости от функционала конкретной выбранной программы.

Любая из таких программ может оказаться полезной для студентов и людей чей род деятельности связан с бумагами и документами. Распознаватели помогают избавиться от необходимости постоянно вручную набирать тексты, сверяясь с их бумажным вариантом – достаточно сфотографировать лист, загрузить в специальное окошко (иногда может потребоваться редактирование и исправление ошибок и несостыковок). Это же касается и сканов, и скриншотов, и документов в форматах PDF и DjVu.

}