Краевое государственное образовательное учреждение
"Учебный центр УТЗН Алтайского края"

::Инструкция::   ::Лекции ::Презентация:: ::Практика::  : ::Тестирование :::Автор проекта ::






Лекции:
 
Операционная система

Файловая система

Файловый менеджер

Текстовый процессор

Электронные таблицы

Программа для презентаций

Информационно-правовые системы

Электронная почта

Основы Интернет

 
 


Сканирование. Распознавание текста

С помощью сканера достаточно просто получить изображение страницы текста в графическом файле. Однако работать с таким текстом невозможно: как любое сканированное изображение, страница с текстом представляет собой графический файл - обычную картинку. Текст можно будет читать и распечатывать, но нельзя будет его редактировать и форматировать. Для получения документа в формате текстового файла необходимо провести распознавание текста, то есть преобразовать элементы графического изображения в последовательности текстовых символов. Современные программы распознавания текста обеспечивают проверку орфографии, автоматическое форматирование текста и массу других дополнительных удобств.

Сканировать можно как изображения, так и текстовую информацию с помощью программы распознования текста АBBYY FineReader. При запуске этой программы появляется окно следующего типа:

Рабочее окно ABBYY FineReader

Для сканирования изображения документа необходимо положить на стекло сканера страницу с текстом или книгу и нажать на кнопку "Scan&Read" и появится мастер "Scan&Read", в котором достаточно нажимать на кнопку "далее". Будут появляться соответствующие окна, как показано на рис. ниже. В первом окне рис. необходимо нажать на кнопку "Сканировать", а на последующих шагах нажимать на кнопку "Далее".
Шаг для сканирование Распознование Проверка ошибок Сохранение в файл

Черно-белый тип изображения обеспечивает более высокую скорость сканирования, но при этом теряется часть информации о буквах, что может привести к ухудшению качества распознавания на документах среднего и низкого качества печати. При распознавании изображение должно иметь стандартную ориентацию, т. е. текст должен читаться сверху вниз и строки должны быть горизонтальными. После завершения сканирования изображение окажется включенным в конец пакета, если не активна опция "Запрашивать номер страницы перед добавлением в пакет", а его пиктограмма отобразится на панели пакета.
Чтобы сохранить документ в виде картинки необходимо зайти в меню "Файл" и выбрать опцию "Сохранить изображение как...."

FineReader - система оптического распознавания текстов. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати. FineReader имеет массы дополнительных функций и удобный интерфейс. Оптимальным разрешением для обычных текстов является - 300 dpi и 400-600 dpi для текстов, набранных мелким шрифтом (9 и менее пунктов). Сканирование в сером является оптимальным режимом для системы распознавания. В случае сканирования в сером режиме осуществляется автоматический подбор яркости. Если Вы хотите, чтобы содержащиеся в документе цветные элементы (картинки, цвет букв и фона) были переданы в электронный документ с сохранением цвета, необходимо выбрать цветной тип изображения. В других случаях используйте серый тип изображения. FineReader анализирует ориентацию страницы и переворачивает изображение, если это необходимо, а также выделяет блоки - области, которые при дальнейшем анализе будут интерпретироваться как текст, таблицы или рисунки Вся информация, включая распознанный текст и его форматирование, автоматически сохраняются в пакете вместе с исходным изображением и сведениями о макете страниц.

 

© 2009  Все права защищены