Сканирование текста и графики. Вывод документа на печать

Разделы: Информатика, Конкурс «Презентация к уроку»


Цели урока:

  • Образовательные: помочь учащимся получить представление об OCR – программах распознавания текста, познакомиться с возможностями данных программы, научить распознавать отсканированный текст, передавать и редактировать его в Word.
  • Воспитательные: воспитание информационной культуры учащихся, внимательности, аккуратности, дисциплинированности, усидчивости.
  • Развивающие: развитие познавательных интересов, навыков работы на компьютере, самоконтроля, умения конспектировать.

Задачи урока:

  • Научить студентов работать со сканерами различных производителей.
  • Научить студентов применять знания работы со сканером, и программой FineRiader в курсовом и дипломном проектировании;
  • Продолжить отработку умений и навыков по работе в программе MS Word;
  • Отработка понятийный аппарат, символику по данной теме;
  • Вырабатывать умение творчески и логически мыслить;
  • Расширить кругозор студентов.

Оборудование: Мультимедийный проектор, компьютер, компьютерная презентация.

План урока (90 минут):

  1. Орг. момент. (10 мин)
  2. Проверка домашнего задания. (20 мин)
  3. Теоретическая часть. (10 мин)
  4. Постановка задачи для практической работы. (5 мин)
  5. Выполнение практической работы. (30 мин)
  6. Закрепление знаний. (5 мин)
  7. Домашнее задание. (5 мин)
  8. Подведение итогов урока. (5 мин)

Ход урока

I. Организационный момент.

Приветствие, проверка присутствующих. Объяснение хода урока.

II. Проверка домашнего задания.

Проводится в виде защиты студентами доклада на тему сканирования.

Студенты на предыдущем занятии делятся на три группы. Каждая группа получила домашнее задание подготовить реферат на определенную тему. Проводится защита реферата одним из членов команды.

III. Теоретическая часть.

Преобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical Character Recognition – OCR).

Возможно, самая известная программа для распознавания текстов – это FineReader от компании ABBYY. Именно эту программу чаще всего вспоминают, когда речь заходит о системах распознавания.

FineReader – омнифонтовая система оптического распознавания текстов. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати, что достигается благодаря применению технологии "целостного целенаправленного адаптивного распознавания".

FineReader имеет массы дополнительных функций, которые простому пользователю, возможно, и без надобности, но зато производят впечатление на определенные группы покупателей. Так, одним из козырей FineReader является поддержка неимоверного количества языков распознавания – 176, в числе которых вы найдете экзотические и древние языки, и даже популярные языки программирования.

Но далеко не все возможности включены в самую простую модификацию программы, которую вы можете получить бесплатно вместе со сканером. Пакетное сканирование, грамотная обработка таблиц и изображений – для всего этого стоит приобрести профессиональную версию программы.

Все версии FineReader, от самой простой до самой мощной, объединяет удобный интерфейс. Для запуска процесса распознавания вам достаточно просто положить документ в сканер и нажать единственную кнопку (мастер Scan & Read) на панели инструментов программы. Все дальнейшие операции – сканирование, разбивку изображения на “блоки” и, наконец, собственно распознавание программа выполнит автоматически. Пользователю останется только установить нужные параметры сканирования.

FineReader работает со сканерами через TWAIN-интерфейс. Это единый международный стандарт, введенный в 1992 году для унификации взаимодействия устройств для ввода изображений в компьютер (например, сканера) с внешними приложениями.

Качество распознавания во многом зависит от того, насколько хорошее изображение получено при сканировании. Качество изображения регулируется установкой основных параметров сканирования: типа изображения, разрешения и яркости.

Сканирование в сером является оптимальным режимом для системы распознавания. В случае сканирования в сером режиме осуществляется автоматический подбор яркости. Если Вы хотите, чтобы содержащиеся в документе цветные элементы (картинки, цвет букв и фона) были переданы в электронный документ с сохранением цвета, необходимо выбрать цветной тип изображения. В других случаях используйте серый тип изображения.

Оптимальным разрешением для обычных текстов является – 300 dpi и 400–600 dpi для текстов, набранных мелким шрифтом (9 и менее пунктов).

После завершения распознавания страницы FineReader предложит пользователю выбор: сканировать и распознавать дальше (для многостраничного документа) или сохранить полученный текст в одном из множества популярных форматов – от документов Microsoft Office до HTML или PDF. Можно, впрочем, сразу же перебросить документ в Word или Excel, и уже там исправить все огрехи распознавания (без ни обойтись просто невозможно). При этом FineReader полностью сохраняет все особенности форматирования документа и его графическое оформление.

IV. Постановка задачи для практической работы.

Теперь потренируемся работать с программой ABBYY FineReader.

Демонстрация презентации.

Прежде чем начать сканирование необходимо настроить программу (процесс настройки программы подробно изложен в презентации)

Блоки – это заключенные в рамку участки изображения. Блоки выделяют для того, чтобы указать системе, какие участки, отсканированной страницы, надо распознавать и в каком порядке. Также по ним воспроизводится исходное оформление страницы. Блоки разных типов имеют различные цвета рамок.


Рис. 1. Блоки (текст и картинка)

Текст – блок используется для обозначения текста. Он должен содержать только одноколоночный текст. Если внутри текста содержатся картинки, выделите их в отдельные блоки.

Таблица – этот блок используется для обозначения таблиц или текста, имеющего табличную структуру. При распознавании программа разбивает данный блок на строки и столбцы и формирует табличную структуру. В выходном тексте данный блок передается таблицей.

Картинка – этот блок используется для обозначения картинок. Он может содержать картинку или любую другую часть текста, которую Вы хотите передать в распознанный текст в качестве картинки.

Результаты распознавания можно сохранить в файл, передать во внешнее приложение, не сохраняя на диск или скопировать в буфер обмена.

Прежде чем распознанный текст передавать в MS Word необходимо произвести проверку распознанного текста.


Рис. 2. Процесс проверки распознанного текста

Распознанный текст можно отправить в Microsoft Word. Для этого щелкните кнопку Передать в MS Word. Запуститься программа Microsoft Word и откроется распознанный текст, который вы можете редактировать и форматировать, сохранить в файл.


Рис. 3. Передача распознанного текста в MS Word

V. Выполнение практической работы

Учащиеся выполняют задание.

VI. Закрепление знаний

Компьютерное тестирование.

VII. Домашнее задание.

Подготовка материалов для сканирования. Реферат по другому предмету.

VII. Подведение итогов урока

Подведение итога урока. Выставление оценок.

На уроке мы познакомились с программами OCR, научились распознавать отсканированное изображение с помощью программы ABBYY FineReader 5.0.

Литература.

  1. Е.В. Михеева. – Учебник “Информационные технологии в профессиональной деятельности” – М.: Издательский центр “Академия”, 2004.
  2. Е.В. Михеева. – Учебник “Практикум по информационным технологиям в профессиональной деятельности” – М.: Издательский центр “Академия”, 2004.

Приложение 1. Приложение содержит в себе “Карту занятия”.