= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =
Загрузить здесь: >>>>>> Скачать ТУТ!
= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =
С помощью сканера достаточно просто получить изображение страницы текста в графическом файле. Однако работать с таким текстом невозможно: Текст можно будет читать и распечатывать, но нельзя его редактировать и форматировать. Для получения документа в формате текстового файла необходимо провести распознавание текста , то есть преобразовать элементы графического изображения в последовательности текстовых символов. Преобразованием графического изображения в текст занимаются специальные программы распознавания текста Optical Character Recognition - OCR. Современная OCR должна уметь распознавать тексты , набранные не только определенными шрифтами именно так работали OCR первого поколения , но и самыми экзотическими, вплоть до рукописных, распознавать не только четко набранные тексты, но и такие, качество которых, мягко говоря, далеко от идеала. Например, текст с пожелтевшей газетной вырезки или третьей машинописной копии. Само собой, распознать текст — это еще полдела. Не менее важно обеспечить возможность сохранения результата в файле популярного текстового формата — скажем, формата Microsoft Word. Сначала необходимо распознать структуру размещения текста на странице: Далее выделенные текстовые фрагменты графического изображения страницы необходимо преобразовать в текст. Если исходный документ имеет типографское качество достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений , то задача распознавания решается методом сравнения с растровым шаблоном. Сначала растровое изображение страницы разделяется на изображения отдельных символов. Затем каждый из них последовательно накладывается на шаблоны символов, имеющихся в памяти системы, и выбирается шаблон с наименьшим количеством отличных от входного изображения точек. При распознавании документов с низким качеством печати машинописный текст, факс и так далее используется метод распознавания символов по наличию в них определенных структурных элементов отрезков, колец, дуг и др. Любой символ можно описать через набор значений параметров, определяющих взаимное расположение его элементов. Различие между данными буквами — в величине углов, которые образует третий отрезок с двумя другими. При распознавании структурным методом в искаженном символьном изображении выделяются характерные детали и сравниваются со структурными шаблонами символов. В результате выбирается тот символ, для которого совокупность всех структурных элементов и их расположение больше всего соответствует распознаваемому символу. Наиболее распространенные системы оптического распознавания символов, например, ABBYY FineReader и CuneiForm от Cognitive, используют как растровый, так и структурный методы распознавания. Качество распознавания во многом зависит от того, насколько хорошее изображение получено при сканировании. Качество изображения регулируется установкой основных параметров сканирования: Сканирование в сером является оптимальным режимом для системы распознавания. В случае сканирования в сером режиме осуществляется автоматический подбор яркости. Если Вы хотите, чтобы содержащиеся в документе цветные элементы картинки, цвет букв и фона были переданы в электронный документ с сохранением цвета, необходимо выбрать цветной тип изображения. В других случаях используйте серый тип изображения. Оптимальным разрешением для обычных текстов является - dpi и dpi для текстов, набранных мелким шрифтом 9 и менее пунктов. При заполнении налоговых деклараций , при проведении переписей населения и так далее используются различного вида бланки с полями. Рукопечатные тексты данные вводятся в поля печатными буквами от руки распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных. Сложность состоит в том, что необходимо распознавать написанные от руки символы, довольно сильно различающиеся у разных людей. Кроме того, система должна определить, к какому полю относится распознаваемый текст. Системы распознавания рукописного текста. С появлением первого карманного компьютера Newton фирмы Apple в году начали создаваться системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ. Происходящая в настоящее время глобализация нашего мира приводит к необходимости обмена документами между людьми и организациями, находящимися в разных странах мира и говорящими на различных языках. Перевод многостраничной документации вручную требует длительного времени и высокой оплаты труда переводчиков. Перевод полученного по электронной почте письма или просматриваемой в браузере Web-страницы необходимо осуществить немедленно, и нет возможности и времени пригласить переводчика. Системы машинного перевода позволяют решить эти проблемы. Программа-переводчик сначала анализирует текст на одном языке, а затем конструирует этот текст на другом языке. Современные системы машинного перевода позволяют достаточно качественно переводить техническую документацию, деловую переписку и другие специализированные тексты. Однако они неприменимы для перевода художественных произведений , так как не способны адекватно переводить метафоры, аллегории и другие элементы художественного творчества человека. По материалам, опубликованном на сайте http: Автоматизированный перевод текста Происходящая в настоящее время глобализация нашего мира приводит к необходимости обмена документами между людьми и организациями, находящимися в разных странах мира и говорящими на различных языках. Подписаться на рассылку Pandia. Интересные новости Важные темы Обзоры сервисов Pandia. Основные порталы, построенные редакторами. Бизнес и финансы Бизнес: Каталог авторов частные аккаунты. Все права защищены Мнение редакции может не совпадать с мнениями авторов. Минимальная ширина экрана монитора для комфортного просмотра сайта: Мы признательны за найденные неточности в материалах, опечатки, некорректное отображение элементов на странице - отправляйте на support pandia. О проекте Справка О проекте Сообщить о нарушении Форма обратной связи. Авторам Открыть сайт Войти Пожаловаться. Архивы Все категории Архивные категории Все статьи Фотоархивы. Лента обновлений Педагогические программы. Правила пользования Сайтом Правила публикации материалов Политика конфиденциальности и обработки персональных данных При перепечатке материалов ссылка на pandia.
Сколько стоит радиоохрана для дачи
Расписание пригородных поездов чита карымская
Когда опубликуют спискив детский сад