- •Лекція___ тема: ocr-системи. Призначення, види та використання Что такое ocr-системы
- •Процесс ввода документа в компьютер можно подразделить на два этапа:
- •Форматы, в которых FineReader сохраняет распознанный текст FineReader сохраняет результаты распознавания в следующих форматах:
- •Поддерживаемые графические форматы FineReader открывает файлы следующих форматов:
- •FineReader сохраняет изображения в следующих форматах:
- •Поддерживаемые языки распознавания
- •Основные языки
- •Дополнительные языки
- •Искусственные языки
- •Языки программирования
- •Языки со специализированными словарями
- •Сканирование
- •Преимущества одного режима перед другим
- •Чтобы запустить сканирование:
- •Установка параметров сканирования
- •Основными параметрами сканирования являются:
- •Чтобы установить параметры сканирования:
- •Сканирование многостраничных документов
- •При использовании автоподатчика (adf)
- •Без использования автоподатчика (adf)
- •Общая информация по распознаванию
- •Вы можете:
- •Чтобы запустить распознавание:
- •Распознавание в фоновом режиме
- •Проверка распознанного текста
- •Чтобы проверить результаты распознавания:
- •Перемещение по неуверенно распознанным словам
Поддерживаемые графические форматы FineReader открывает файлы следующих форматов:
PDF:Файлы в формате PDF, версии 1.4 или ранней
BMP: 2-битный - черно-белый 4- и 8-битный - Palette 16-битный 24-битный - Palette и TrueColor 32-битный
PCX, DCX: 2-битный - черно-белый 4- и 8-битный - Palette 24-битный - TrueColor JPEG: серый и цветной
JPEG 2000: серый и цветной TIFF: черно-белый - несжатый, CCITT3, CCITT3FAX, CCITT4, Packbits, ZIP серые - несжатый, Packbits, JPEG, ZIP TrueColor - несжатый, JPEG, ZIP Palette - несжатый, Packbits, ZIP многостраничный TIFF
PNG: черно-белый, серый, цветной
FineReader сохраняет изображения в следующих форматах:
BMP: черно-белый, серый, цветной
PCX: черно-белый, серый
JPEG: серый, цветнойJPEG 2000: серый и цветной TIFF: черно-белый - несжатые, CCITT3, CCITT4, packbits, ZIP серые - несжатый, packbits, JPEG, ZIP цветные - несжатый, JPEG, ZIP
PNG: черно-белый, серый, цветной
Поддерживаемые языки распознавания
ABBYY FineReader 7.0 поддерживает 177 языков распознавания.
Кликнув на названии языка в приведенном ниже списке, Вы можете получить справку по данному языку. Данные о числе носителей языка приведены на 2002 год.
Основные языки
Основная группа образована из языков со словарной поддержкой. Для этих языков в программе FineReader поддержана проверка распознанного текста (нахождение неуверенно распознанных слов и слов с орфографическими ошибками).
английский
Один из германских языков. Основной язык международного общения. Один из языков ООН. Официальный язык США, Канады, Великобритании, Ирландии, Австралии, Новой Зеландии, 15 государств Африки: ЮАР, Нигерии, Ганы, Уганды, Кении, Танзании и др., Индии (временно). Носителей более 508 млн. чел.
армянский (восточный, западный, грабар)
Относится к индоевропейской семье языков. Официальный язык Армении. Распространен также в Азербайджане, Грузии, России. Старый литературный язык – грабар в настоящее время используется только как язык культа. У современного литературного языка два варианта – восточный (ереванский), используемый в Армении и западный, используемый на Ближнем Востоке и в Западной Европе. Носителей около 7 млн. чел.
болгарский
Один из южнославянских языков. Официальный язык Болгарии. Количество носителей – немногим более 9 млн. чел.
венгерский
Один из угорских (уральских) языков. Официальный язык Венгрии. Распространен также в граничащих с ней районах Югославии, Австрии, Словакии, Румынии, Украины. Носителей около 14.5 млн. чел.
греческий
Занимает изолированное положение внутри индоевропейской семьи языков. Официальный язык Греции и Кипра. Носителей около 12 млн. чел.
датский
Один из германских (скандинавских) языков. Официальный язык Дании. Носителей около 5.5 млн. Распространен также на Фарерских островах, Гренландии.
испанский
Один из романских языков. Официальный язык Испании, всех стран Латинской Америки (кроме Бразилии) и Экваториальной Гвинеи. Один из языков ООН. Носителей около 325 млн. чел.
итальянский
Один из романских языков. Официальный язык Италии. Носителей около 70 млн. чел.
каталанский
Относится к иберо-романской подгруппе романских языков. Носители- около 8 млн. чел. в Испании (Каталония, Валенсия, Балеарские острова), Франции (Русильон, Восточные Пиренеи), Андорре и на острове Сардиния. Один из официальных языков вышеперечисленных областей Испании и Андорры.
латышский
Относится к балтийским языкам. Официальный язык Латвии. Носителей около 2 млн. чел.
литовский
Относится к балтийским языкам. Официальный язык Литвы. Носителей около 4 млн. чел.
немецкий (старая и новая орфография)
Один из германских языков. Официальный язык Германии, Австрии, Швейцарии, Люксембурга, Бельгии. Носителей около 128 млн. чел.
нидерландский (Нидерланды и Бельгия)
Один из германских языков. Официальный язык Нидерландов и Бельгии. Носителей около 20 млн. чел.
норвежский (нюнорск и букмол)
Относится к скандинавским (германским) языкам. Официальный язык Норвегии. Распространены 2 формы литературного языка: нюнорск и букмол, более близкий датскому. Носителей около 5 млн. чел.
польский
Один из западнославянских языков. Официальный язык Польши. Носителей около 44 млн. чел.
португальский (Португалия и Бразилия)
Один из романских языков. Официальный язык Португалии, Бразилии, Анголы, Мозамбика, Гвинеи-Бисау, Кабо-Верде, Сан-Томе и Принсипи. Носителей около 191 млн. чел.
румынский
Один из романских языков. Официальный язык Румынии. Носителей около 26 млн. чел.
русский
Относится к индоевропейским (славянским) языкам. Официальный язык Российской Федерации. Распространен также во всех государствах СНГ и Балтии. Носителей около 277 млн. чел.
словацкий
Один из западнославянских языков. Официальный язык Словакии. Распространен в граничащих с ней районах Венгрии, Румынии и Украины. Носителей около 5.6 млн. чел.
татарский
Относится к тюркским языкам. Распространен в России (Татарстан, Башкирия, Чувашия, Мари Эл и др. регионы). Носителей около 7 млн. чел.
турецкий
Относится к тюркским языкам. Официальный язык Турции и Кипра. Распространен также в Греции, Болгарии, Румынии, Иране и Ираке. Носителей около 61 млн. чел.
украинский
Один из восточнославянских языков. Официальный язык Украины. Распространен также в России и Белоруссии. Носителей около 47 млн.
финский
Один из финно-угорских (прибалтийско-финских) языков. Официальный язык Финляндии. Также распространен в России (Карелия, Ленинградская область), Швеции. Носителей около 6 млн. чел.
французский
Один из романских языков. Один из языков ООН. Официальный язык Франции, Бельгии, Швейцарии, Люксембурга, Монако, Андорры, Канады, Гаити, государств в Африке: Бенин, Кот д’Ивуар, Буркина-Фасо, Габон, Гвинея, Заир, Конго, Мали, Нигер, Сенегал, Того, Чад, Бурунди, Руанда, ЦАР, Мадагаскар, Камерун, Сейшельские острова, Коморские острова, Джибути, Вануату (Океания). Носителей более 128 млн. чел.
хорватский
Один из южнославянских языков. До образования независимой Хорватии обычно рассматривался как сербскохорватский – единый литературный язык для сербов и хорватов, отличавшийся лишь графикой. Официальный язык Хорватии. Носителей около 5 млн.
чешский
Один из западнославянских языков. Официальный язык Чехии. Распространен также в Словакии. Носителей около 12 млн.
шведский
Один из скандинавских (германских) языков. Официальный язык Швеции и Финляндии. Носителей около 10 млн. чел.
эстонский
Один из финно-угорских (прибалтийско-финских) языков. Официальный язык Эстонии. Носителей около 1.1 млн. чел.