Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
SIT.doc
Скачиваний:
47
Добавлен:
27.10.2018
Размер:
275.97 Кб
Скачать

32. Новые информац технологии в обучении языкам

- обучающие прогр, поддерживающие на опред этапах

- мультимедийные прогр (Логика)

- использ прикладных прог, созданных с другими целями, для обучения языку

- средства телекоммуникаций: дистанционное обучение

- Дистанционное обучение – новая форма организации учебного процесса, соединяющая в себе традиционные и новые информационные технологии обучения, основывающаяся на принципе самостоятельного получения знаний, предполагающая, в основном, телекоммуникац. принцип доставки обучаемому основного учебного материала и интерактивное взаимодействие обучаемых и преподавателей в процессе обучения и при оценке полученных знаний и навыков.

3 модели дистанц обучения:

1. Интерактивное телевизионное обучение (урок по телевизионным кабелям передается в др город.., проверка знаний – при личном контакте)

2. ДО с использованием носителей учеб инфы на компакт-дисках (консультации с препом по интернесу, проверка – личн контакты)

3. ДО с широким использованием телекоммуникационных сетей (передача и проверка знаний – в интерактивном режиме в интернет. Учение, а не преподавание). 2 вида взаимодействия обучаемого и обучающего центра: 1) WorldWide Web 2) в режиме видеоконференций

Основные ИТ в лингвистике:

  1. автоматическое создание корпусов текстов поэтов, писателей (для исследований)

  2. автоматическое определение авторства неизвестного текста

  3. автоматическое определение значения многозначного слова (по контексту)

  4. создание автоматических словарей

  5. разработка автоматического синтаксического анализ предложения

  6. автоматическое индексирование, аннотирование и реферирование текста

  7. перевод текста

  8. понимания текста (системы распознавания и синтеза речи)

  9. автоматическое порождение нового текста

  10. автоматическое чтение текста (системы сканир-я и распознавания текста)

Корпус текстов – совокупность текстов, считающаяся достаточной и представительноя для данного языка (диалекта либо любого иного подмножества языка), предназнач для разных типов лингвистического анализа.

Индексирование- (1) определение темы текста или (2) процесс выбора ключе слов (=дескрипторов, индикаторов) для включ в поисковый образ документа.

Автоматическое рефер/аннотир – составление Р/А с пом ПК. (Р – связный текст, кратко - центр. тема первич документа и цель, методы, рез-ты исследования. А – наикратчайшее изложение содерж первич д-та, - представление о его теме.)

Система автоматического чтения – прикладная программа, позволяющая преобразовывать текст с бумажного носителя в электронный текстовый файл, который далее можно обрабатывать с помощью систем машинного перевода, аннотирования, реферирования и других прикладных программ.

33. Возможности систем автоматического чтения текста

Система автоматического чтения текста (система оптического распознавания символов) – обычная прикладная программа, позволяющая преобразовывать текст с бумажного носителя в электронный текстовый файл, который далее можно обрабатывать с помощью систем маш перевода, аннотир-я, рефер-я и др. прикладных программ.

60-70 Патрик Уинстон, идея: 3 вида распознавания объектов окружающей действительности человеком можно перенести на искусственные системы (все иск системы строятся на основе естеств)

1) целостность (ч-к воспринимает объект целиком, а затем анализ его хар-ки)

2) целенаправленность

3) адаптивность, способность к самообучению

Трудности при сканировании:

Разные шрифты, многоязычные тексты, колонки, встроенные графич изображения

Преобладает на рынке – FineReader

Этапы распознавания:

  1. сканирование (получение графического изображения)

  2. анализ и распознавание полученного изображения

Распознавание строится на основе 3 классификаторов:

1) шаблонный/растровый классификатор – каждый символ сравнивается с эталоном в памяти компа, наиболее вероятный признается опознанным

2) признаковый классификатор (анализируется не все изображение, а некоторые признаки, кот вычисл по формулам)

3) структурный классификатор (содержит инфо о точечном изображение символа)

4) структурно-пятенный эталон (инфо о каждой букве хранится в виде набора пятен)

Возможности:

  1. ввод печатных доков

  2. распознавание шрифтов без обучения

  3. распознавание текстов на 40 языках и их комбинациях (ФайнРидер)

  4. самообуч и распознавание нечитабельных участков на основе читабельных

  5. распознавание текстов на неизвестных языках

  6. встроенный текстовый редактор

  7. проверка орфографии

  8. распознавание таблиц, форм, визитных карточек, конвертов…

  9. распознавание разноформатных доков, если нет надписи от руки

  10. распознавание доков на сложном фоне

  11. работа в сети

  12. распознавание в фоновом режиме

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]