
- •1. Определение понятий "информационные технологии" и "информационные и телекоммуникационные технологии". Причины, вызвавшие появление ит
- •2. Цель создания и основные черты ит
- •3. Перспективные информационные технологии в лингвистике
- •4. Основные конструктивные блоки пк
- •5. Основные функциональные узлы пк
- •2) Внешняя память (нжмд, нгмд)
- •3) Факс(модем)
- •6. Определение понятия "мультимедиа". Характеристики мультимедийного пк
- •7. Понятие о виртуальной реальности
- •8. Основные классификации пк
- •1. Компьютеры ibm и совместимые с ibm
- •2. Компьютеры Apple марки Macintosh
- •3. Суперкомпьютеры (рабочие станции0
- •По функциям
- •По размеру и весу: настольные, напольные, портативные, карманные (наладонные), компьютеры-блокноты.
- •9. Определение понятия "компьютерная сеть". Типы сетей
- •Типы локальных вс
- •Компоненты
- •10. Средства электронной связи
- •11. Представление информации в базе данных
- •12. Модели представления данных
- •13. Действия над данными в базе данных. Режимы выдачи информации из базы данных.
- •14. Типы информационных систем, в которых используются базы данных (бд). Автоматизированные банки данных (абд).
- •15. Базовые информационные технологии лингвистических научных исследований.
- •16. Лингвистические информационные ресурсы (лир): история становления и современное состояние лир.
- •История
- •17. Основные составляющие лингвистических ресурсов. Нац. Лир.
- •18. Определение и основные функции электронной почты
- •- Загрузка корреспонденции в фоновом режиме и чтение ее по мере поступления (Eudora Pro).
- •19. Основные понятия, используемые при работе в сети Internet. Возможности глобальной сети Internet.
- •20. Основные информационные услуги и ресурсы сети Интернет
- •21. Поиск информации и навигация в Интернет
- •А) поисковые каталоги (пк)
- •В) Гибридные системы
- •Г) Метапоисковые системы (поисковые службы)
- •Порталы
- •Выбор поисковой службы
- •Основные поисковые системы
- •22 Структура программного обеспечения пк
- •Системное по
- •Г) Прогр-драйверы – для управления устройствами к (ввода-вывода)
- •Прикладные инструментальные средства
- •23. Компьютерная лингвистика как наука о принципах и способах моделирования ея на пк. Основные приложения кл.
- •24. Методы автоматич аннотирования и реферирования текста
- •2) Позиционные
- •25. Автоматическое индексирование текста
- •Дескрипторный/ индикаторный
- •26. Краткая история развития маш. Перевода. Основные стратегии мп.
- •3 Этапа мп
- •27. Структура системы мп
- •3. Подсистема синтаксического синтеза переводного языка
- •28. Назначение и функции арМа переводчика. Перевод текстов с пом автоматического терминологического банка данных
- •29. Определение понятия “система ии”. Основные типы систем ии
- •4 Типа систем ии:
- •30. Экспертные системы: определение и основные понятия
- •4 Типа систем иск интеллекта:
- •31. Общие понятия и порядок построения автоматизированной обучающей системы
- •Порядок построения аос
- •32. Новые информац технологии в обучении языкам
- •34. Распознавание и синтез речи с пом компа
- •Синтез речи
32. Новые информац технологии в обучении языкам
- обучающие прогр, поддерживающие на опред этапах
- мультимедийные прогр (Логика)
- использ прикладных прог, созданных с другими целями, для обучения языку
- средства телекоммуникаций: дистанционное обучение
- Дистанционное обучение – новая форма организации учебного процесса, соединяющая в себе традиционные и новые информационные технологии обучения, основывающаяся на принципе самостоятельного получения знаний, предполагающая, в основном, телекоммуникац. принцип доставки обучаемому основного учебного материала и интерактивное взаимодействие обучаемых и преподавателей в процессе обучения и при оценке полученных знаний и навыков.
3 модели дистанц обучения:
1. Интерактивное телевизионное обучение (урок по телевизионным кабелям передается в др город.., проверка знаний – при личном контакте)
2. ДО с использованием носителей учеб инфы на компакт-дисках (консультации с препом по интернесу, проверка – личн контакты)
3. ДО с широким использованием телекоммуникационных сетей (передача и проверка знаний – в интерактивном режиме в интернет. Учение, а не преподавание). 2 вида взаимодействия обучаемого и обучающего центра: 1) WorldWide Web 2) в режиме видеоконференций
Основные ИТ в лингвистике:
-
автоматическое создание корпусов текстов поэтов, писателей (для исследований)
-
автоматическое определение авторства неизвестного текста
-
автоматическое определение значения многозначного слова (по контексту)
-
создание автоматических словарей
-
разработка автоматического синтаксического анализ предложения
-
автоматическое индексирование, аннотирование и реферирование текста
-
перевод текста
-
понимания текста (системы распознавания и синтеза речи)
-
автоматическое порождение нового текста
-
автоматическое чтение текста (системы сканир-я и распознавания текста)
Корпус текстов – совокупность текстов, считающаяся достаточной и представительноя для данного языка (диалекта либо любого иного подмножества языка), предназнач для разных типов лингвистического анализа.
Индексирование- (1) определение темы текста или (2) процесс выбора ключе слов (=дескрипторов, индикаторов) для включ в поисковый образ документа.
Автоматическое рефер/аннотир – составление Р/А с пом ПК. (Р – связный текст, кратко - центр. тема первич документа и цель, методы, рез-ты исследования. А – наикратчайшее изложение содерж первич д-та, - представление о его теме.)
Система автоматического чтения – прикладная программа, позволяющая преобразовывать текст с бумажного носителя в электронный текстовый файл, который далее можно обрабатывать с помощью систем машинного перевода, аннотирования, реферирования и других прикладных программ.
33. Возможности систем автоматического чтения текста
Система автоматического чтения текста (система оптического распознавания символов) – обычная прикладная программа, позволяющая преобразовывать текст с бумажного носителя в электронный текстовый файл, который далее можно обрабатывать с помощью систем маш перевода, аннотир-я, рефер-я и др. прикладных программ.
60-70 Патрик Уинстон, идея: 3 вида распознавания объектов окружающей действительности человеком можно перенести на искусственные системы (все иск системы строятся на основе естеств)
1) целостность (ч-к воспринимает объект целиком, а затем анализ его хар-ки)
2) целенаправленность
3) адаптивность, способность к самообучению
Трудности при сканировании:
Разные шрифты, многоязычные тексты, колонки, встроенные графич изображения
Преобладает на рынке – FineReader
Этапы распознавания:
-
сканирование (получение графического изображения)
-
анализ и распознавание полученного изображения
Распознавание строится на основе 3 классификаторов:
1) шаблонный/растровый классификатор – каждый символ сравнивается с эталоном в памяти компа, наиболее вероятный признается опознанным
2) признаковый классификатор (анализируется не все изображение, а некоторые признаки, кот вычисл по формулам)
3) структурный классификатор (содержит инфо о точечном изображение символа)
4) структурно-пятенный эталон (инфо о каждой букве хранится в виде набора пятен)
Возможности:
-
ввод печатных доков
-
распознавание шрифтов без обучения
-
распознавание текстов на 40 языках и их комбинациях (ФайнРидер)
-
самообуч и распознавание нечитабельных участков на основе читабельных
-
распознавание текстов на неизвестных языках
-
встроенный текстовый редактор
-
проверка орфографии
-
распознавание таблиц, форм, визитных карточек, конвертов…
-
распознавание разноформатных доков, если нет надписи от руки
-
распознавание доков на сложном фоне
-
работа в сети
-
распознавание в фоновом режиме