
- •1. Определение понятия "информационные технологии". Краткая история развития ит. Причины создания ит.
- •2. Цель создания, основные черты ит. Примеры ит в лингвистике и в обучении.
- •3. Структура ит. Информация: определения, виды. Методы получения и использования информации.
- •4. Понятие об информационных процессах и информациооных системах.
- •16. Моделирование как основной метод решения задач ит. Общие принцпы решения лингвистических задач методом моделирования.
- •5. Краткая история возникновения и развития пк. Двоичная система исчисления
- •6. Функциональные узлы пк: устройства ввода информации.
- •7. Функциональные узлы пк: устр-ва вывода инф.
- •8. Функциональные узлы пк: устр-ва хранения инф.
- •9. Функциональные узлы пк: устройства обработки информации
- •10. Классификация компьютеров по уровню специализации, по размеру и по совместимости.
- •11. Структура программного обеспечения. Системное по.
- •12. Прикладные программы. Прикладные инструментальные средства
- •13. Понятие комп. Сети. Компоненты кс. Классификация кс по территориальному признаку
- •14. Основные ресурсы и услуги сети Интернет
- •17. Назначение и возможности систем автоматического чтения текста.
- •18. Аннотация и реферат текста: основные понятия. Методы автоматического аннотирования и реферирования текста: позиционный, логико-семантический метод.
- •19. Методы автоматического аннотирования и реферирования текста: статистический метод.
- •20. Способы перевода текста с использованием компьютера.
- •21. Структура системы мп и назначение её основных блоков
- •22. Определение понятия "понимание текста компьютером". Уровни автоматического понимания письменного текста.
- •23. Типы автоматического поинмания текста
- •24. Автоматическое порождение письменного текста: определение, этапы, виды компьютерных систем
- •25. Общая структура системы породления письменного текста
- •26. Автоматическое распознавание устной речи
- •27. Синтез устной речи с помощью компьютера
- •28. Базы данных: определение, модели. Субд: определение, основные функции.
- •29. Лингвистические информационные ресурсы: определение, основные составляющие, письменный лексикон
- •30. Лингвистические информационные ресурсы: определение, основные составляющие: письменные текстовые массивы, фонетические ресурсы
- •15. Возможности современного компьютера. Перспективы развития ит
21. Структура системы мп и назначение её основных блоков
СМП явл. моделями, к. воспроизв. на ПК речевое поведение человека, переводящего текст с одного языка на другой.
Текст ИЯ
ПК: двуязычный словарь <- подсистема морф. анализа ИЯ
<- подс-ма синт. анализа ИЯ
<- подсистема синт. синтеза ПЯ <--> синтаксич. соответствия
<- подсистема морф. синтеза ПЯ
текст ПЯ
В процессе морф. анализа слов ИЯ кажд. слово получ. наборы лексико-грам. признаков, к. с-ма формир. из двуязычного автоматич. словаря.
Синт. анализ предлож. ИЯ свод. к поиску осн. членов предложения
Синт. синтез предлож. перев. языки закл.:
1) в создании предложения ПЯ опред. синт. структуры, к. с-ма выбирает из блока "синт. соответствие"
2) замена слов ИЯ на их перев. эквивалента из двуязычного словаря
Морф. синтез кажд. слова, предложения ПЯ сводит к постановке слова в нужную форму. В словаре содерж. сведения о признаках каждого слова
Успех и эффективность СМП во многом зависит от автомат. словаря и прав. выбора структуры предложения ПЯ
Автоматич. словарь исп. ПК, поэтому инф-я в нём закодирована
При создании автомат. словаря реш. след. задачи:
Задача 1. выбор типа лекс. единицы словаря (исп.:
а) в виде словоформ, когда в словарь заносятся все возможные формы каждого слова и подаются гнёздами;
б) в виде квазиосновы: блок # ..., числа, стоящие после #, условно обозначают те наборы суффиксов и окончаний, к. необходимо присоедин. к основе, чтобы получить соответств. формы слов, эти числа назыв. типами формообразования)
Выбор типа лексической единицы зависит от:
1) для рус., бел., нем., лат. целесообразно исп. квазиоснову;
2) для языков аналит. типа - словоформу
2. от объёма словаря и вычислит. ресурсов ПК
3. от типа СМП (для информат. - квзиоснова, для профессион. - словоформа)
Задача 2: отбор перевод. эквивалентов для выход. словаря.
Задача 3: создание маш. словар. статьи для лекс. статьи - лекс. единица вместе с набором значений и её всевозможн. признаков.
В словап. статье выд. 4 зоны:
1) зона морфолог. сведений
2) зона семантич. сведений:
а) принадлежность к определ. семант. подклассу
б) переводн. эквивалент
3) зона синтаксич. сведений (управл-е глагола/предлога)
4) зона лексич. сведений:
а) стилист. исп-е лексич. единицы (термин, принадлееж. к языку, или общеупотр. л.)
б) исп-е лексич. единицы как части фразеологизма
Для выбора структуры предл. ПЯ первоначально исп. прямой перевод (структура 1:1). Затем исп. язык-трансформер (внутр. язык). В последнее время стали внедр. статистич. подход, который позволил машин. переводчиком обуч. и выб. прав. структура предложений ПЯ, для чего исп. огром. базы параллельных корпусов текстов, наход. на ПК, ранее переведённых людьми.
Параллель между программными продуктами MT Prompt и TM (Trados)
МТ-программы опир. на готов. словари и готовы к работе в момент покупки. Но чтобы их исп. профессионально необходимо затратить много времени по настройке с-мы перевода для кажд. тематики. Исп-е МТ-программ даёт выйгрыш только при переводе огромн. массивов однотип. текстов.
ТМ (Trados) - базой служит накопитель, к. в момент покупки пуст. Нов. накопитель создаётся переводчиком для кажд. ематики текстов. В осн. перевода ложатся конструкции, выбранные человеком.
Для крупн. проектов, где речь идёт об оперативном переводе сотен страниц однородной документации, передставл. перспективным сочетание программ МТ и ТМ
Популярн. СМП: SYSRAN, Prompt, Сократ
плюсы исп-я СМП:
1) скорость
2) удобно при редактировании и форматировании перевода
3) имеют удобн. возможности для перевода эквивалентов (online словари)
4) ускоряют перевод. освободив. от необходимости перевода того, что было переведено ранее
5) значительно дешевле
6) можно доверить перевод конфеденциальной информации
7) упрощённый просмотр страниц в Интернете