
- •3.Информац-е процессы и системы.
- •5.Моделиров. Как основной метод решения задач ит.Общие принципы решения лингвист.Задач методом модел.
- •6.Функц-е узлы пк: устр-ва ввода инф-ии в пк.
- •7.Основная внутренняя память и микропроцессор.
- •8. Функциональные узлы компьютера:устройства вывода информации из пк.
- •10.Структура программного обеспечения.Системное по.
- •13.Доступ к глобальной сети Интернет. Основные ресурсы и услуги Сети
- •17.Статистические методы
- •18) Способы перевода текста с использованием компа.
- •20:Понимание текста компом.Уровни понимания.
- •22. Автоматическое порождение письм. Текста: определение ,этапы, общая структура системы порождения
- •23)Виды комп систем автоматич. Порождения письменного текста
17.Статистические методы
3 осн метода машинного аннотирования и реферирования: статистические, позиционные, логико-семантические.
Статистические м. В свое время Лунг предложил 2 условия определения значимых предл. Для вынесения их в реферат: -предл. должны содержать частотные знаменат. слова-термины; -предл. должны содержать как можно больше терминов на небольш. расстоянии друг от друга
Основные смысловые единицы аннот. и рефер.: -ключевые. слова(термины, относящ. к основному содержанию текста и повторяющиеся несколько раз); -ключ. словосочетания(словосоч., кот. содержат 2 и более ключ. слова);-ключ. предложения(предл., кот содержат 2 и более ключ. Слова или словосоч.)
Весь процесс автоматич. Аннот. и реферирования осуществляется в следующей последовательн. 1)комп составляет алфавитно-частотные словари словоформ, абзацев 2)созд.алфавитно-частотный словарь словоформ текста путем объединения словарей,абзацев 3)из получ.словаря вычленяется словарь потенциальных опорных слов путем отбрасывания служебных слов, артиклей, предлогов 4) из получ.словаря вычленяется словарь ключ. слов путем применения коэффициента важности 5)определ.предлож.текста, кот. содержат 2 и более ключ. слова 6) в реф. включаются все ключ. предложения в порядке их следования 7)в машинную аннотацию включ. все ключ. слова в порядке их следов. после какой-л. стандартной фразы, напр. «в книге идет речь о…»
18) Способы перевода текста с использованием компа.
начало 90-х по наст.время была предложена система МП по степени автоматизации:
- интеллектуальный (ручной), выполненный ч-ком
- машинный (автоматич). Для этого вида характерно предредактирование и постредактир.
- автоматизированный
А)компом с помощью ч-ка (характерно интерредактирование)
Б) перевод ч-ком с помощью компа. 1-ые такие системы назвали АРМ-переводчик.
Примеры МП (PARS – для перевода с англ на русск. Особенности: подбор синонимов и многозначных слов. СОКРАТ: профессиональный, персональный, интернет. PROMT: для перевода)
19.Стр-ра МП. 1)Подсистема морфологич. анализа предусматривает получение наборов лексико-грамм признаков и переводов. это возможно 2 способами:1) выбор из словаря ,2)анализ компом окончаний и самостоят. определение лексико-грамм. информации; 2) подсист. синтаксич.анализа предусм. построение синтакс. структуры исходного предлож. Такая структура может строиться двояко: 1)как последовательность формальных групп, 2)как послед. слов, терминов, классов слов; 3) подсист. синтакс.синтеза решает следующие задачи: 1) определение синтакс. структуры перевода, 2)выбор лексики для переводной структуры, разработка алгоритма разрешения многозначности для многозначн. слов, 4) подсист. морфолог. синтеза предусматрив. грамматически правильное оформление перевода.
Исходный текст |
АПС – автоматический переводной словарь |
перевод |
|||
1.Подсистема морфологического анализа |
2. подсистема синтаксического анализа |
3. подсистема синтаксического синтеза |
4. подсистема морфологического синтеза |
||
Синтаксические соответствия |
Алгоритм (Wir studieren Deutsch)
Начало |
А) ввод предложения |
Б) морфологический анализ слов предложения |
С) синтаксический анализ предложения (деление предложения на формальные группы) |
Д) Синтаксический синтез предложения (поиск переводной структуры) |
Е) Морфологический синтез перевода |
Ф) печать перевода |
конец |