Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ОИТ шпоры.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
102.42 Кб
Скачать

18. Аннот/реф:осн.Понят. М-ды автоаннот/реферирован.

Реферат – связ.текст,кратко выраж.не т.центр.тему или предм к-л док-та,но и цель,исп-мые м-ды,рез-ты опис.иссл/разраб

Аннотация – кр.излож.сод-ия док-та,дающ.общ.предст о теме

Реф/аннот - вторич.док-ты чаще созд. к науч.книгам, статьям.

Автореф(аннотир)txt-составл.реф/анн с пом компа.

Первый машинный реф Ч американцем Генри Лунном в 1958

Машинный реферат наз. квазирефератом.

Этапы построения реферата человеком:

1) подготовит.(опред.тематич.направ-ть txt и осмысл док-та)

2) аналитич.(деление txt на фрагм,выд.осн.смысл.ед,план)

3) постр.реф.(смысл.ед.распол.в един.вторич.txt в соотв.с плн)

В качестве смысловых единиц реферата могут быть:

1) полное без изменения ключ. предложение исход. текста

2) перефразир.ключевое предложение исходного текста

3) предл,составл.из ключ.слов/словосоч.с исп.связ.элем

4) предл, обобщ.неск.предл.исх.txt (не обязательно ключевых)

Смысловыми единицами аннотации могут быть:

1) ключ.слова,словосоч.исх.txt с предшеств.спец.словами-реляторами ("книга посвящ.след.проблемам")

2) спец. предложения исходного текста

а) содерж.оценочн.элем.(рассматриваются !важные! проблемы, статья посвящена !актуальной! теме)

б) предл,содерж.клише – спец.словесн.штампы,фиксир. внимание Ч.("недостаток заключается", "ставится задача")

Компьютер должен уметь:

1. находв тексте ключ. слова, словосочетания, предложения

2. наход. в тексте менее знач. единицы

3. составл.из текст.единиц смысл. единицы р-та, аннотации.

4. составл. из таких единиц текст р-та

М-ды:1)статистич.2)позиц.3)логико-семантические.

Позиционные методы:

Осн.критерии этих м-дов явл.место/позиц.предл.в исх.тексте. 2 метода:а)м.заглавия(осн.содерж.txtвыраж.загол,=>словарь ключ.слов на осн.знаменат.слов загол,раб на 35-40%) б)м.локализации (Идея м-да:предл.о цели,рез-тах иссл.заним. фиксир.место в txt; метод работает на 25-55%)

Методы,исп. комплексно и совместно, дают рез-т около 75%.

Логико-семантические методы:

Исслед.стр-ру и семантикуtxt.Ключ.предл с наиб.функц.весом, на велич.кот.влияют факторы(связь с лев.и прав.окруж-ем, налич.в предл.семант.значим.слов)

Кажд.из 3 м-в имеет +и— . => тенденция исп.сов-ти м-дов.

21. Стр-ра системы МП и назначение её основных блоков

СМП явл.моделями,кот.воспроизв.на ПК реч.повед.Ч, переводящего текст с одного языка на другой.

Текст ИЯ

ПК: двуяз.сл-рь <-подсист.морф.ан.ИЯ<- подсист.синт.ан.ИЯ

<- подсист.синт.синтезаПЯ <--> синтаксич.соотв.<- подсист. морф. синтеза ПЯ

текст ПЯ

В проц.морф.ан.сл.ИЯ кажд.сл.получ.наборы лексико-грам. признаков,кот.сист.формир. из двуязычн.автоматич.словаря.

Синт.ан предл. ИЯ свод.к поиску осн.членов предл.

Синт.синтез предлож. перев. языки закл.:1) в созд.предл.ПЯ опред.синт.стр-ры,кот.сист выбир.из блока "синт. соответств"

2) замена сл ИЯ на их перев. эквива из двуязычного словаря

Морф.синтез кажд.сл,предл ПЯ —постан сл в нужн форму. В сл-ре содерж.свед-я о призн.кажд.слова

Успех и эфф-тьСМПзавис.от автомат.сл-ря и выбора стр-ры предложения ПЯ

Автоматич. сл-рь исп. ПК, поэтому инф-я в нём закодирована

При создании автомат. словаря реш. след. задачи:

Задача 1.выбор типа лекс.ед сл-ря (а) в виде словоформ, в сл-ь занос-ся все возможн.формы кажд. сл.и подаются гнёздами;

б) в виде квазиосновы: блок # ..., числа, стоящ.после #,обозн. те наборы суфф и оконч, к. необход присоед. к основе, чтобы получить соответств. формы сл, эти числа—типы формообраз)

Выбор типа лексической единицы зависит от:

1) для рус,бел,нем,лат. целесообразно исп. квазиоснову;

2) для языков аналит. типа - словоформу

3) от объёма словаря и вычислит. ресурсов ПК

4) от типа СМП (для информат.-квзиосн,для профес. - словоф)

Задача 2: отбор перевод. эквивалентов для выход. словаря.

Задача 3: созд.маш.словар.статьи для лекс.статьи - лекс. ед вместе с набором значений и её всевозможн. признаков.

В словарн. статье выд. 4 зоны: 1) зона морфолог.свед 2) зона семантич. свед:(а) принадл-ть к опред.семант.подклассу б) переводн.эквивалент)3) зона синтаксич.свед.(управл-е глагола/предлога)4) зона лексич. сведений:(а) стилист. исп.лексич. ед(термин,принадлеж.к яз,или общеупотр. л.)

б) исп.лексич.ед.как части фразеологизма

Для выбора стр-ры предл.ПЯ первонач.исп.прямой пер.(стр-ра 1:1). Затем исп.яз-трансформер(внутр.язык).Сейчас стали внедр.статистич.подход,позволил машин.переводч.обуч.и выб.прав.стр-ра предл.ПЯ, для чего исп.огром.базы паралл. корпусов текстов,наход.на ПК,ранее перевед.людьми.

Параллель между прогр.прод-ми MT Prompt и TM (Trados)

МТ-проги опир.на готов.сл-ри и готовы к раб.в момент покупки.Чтобы исп.профес.необход.затратить много t по настр.сист.пер.для кажд.тематики.Исп.МТ-про даёт выигрыш при пер.огромн.однотип.текстов.

ТМ (Trados) – база — накопит, в момент покупки пуст. Нов. нак-ль созд.переводч.для кажд.тематики текстов. В осн.перев ложатся конструкции, выбранные человеком.

Для крупн.проектов, где речь идёт об оперативн.пер.100 стр. однородн.док-ции — сочетание программ МТ и ТМ

Популярн. СМП: SYSRAN, Prompt, Сократ

Плюсы исп-я СМП: 1)скорость 2) удобно при ред.и форматир. Перевода 3) удобн.возм-ти для пер.эквива.(online словари)

4) ускоряют перевод.освобожд от необх.пер.того,что было перевед.ранее 5) дешевле 6) можно доверить перевод конфеденц.инфы 7) упрощ.просмотр страниц в Интернете