Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
shpory.docx
Скачиваний:
21
Добавлен:
08.06.2015
Размер:
155.78 Кб
Скачать

Вопрос 19.

Методы автоматического реферирования:

  1. Статистический: в данном методе ключевое слово – это знаменательное слово текста, котороес учётом синонимов встретилось в тексте наибольшее число раз.

    1. Задача: по формуле где F – число повторений слова в тексте, m – число абзацев, где есть это слово, N – количество слов в тексте, n – количество абзацев в тексте составить алгоритм, позволяющий получить:

  • аннотацию текста в виде слов-реляторов со следующими за ними ключевыми словосочетаниями текста – ключевыми существительными со стоящими перед ними определениями, выраженными прилагательными или причастиями;

  • словесный реферат текста в виде последовательной цепочки ключевых предложений – предложений, содержащих три и более ключевых слова.

  • Словоупотребление – цепочка символов, заключённых между двумя пробелами.

  • Словоформа – словоупотребление вне текста. Несколько словоформ, имеющих одно и то же лексическое значение, образуют слово.

  • Алгоритм решения задачи:

    • ПК по каждому абзацу составляет алфавитно-частотный словарь словоформ;

    • Все словари объединяются в единый распределительный алфавитно-частотный словарь всего текста;

    • Система «чистит» словарь, сжимая его до словаря потенциальных ключевых слов:

    1. Удаляется служебная и общепринятая лексика;

    2. Объединяются грамматические формы одного и того же слова;

    3. Объединяются синонимы;

    4. Удаляются слова, встреченные только в одном абзаце;

  • Словарь потенциальных опорных слов делится (с помощью Кважн)на

    1. Словарь главных опорных слов;

    2. Словарь второстепенных опорных слов;

  • Строится аннотация, составленная из слов-реляторов со следующими за ними ключевыми словосочетаниями, состоящими из главного опорного слова и определения.

    Вопрос 20.

    Системы машинного перевода

    Перевод – вид человеческой языковой деятельности, в результате которой текст на одном языке ставится в соответствие тексту на другом языке при обеспечении их смысловыми эквивалентами.

    Типы перевода по степени автоматизации:

    1. Ручной

    2. Автоматизированный

      1. Перевод, выполняемый ПК с помощью человека (ПК обращается за справками к человеку);

      2. Перевод, выполняемый человеком с помощью ПК:

    • В памяти ПК двуязычный словарь и текстовый редактор;

    • Системы ТМ ( TranslationMemory) – в их основе лежит принцип сбора и хранения фрагментов переведённых человеком текстов на 2 языках, они хранятся в специальном накопителе перевода и служат бесценным подспорьем при последующем выполнении переводов той же тематики.

  • Машинный (автоматический) – выполняемое ПК действие по преобразованию текста на одном языке в текст на другом языке при сохранении эквивалентности).

    • Традиционный (выполненный человеком)

    • Статистический (машинный)

    Первые теоретические разработки по машинному переводу относятся к 30-40-м, но практическое применение идея машинного перевода нашла в 50-е. Первый машинный перевод был выполнен в Джорджстаунском университете в 1954. В Москве первый машинный перевод был выполнен в 1955. Так как большинство слов имеют несколько значений, то основная трудность заключается именно в выборе нужного варианта, для чего человек использует контекст, жизненный опыт, который фактически невозможно формализовать и загрузить в ПК, => идеального машинного перевода быть не может и человек постоянно участвует в редактировании текста.

  • Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]