Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
LEKTsIYa_9_po_osnovam_informatiki_i_prikl_lingv...doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
507.9 Кб
Скачать

2.1. Програми аналізу та лінгвістичної обробки текстів

Link Grammar Parser - це синтаксичний парсер (тобто синтаксичний аналізатор) англійської мови. Працює зі словником, що включає близько 60000 словникових форм.

Russian Morphological Dictionary - програма С.Сікорського для синтаксичного і морфологічного аналізу російськомовних текстів. Використовує морфологічний словник, що включає 120000 слів.

Mystem - компактний, швидкий і безкоштовний морфологічний парсер російськомовних текстів, реалізований на основі словника Залізняка.

Проекти Cibola/Oleada реалізують великі комп'ютерні системи лінгвістичного аналізу текстів. Компоненти системи включають засоби роботи з багатомовними текстами, побудови конкорданса для текстів більш ніж на 16 мовах, статистичного аналізу, автоматичного перекладу, різні словники і тезауруси.

Лингвоанализатор - on-line версія програми математичного аналізу структури тексту. Метою аналізу є визначення близькості будь-якого з пропонованих користувачем текстів до одного з авторських еталонів, визначених заздалегідь. Програма аналізує вхідний текст і видає імена трьох письменників, які могли б бути його найбільш імовірними авторами.

Система StarLing дозволяє працювати з мультимовними текстами великої довжини, з транскрипційними знаками. Серед переваг: зручний пошук, можливість аналізу і синтезу словоформ по словнику Залізняка, а також переведення по словнику Мюллера. Є функції для порівняно-історичних досліджень.

Морфологічний аналізатор - on-line версія програми морофлогічного аналізу слів російської/англійської мов. Дозволяє отримати для слова, що вводиться, базову форму і морфологічну інформацію. Програма реалізована на основі словників Залізняка (рос.мова) і Мюллера (англ.мова).

2.2. Програми для автоматичної обробки текстів:

АОТ (автоматична обробка тексту). Серед пропонованих продуктів представляють інтерес: модуль графематичного аналізу тексту, компоненти морфологічного аналізу для російської, німецької та англійської мов, модуль автоматичного знищення омонімії, модуль семантичного аналізу тексту, система лінгвістичного пошуку, різні тезауруси і словники.

Textarc - революційна програма для візуалізації та дослідження текстів, що є справжнім витвором мистецтва. Текст відтворюється на екрані комп'ютера у вигляді галактики, в якій слова грають роль зірок. Слова, що часто зустрічаються, світяться яскраво, а рідкісні - зовсім не видно. Рядки тексту виводяться у вигляді закрученої спіралі по кордону "галактики" точковим шрифтом (заввишки в один піксель). Програма дозволяє бачити структуру тексту, взаємозв'язок між словами і контекстом, проглядати частотний і алфавітний індекс слів і конкорданс. При русі курсору по галактиці слова спалахують і загоряються променями (покажчиками на контекст), а також звучать у різній тональності.

LeoBilingua - програма, що дозволяє генерувати білінгва-текст (текст з двох синхронних половин на різних мовах).

Інструментальні засоби МедиаЛингва призначені для створення систем автоматичного анотування, класифікації, пошуку і морфологічної обробки текстової інформації.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]