
- •1. Уточнення поняття прикладної лінгвістики і можливості застосування в ній комп'ютерних інформаційних технологій
- •2.1. Програми аналізу та лінгвістичної обробки текстів
- •2.2. Програми для автоматичної обробки текстів:
- •2.3. Програми перетворення текстів
- •3. Використання лінгвістичних програм у дослідженні російськомовних і англомовних текстів.
- •4. Перспективні напрямки розвитку сучасної прикладної лінгвістики.
- •Література
2.3. Програми перетворення текстів
Програми перетворення текстів представлені такими розробками, як: HTML Batch Editor, Словогрыз, ClearText Reader's Edition, xReplacer, xMarkup v2.1.1., XML редактори, Xchange Search&Replace, KDiff3, WinMerge, TextTransformer v1.4.1.
Наприклад, Словогрыз призначений для пошуку та заміни тексту по заданих масок. Програма вміє знаходити і замінювати в тексті не тільки суворо визначені слова і фрази, але і текстові елементи, які визначаються довільними пошуковими шаблонами. Дозволяє зберігати/завантажити сценарії перетворень.
KDiff3 і WinMerge - програми, що дозволяють візуально порівнювати текстові файли.
TextTransformer v1.4.1 - потужна програма, призначена для виконання як завгодно складних перетворень над множиню текстових файлів. Дозволяє аналізувати, змінювати, створювати і видаляти задані елементи оброблюваних текстів.
2.4. Психолінгвістичні програми
ПСИ-Офіс версія 2.1 - система психолінгвістичного аналізу текстів, що включає 3 компоненти: програма пошуку вкладених слів у тексті, тобто слів, "прихованих" всередині і на переходах між словами; програма пошуку повторюваних фрагментів тексту при аналізі "автоматичного письма" (такі тексти пишуться з метою аналізу поточних підсвідомих процесів); програма синтезу підсвідомого компонента тексту.
ВААЛ-2000 - експертна система лексичного та контент-аналізу текстів; прогнозує ефект неусвідомлюваного впливу тексту на масову аудиторію, аналізує тексти з точки зору такого впливу, виявляє особистісно-психологічні якості автора тексту.
Прийоми журналістики & Public Relations - програма, що представляє собою консультанта, який допомагає користувачеві при написанні різних текстів. Користувач вибирає ряд параметрів, що характеризують бажаний результат, а програма видає йому рекомендації з написання тексту та ілюструє їх прикладами.
Генератори текстів: Болтун (віртуальний співрозмовник, який володіє зачатками штучного розуму; може реагувати на репліку користувача своєї реплікою), Russian Word Constructor (RWC) - програма для створення російськомовних віршоподібных текстів ("інструмент поета").
Системи обробки природної мови і машинного перекладу: Natural Language Projects at ISI, Автоматичний словник Мультітран, Translate.Ru, LEO, PEREVODOV.NET, Проекти НДІ ШІ, Computer Aided Translation, Google Перекладач.
Каталоги і колекції ресурсів включають в себе Каталог програм з обчислювальної лінгвістиці, Ресурси, пов'язані з аналізом тексту, Довідково-інформаційний портал "Російська мова", Text Analysis Info, The Linguist List, LTI Projects. Портал "Російська мова", наприклад, цікавий тим, що містить масу корисної інформації і включає on-line словники української мови, такі як: Повний електронний орфографічний словник російської мови під ред. В.В. Лопатіна; Словник труднощів вимови і наголосу в сучасній російській мові; Новий словник російської мови, Розумно-словотворчий словник, Словник номінальні та ін.
Серед численних словників і тезарусів варто відзначити такі, що представляють інтерес British National Corpus (колекція більш ніж 100 мільйонів слів англійської письмової та усної мови), Acronym Finder (повний словник акронімів і скорочень англійської мови, містить понад 173 тисячі елементів), WordNet (електронний тезаурус, що відображає всі можливі тлумачення слів англійської мови та показ взаємозв ’ язки між ними; для кожного слова можна знайти синоніми, об'єднані в смислові групи і отримати посилання на родові або похідні поняття), Тлумачний словник Merriam Webster (on-line версія знаменитого тлумачного словника англійської мови).
Пошукові машини і системи повнотекстового пошуку представлені Пошуковою системою Яndex, Пошуковою системою Ищейка, Verity Ultraseek, Quintura Search, ARM Engine 4.0 і багатьма іншими.
Цікаві програми синтезу і розпізнавання мови, наприклад: Sacrament Text-to Speech Engine v2.0, Govorilka , CSLU Toolkit та інші.
Таким чином, існує безліч різноманітних програм і ресурсів, які можуть значно полегшити роботу з лінгвістичним матеріалом. Лінгвісту залишається тільки вибрати відповідні для дослідження програми і скористатися їх перевагами.