- •Isbn 978-5-9765-0098-3 (Флинта) isbn 978-5-02-034597-3 (Наука)
- •1.1.2. Методы воспроизведения и обработки данных
- •1.1.3. Понятие информации
- •1.1.4. Понятие контекстного метода
- •1.2. Данные
- •1.2.2. Операции
- •1.3.2. Классификация прикладных программ
- •1.3.3. Периферийные устройства
- •1.4. Интеллектуальные информационные системы
- •1.4.1. Искусственный интеллект (Artificial Intelligence)
- •1.4.2. Нейронные сети
- •1.4.3. Экспертные системы
- •2. Обзор лингвистических программ
- •2.1.1. Текстовые процессоры
- •2.1.3. Генераторы текстов и «говорящие» программы
- •2.2. Машинный перевод
- •2.2.1. Основные этапы развития машинного перевода
- •2.2.2. Как переводит компьютер
- •2.2.3. Классификация систем
- •2.3. Компьютерная лингвистика: нестандартные применения
- •2.3.1. Определение языка сообщения
- •2.3.2. Взлом шифров
- •2.3.3. Установление авторства
- •2.3.4. Построение роботов-поисковиков и снифферов
- •Заключение
- •Приложение
- •Оглавление
- •1 . Информация. Информационные
- •1.1. Информация 3
- •Информационный обмен, сигналы, данные 3
Заключение
:,'.
Тенденции развития и совершенствования компьютерных технологий свидетельствуют о широком применении их в различных областях человеческой деятельности. Цель настоящего учебного пособия — обучить студентов эффективно применять на практике возможности информационных технологий, в том числе сети Интернет. Особенностью данного пособия является использование современных программных продуктов в области обработки лингвистических данных. В результате изучения студенты смогут самостоятельно пользоваться различными программами в этой области, а в дальнейшем установить новые программы на компьютер и изучить их возможности.
Данное пособие не исчерпывает всей сложности проблем в такой новой области знаний, как компьютерная лингвистика. Изучение этой науки тесно связано с исследованиями в области искусственного интеллекта. На этом пути предстоит сделать еще много открытий. Спектр приложений компьютерной лингвистики простирается от простейших программ обработки текста, транслитерации, проверки правописания и других до таких сложных, как программы автореферирования, поисковые системы, программы машинного перевода, программы распознавания и синтеза речи, психолингвистические программы, системы обработки естественного языка с использованием технологий нейронных сетей.
Приложение
■
:■-.,
Каталог лингвистических программ и ресурсов в сети Программы анализа и лингвистической обработки текстов
Название |
Автор(ы), организация |
Комментарий |
1 |
2 |
3 |
Link Grammar Parser http://bobo.link. cs.cmu.edu/link/ |
John Lafferty, Daniel Sleator, Davy Temperley, Carnegi Melon University, USA |
Link Grammar Parser — это синтаксический парсер1 английского языка. Программа распространяется бесплатно. |
Russian Morphological Dictionary http://www. geocities.com/ Si I icon Valley/ Bit/1116/ |
Sergey Sikorsky ■ |
Программа для синтаксического и морфологического анализа русскоязычных текстов. Распространяется бесплатно. |
On-line морфологический парсер http:// www.comptek.ru/ alta.html |
flndex |
Для просмотра результатов морфологического анализа нужно выбрать режим Разбор запроса. |
Mystem http:// corpora.narod.ru/ mystem/ |
Илья Сегалович, Виталий Титов, компания flndex |
Компактный, очень быстрый и бесплатный морфологический парсер русскоязычных текстов, реализованный на основе словаря А.А. Зализняка. |
'
■
Парсер — анализатор.
69
1 |
2 |
3 |
Лингвоанали- затор http://www.rusf.ru/ books/analysis/ index.htm |
Д.В. Хмелев |
On-line версия программы математического анализа структуры текста. Целью анализа является определение близости любого из предлагаемых пользователем текстов к одному из авторских эталонов, определенных заранее. |
Программные продукты фирмы LingSoft http:// www.lingsoft.fi/en/ products.html |
LingSoft, Финляндия -■ |
Компоненты грамматического разбора, морфологического анализа и лемматизации (нормализации) для английского, немецкого, финского, датского, норвежского, шведского, эстонского и русского языков. Это коммерческие продукты, которые могут быть использованы при разработке других систем. |
Бюро переводов http:// www.dialing.ru/ rml.htm |
компания Dialing Москва |
Анализ текстов для построения систем автоматического перевода с русского на английский язык (и наоборот). Включает ряд автономных компонентов: |
|
|
— синтаксический анализатор текстов на русском языке; — морфологический анализатор текстов на русском и английском языках; — построение конкордансов для заданной совокупности текстов. |
Система StarLing http:// |
С.А. Старостин |
СУБД StarLing, позволяющая работать с мультиязычными |
1 |
2 |
3 |
starling.rinet.ru/ download.htm |
|
текстами большой длины, с транскрипционными знаками, с удобным поиском, с анализом и синтезом словоформ по словарю. |
Морфологический анализатор http:// starling.rinet.ru/ morph.htm |
С.А. Старостин ,,■ |
On-line версия программы морфологического анализа слов русского/английского языков. Позволяет получить для вводимого слова базовую форму и морфологическую информацию. Программа реализована на основе словарей А.А. Зализняка (русский язык) и В.К. Мюллера (английский язык). |
ParaConc 0.7beta http:// www.ruf.rice.edu/ -barlow/ parabeta.html ParaConc 1 .Obeta http:// www.ruf.rice.edu/ -barlow/ parac.html |
Michael Barlow |
Две бесплатные beta-версии программы построения параллельного конкорданса, т.е. конкорданса, основанного на двух сравниваемых текстах. Тексты должны быть выравнены по параграфам (предложениям), т.е. иметь одинаковое число этих элементов. |
WordSmith Tools http:// www.liv.ac.uk/ ~ms2928/ wordsmith/ |
Mike Scott |
Бесплатная демо-версия программы WordSmith 3.0 для построения конкордансов. Кроме программы Word Smith, можно загрузить различные словари. |
TextAnalyst 2.0 http:// www.analyst.ru/ index1.html? page=dload.htm |
Научно-производственный инновационный центр «Микросистемы» |
Демо-версия. Позволяет построить семантическую сеть понятий, выделенных в обрабатываемом тексте, со ссылками на контекст. Имеется |
70
71
1 |
2 |
3 |
■ ■ |
. |
возможность смыслового поиска фрагментов текста с учетом скрытых в тексте смысловых связей со словами запроса. Позволяет анализировать текст путем построения иерархического дерева тем/подтем, затрагиваемых в тексте. Также имеется возможность реферирования текста. Еще одна компонента, TextAnalyst Lib, может использоваться для построения гипертекстовых электронных книг. |
Русский филолог http:// www.agama.com/ |
АО Агама |
Словарно-справочная система по русскому языку. Включает в себя ряд словарей, в том числе морфологический, словообразовательный и словарь синонимов/антонимов. |
Лингвистические компоненты, словари и библиотеки классов http:// linguist.nm.ru/ |
Андрей Коваленко |
Авторская страничка ведущего разработчика компании Рэмблер, на которой представлены его лингвистические разработки. Можно скачать описания и демо-версии компонентов. |
netXtract http:// www.netxtract.com/ |
2000 Relevant Software Inc. |
Замечательная компонента, подключаемая к Microsoft Internet Explorer, которая позволяет получить упорядоченный индекс слов в загруженном HTML документе. Выбранные слова по желанию заносятся в персональную базу знаний, которая позволяет систематизировать найденные документы удоб- |
1 |
2 |
3 |
|
|
ным образом. Можно скачать |
|
|
бесплатную версию. |
WordTabulator |
СВ. Логичев, |
Позволяет построить упоря- |
v2.2 |
1997—2002 |
доченные индексы слово- |
http://www.rvb.ru/ |
|
форм или словосочетаний |
soft/index, htm I |
|
заданной размерности для |
|
|
множества входных текстов. |
|
|
Понимает тексты в основных |
■■■ |
|
русскоязычных кодировках и |
|
|
может обрабатывать доку- |
|
|
менты в формате HTML 4.01, |
|
|
игнорируя их разметку. |
WordStat |
А.Г. Дубинский, |
Бесплатная утилита2 подсче- |
http:// |
2001 |
та частоты встречаемости |
dubinsky.nm.ru/ |
|
различных слов в текстовых |
wordstat.htm |
|
или html-файлах. |
Технологии |
Гарант-Парк- |
Сайт, на котором представ- |
поиска и анализа |
Интернет |
лены разработки известной |
текстовой |
|
компании «Гарант-Парк-Ин- |
информации |
|
тернет». Среди представ- |
http://www.rco.ru/ |
|
ленных технологий: |
|
|
— анализ и классификация |
|
|
текстов, автоматическое |
|
|
реферирование; |
|
|
— морфологический, син- |
|
|
таксический и семанти- |
|
|
ческий анализ текста; |
|
|
— средства навигации по |
|
|
большим массивам |
|
|
текстов; |
|
■ |
— различные научные пуб- |
|
|
ликации авторов проекта. |
2 Утилита — программа обслуживания, системная программа, предназначенная для оказания услуг общего характера пользователям и обслуживающему персоналу си-
стемы обработки информации.
72
73
Психолингвистические программы
Название |
Автор(ы), организация |
Комментарий |
1 |
2 |
3 |
ПСИ-Офис |
Вадим Сысуев |
Система психолингвистиче- |
версия 2.1 |
|
ского анализа текстов, вклю- |
http:// |
|
чающая три компоненты: |
psy-two.narod.ru/ |
|
|
|
|
— программа поиска вло- |
|
|
женных слов в тексте, |
|
|
т.е. слов, спрятанных |
|
|
внутри и на переходах |
|
|
между словами; |
|
|
— программа поиска повто- |
|
|
ряющихся фрагментов |
|
|
текста при анализе «ав- |
1 |
|
томатического письма» |
|
|
(такие тексты пишутся с |
|
|
целью анализа текущих |
|
|
подсознательных про- |
|
|
цессов); |
|
|
— программа синтеза под- |
|
|
сознательного компонен- |
|
|
та текста. Поддержка |
|
|
русского (словарь |
|
|
690 тыс. слов) и |
|
|
английского (словарь |
|
|
430 тыс. слов) языков. |
ВААЛ-2000 |
В.П. Белянин, |
Психолингвистическая экс- |
http:// |
д-р филол. |
пертная система лексическо- |
vaal2000.newmail. |
наук, МГУ |
го и контент-анализа текстов. |
ru/vaal2000.htm |
В.И. Шалак, |
Основные задачи — прогноз |
|
канд. филос. |
эффекта неосознаваемого |
|
наук (Институт |
воздействия текста на мас- |
|
философии РАН) |
совую аудиторию, анализ |
|
|
текстов с точки зрения такого |
|
|
воздействия, генерация тек- |
|
|
ста с заданным вектором |
1 |
2 |
3 |
|
|
воздействия, выявление лич- |
|
|
ностно-психологических ка- |
|
|
честв автора текста. Успеш- |
|
|
но используется в Госдуме, |
|
|
Правительстве РФ, крупных |
|
|
банках и PR-компаниях. |
ПРИЕМЫ |
Система |
Коммерческая программа, |
ЖУРНАЛИСТИ- |
«ТРИЗ-ШАНС», |
представляющая собой кон- |
КИ & PUBLIC |
Санкт-Петербург |
сультанта, помогающего |
RELATIONS, |
|
пользователю при написании |
версия 2.03, |
|
различных текстов. Пользо- |
2000 |
|
ватель выбирает ряд пара- |
http://www.triz- |
|
метров, характеризующих |
chance.spb.ru/ |
|
желаемый результат, а про- |
|
|
грамма выдает ему рекомен- |
|
|
дации по написанию текста |
|
|
и иллюстрирует их примера- |
|
|
ми. В основе программы — |
|
|
анализ 12 500 текстов масте- |
■ |
|
ров русского языка, начиная |
|
|
от писателей-классиков и |
|
|
заканчивая современными |
|
|
журналистами и политиками. |
■ |
|
К сожалению, в программе |
|
|
отсутствуют возможности |
|
|
анализа написанного поль- |
|
|
зователем текста. Для загруз- |
|
|
ки доступна демо-версия, |
|
■ |
являющаяся облегченным |
|
|
вариантом профессиональ- |
|
|
ной версии. Демо-версия |
|
|
также включает руководство |
|
|
пользователя и демонстра- |
|
|
ционный обучающий ролик. |
|
|
Программа требует для ра- |
|
|
боты русские Windows 9x/ |
|
|
2000/NT и Microsoft Word. |
74
75
1 |
2 |
3 |
|
|
ну или организацию. Исполь- |
|
|
зует для работы словарь лек- |
|
■ |
сической информации, кото- |
|
|
рый на сегодняшний день |
|
|
включает более 7000 элемен- |
|
|
тов. Язык реализации — ан- |
|
|
глийский. |
Cyrano Server |
Nando.net |
On-line версия программы |
http://www. |
|
генерации любовных писем. |
nando.net/toys/ |
|
Пользователь задает стиль |
cyrano/version2/ |
■ |
сочинения,свое имя, обра- |
compose- |
|
щение к любимой и некото- |
cyrano.html |
|
рые атрибуты, ее характери- |
|
|
зующие, и программа ловко |
|
■ |
сочиняет письмо нужной |
|
|
тональности. Язык реали- |
|
|
зации — английский. |
Письмовник |
MediaLigua Ltd., |
Автоматическое составление |
http://www. |
1995—2002 |
и перевод (русско-английский / |
medialingua.ru/ |
|
англо-русский) деловых пи- |
pismovnik.html |
|
сем и документов. Коммер- |
|
|
ческая система для Windows |
|
|
95/98, $49. |
A.L.I. C.E |
Dr. Richard |
Говорящая программа. В ос- |
http://www. |
S. Wallace |
нове технологии, на которую |
alicebot.org/ |
|
опирается A.L.I.С.Е., лежит |
alice_page.htm |
|
использование AIML (специ- |
|
|
ализированного языка раз- |
|
|
метки для искусственного |
|
|
интеллекта). В разделе |
|
■ |
downloads доступен исход- |
|
|
ный код и различные импле- |
|
|
ментации программы. |
The Dada Engine |
Andrew С Bulha |
Генератор случайных тек- |
http://dev.null.org/ |
|
стов на основе заданной |
dadaengine/ |
|
грамматики (на английском |
|
|
языке). |
1 |
2 |
3 |
Sakrament Text-to-Speech Engine v2.0 http:// sakrament.com/ |
компания «Сакрамент», 2002 |
Система синтеза русской речи,созданная минской компанией «Сакрамент». Система польностью соответствует стандарту Microsoft Speech API (SAPI) 5.1. Позволяет произносить тексты мужским и женским голосами, делая при этом инфонационные паузы, изменяя по желанию пользователя тон и тембр речи. |
Аки Росс http:// www.akirossbot. narod.ru/ 1 ■ |
Альберт Товмасян, 2002 - |
Shareware — программа, предлагающая общение на русском языке. Специальный plug-in позволяет использовать анимацию в виде очаровательной девушки-собеседника по имени Аки Росс (так звали героиню компьютерного мультика «Final Fantasy»). База знаний программы не столь обширная, но теоретически ее можно улучшать и дополнять (используется язык разметки AIML). Незарегистрированная версия запускается всего 10 раз сеансами по 2 минуты. |
PAI V3.01 http://utenti.quipo. it/claudioscordino/ pai.html |
Claudio Scordino, 2002 |
Programmable Artificial Intelligence (PAI), или Программируемый Искуственный Интеллект, — это freeware про- |
78
79
грамма, способная общаться с пользователем на английском языке. Что наиболее интересно в PAI, так это способность обучения. Пользователь постепенно может научить программу понимать нужные фразы, слова, глаголы и даже команды! Реализована на языке C++ для Linux, FreeBSD и Windows.
С истемы обработки естественного языка (NL-Processing)
Название |
Автор(ы), организация |
Комментарий |
1 |
2 |
3 |
Natural Language Projects at ISI http://www.isi.edu/ natural-language/ nlp-at-isi.html ■ |
Univ.of Southern California/ Information Science Inst, 1999—2001 |
Описание группы проектов по вычислительной лингвистике и машинному переводу. Webclopedia — проект, связанный с созданием информационных агентов, способных генерировать ответы пользователю на основе анализа разнородных коллекций ресурсов, доступных в сети. ONTOSAURUS — это онтологический тезаурус, включающий 90000 концептуальных сущностей. SUMMARIST — мультиязыч-ная система реферирования текстовой информации. ReWrite — система двуязычного перевода,основанная на статистическом анализе пар текстовых корпусов. |
1 |
2 |
3 |
Следопыт 3.0 |
MediaLingua |
Интеллектуальная поисковая |
http:// |
Ltd., 2001 |
система, применимая для |
www.sledopyt.ru/ |
|
смыслового и нечеткого по- |
|
|
иска документов на русском |
|
|
и/или английском языках. |
|
|
При поиске учитывается мор- |
|
|
фология и изменение грам- |
|
|
матических форм элементов |
|
|
поискового запроса. Понима- |
|
|
ет все основные форматы |
|
|
документов для Windows. |
|
|
Цена от $9,9 до $1290 в за- |
|
|
висимости от комплектации. |
Поисковая |
ВЕЛТОН. |
Персональная поисковая си- |
система Алхимик |
SOFT, 2002 |
стема Алхимик, предназна- |
http://www.soft. |
|
ченная для анализа и поиска |
velton.net.ua/ |
|
русскоязычных документов. |
langs download. |
|
Программа использует фраг- |
html |
|
менты семантического сло- |
|
|
варя профессора В.А. Тузо- |
|
|
ва. Входными документами |
|
|
могут быть файлы в форма- |
|
|
тах MS Word, HTML и TXT. |
ARM Engine 4.0 |
ABBYY Software |
ABBYY Retrieval & Morphology |
http://www.abbyy. |
House, 2001 |
(ARM) Engine — коммерче- |
ru/products/arme/ |
|
ская инструментальная си- |
index.htm |
|
стема, позволяющая встраи- |
|
|
вать в разрабатываемые при- |
|
|
ложения функции полнотек- |
|
|
стового поиска и морфологи- |
|
|
ческого анализа текстов. |
|
|
Поддерживает практически |
|
|
все европейские языки, вклю- |
|
|
чая русский. Реализована |
|
|
в виде API с использованием |
|
|
технологии СОМ-объектов. |
|
|
Демо-версию можно полу- |
|
|
чить бесплатно.
|
80
6 Заказ 105
1 |
2 |
3 |
NeurOK Semantic |
НейрОК |
Программные продукты для |
Suite |
Интел софт, |
поиска и анализа в текстовых |
http://soft.neurok. |
2002 |
массивах информации, реа- |
ru/products/ |
■ |
лизованные с использовани- |
semantic.shtml |
|
ем технологии нейронных |
|
. |
сетей. Серьезные цены соот- |
■ !■ ■ '■ • ! |
|
ветствуют серьезности са- |
|
|
мих продуктов. |
|
Коллекции ресурсов |
|
Название |
Автор(ы), организация |
Комментарий |
1 |
2 |
3 |
Каталог |
SIL International |
Обширный каталог программ |
программ |
(Summer Institute |
по вычислительной лингви- |
по вычисли- |
of Linguistics) |
стике. Представленные в |
тельной |
|
каталоге программы носят |
лингвистике |
|
явно академический харак- |
http://www.sil.org/ |
|
тер и требуют значительных |
computing/ |
|
усилий для изучения и при- |
|
|
менения. Все программы, а |
|
|
их более 60, являются бес- |
|
|
платными и доступны для |
|
|
on-line загрузки. |
Каталог |
SIL International |
Обширная коллекция ссылок |
программ |
|
на программы чрезвычайно |
по вычисли- |
|
широкой лингвистической на- |
тельной |
- |
правленности в сети Internet. |
лингвистике |
|
Но совсем нет программ, по- |
в сети Internet |
|
священных русскому языку. |
http://www.sil.org/ |
|
Представлены как бесплат- |
linguistics/ |
|
ные, так и коммерческие |
computing.html |
|
программы. |
Каталог про- |
Michael Barlow |
Интересная подборка доступ- |
грамм в Corpus |
|
ного в сети лингвистического |
Linguistics |
■ |
программного обеспечения. |
1 |
2 |
3 |
http://www.ruf. |
|
|
rice.edu/-barlow/ |
.. ■ • ■ ;, |
■ |
corpus. html# |
|
|
Software |
|
|
Каталог ресурсов |
Harald Klein |
Обширная компиляция ссы- |
по анализу |
•" • : . > ' ' |
лок по проблеме анализа |
текстов |
■ С HNfil . ■ |
текстов (на английском язы- |
http://www.intext. |
■ <\ •■■: |
ке). Большой раздел посвя- |
del textanae.htm |
|
щен тематическим компью- |
|
|
терным программам. |
Ресурсы, |
Matthias |
Электронный каталог ресур- |
связанные |
Romppel |
сов, связанных с анализом |
с анализом |
|
текстов (на англ. языке). |
текстов |
|
Библиографии, программное |
http://www. |
|
обеспечение, адреса иссле- |
content-analysis. |
|
довательских организаций, |
de/index.html |
• |
архивы электронных текстов |
|
|
и другое. |
Русский |
Юрий Коряков |
Авторская коллекция ссылок |
Лингвистический |
|
на языковые ресурсы по |
указатель создан |
■ ■ ■ . |
следующим разделам: |
15 мая 1999 |
|
— языки народов России |
http://isabase. |
|
(славянские, уральские, |
philol.msu.ru/ |
|
кавказские и др.) и мира; |
—jirik/rusling.html |
|
|
|
|
— некоторые направления |
|
|
лингвистики (компарати- |
|
|
вистика, социолингви- |
|
|
стика, вычислительная |
|
|
лингвистика, типология); |
|
|
— словари; |
|
|
— адреса российских орга- |
|
|
низаций, связанных |
|
|
с лингвистикой. |
Полезные ссылки |
А.А. Поликарпов, |
Большая коллекция ссылок |
для лингвистов |
МГУ |
на лингвистические ресурсы, |
82
83
1 |
|
2 |
3 |
http://humlang. |
|
|
проекты, конференции, орга- |
newmail.ru/ |
|
|
низации. |
h_link_r.htm |
|
|
|
Справочно-ин- |
|
МО «ЭЛЕКС», |
Замечательный ресурс для |
формационный |
|
2000 |
истинных любителей рус- |
портал |
|
|
ской словесности. Включает |
«Русский язык» |
|
|
онлайновые словари рус- |
http://www. |
|
! |
ского языка: |
gramota.ru/ index.html |
|
|
— орфографический сло- |
|
|
|
варь русского языка под |
|
|
■ |
ред. В.В. Лопатина; |
|
|
|
|
|
|
|
— словарь трудностей про- |
Г' ;*•; |
|
|
изношения и ударения |
|
|
|
в современном русском |
|
|
|
языке; |
|
|
|
— новый словарь русского |
|
|
|
языка. Толково-словооб- |
|
|
|
разовательный; |
|
|
|
— русское словесное уда- |
|
|
|
рение. Словарь нарица- |
|
|
|
тельных имён; |
|
|
|
— русское словесное уда- |
|
|
|
рение. Словарь имён |
|
|
|
собственных. |
■.
Словари и тезаурусы
Название |
Автор(ы), организация |
Комментарий |
1 |
2 |
3 |
Словарь В. Даля http://vidahl. agava.ru/ |
■ |
On-line версия знаменитого словаря В. Даля «Толковый словарь живого великорусского языка». |
1 |
2 |
3 |
On-line словари |
1997—2000 |
Коллекция on-line словарей: |
Издательского |
ETS Publishing |
анатомический (латынь), |
Дома «ЭТС» |
House |
уфологический, словарь со- |
http://www.ets.ru/ |
|
кращений, иностранных слов, |
udict-r.htm |
|
финско-русский, немецко-рус- |
|
|
ский, англо-русский фразео- |
|
|
логический и ряд других. Кро- |
■ |
|
ме этого, на сайте представ- |
|
|
лены языковые программы. |
Словари |
C.A. Старостин |
On-line версии словарей |
Ожегова |
; |
С.Н. Ожегова и А.А.Зализ- |
и Зализняка |
: . |
няка. |
http://starling. |
; .. |
|
rinet.ru/cgi-bin/ |
■: |
|
main.cgi?flags= |
|
|
wygnmnl |
|
|
Acronim finder |
Mountain |
Полный словарь акронимов и |
http:// |
Data Systems |
сокращений английского |
acronymfinder.com |
|
языка. Содержит более |
|
|
173 тыс. элементов. |
Lexical FreeNet |
Datamuse |
On-line тезаурус английского |
http://www. |
Corporation |
языка. Может использовать- |
lexfn.com/ |
|
ся для любых мыслимых |
|
|
целей: поиска синонимов, |
: |
|
связанных слов, подбора |
|
|
рифм, орфографической |
|
|
проверки и т.д. |
The Wordsmyth |
Wordsmyth |
On-line версия образова- |
Educational |
Collaboratory |
тельного словаря-тезауруса |
Dictionary |
■ |
английского языка. Содер- |
Thesaurus |
|
жит около 50 тысяч корен- |
(WEDT) |
|
ных слов. Пользователь |
http://www. |
|
может получить расклад |
wordsmyth.net/ |
|
интересующего слова по |
|
|
слогам, его произношение, |
• |
|
список всех словоформ и |
|
|
толкование. |
84
85
1 |
2 |
3 |
Толковый |
Merriam-Webster |
On-line версия знаменитого |
словарь |
Incorporated |
толкового словаря англий- |
Merriam-Webster |
|
ского языка. |
http://www.m-w. |
|
'■■ '■ |
com/ |
|
|
Babylon.com |
Babilon.com Ltd. |
Сайт, предоставляющий раз- |
http:// |
|
личные услуги: мультиязыч- |
www.babylon.com/ |
|
ный перевод, словари и спра- |
|
|
вочники, преобразование од- |
|
|
них мер в другие и т.д. Поль- |
|
|
зователь получает доступ |
|
|
к ресурсам системы после |
|
|
установки на свою локаль- |
|
|
ную машину интерфейса |
|
|
Babylon. Он может опреде- |
|
|
лять состав необходимых |
|
. ■ |
ему словарей, языковые на- |
|
|
стройки и режимы работы |
|
|
(off-line или on-line) и даже |
|
• |
создавать свои собственные |
|
|
словари. Плата за пользова- |
|
|
ние не взимается! |
РУБРИКОЙ |
Russ Portal |
В настоящее время на сер- |
http://www. |
Company Ltd. |
вере опубликованы: |
rubricon.ru/ |
2001 |
|
|
|
— «Большая советская |
|
■ |
энциклопедия» |
|
|
(1969—1979); |
|
|
— «Иллюстрированный |
|
|
энциклопедический |
|
|
словарь» (1998); |
|
|
— «Толковый словарь жи- |
|
|
вого великорусского язы- |
|
|
ка» Владимира Даля |
|
|
(1863—1866); |
|
|
— «Рок-энциклопедия» Сер- |
|
|
гея Кастальского (1998); |
1 |
2 |
3 |
|
■■ '.''■' ■ : ■ |
— Энциклопедический словарь «История Отечества»; — Энциклопедический словарь «Всемирная история». |
British National Corpus (BNC) http://info.ox. ac.uk/bnc |
1995 Oxford University Press ■ ■ ■ |
Коллекция более чем 100 миллионов слов современного английского письменного и устного языка. В режиме on-line поиска пользователь может найти примеры употребления как отдельных слов, так и выражений. |
Англо-русский словарь Мультилекс™ 1.0 http:// www.multilex.ru/ online.htm |
MediaLingua Ltd. 2000 . ■ |
On-line версия знаменитого трехтомного словаря НБАРС под редакцией проф. Э.М. Медниковой и акад. Ю.Д. Апресяна (250 000 словарных входов, 2 300 000 английских и русских слов). |
Обратные и частотные словари русского языка http://speakrus. narod.ru/ zaliznyak/ zalizn.htm |
Арнольд |
Обратный и обычный словари, образованные из словаря А.А. Зализняка (93 392 слова). Обратный и обычный словари Про-Линг (125 723 слова). Обратный, обычный и частотный словари, полученные в результате анализа произведений русской литературы XIX—XX вв. (162 232 слова). |
Словарь сокращений русского языка http:// www.sokr.ru/ |
Студия Артемия Лебедева |
On-line словарь сокращений русского языка, включающий на сегодня более 53 000 статей. |
87
1 |
2 |
3 |
|
|
«Словарь сокращений рус- |
■ |
|
ского языка» {1984); |
|
|
«Новый словарь сокращений |
|
|
русского языка» (1995); |
... . I |
■ ' ■ |
«Новые сокращения в русском |
■ |
■ |
языке 1996—1999» (1999). |
Гиперсловарь |
РосНИИ |
Гиперсловарь «Ариадна» — |
Ариадна |
искусственного |
проект создания универсаль- |
http:// |
интеллекта |
ной среды для систем авто- |
www.artint.ru/ |
|
матической обработки рус- |
packin/abrial/ |
|
ского текста. По форме ги- |
ariadna.htm |
■ |
персловарь является базой |
|
|
данных Абриаль, включаю- |
|
|
щей грамматическую компо- |
|
|
ненту на основе словаря |
■■ " ! ■ . |
|
А.А. Зализняка, позволяю- |
. ... . ,■■. . |
|
щую получать склонения и |
■ ■ |
■ |
спряжения слов и морфо- |
|
|
логическую компоненту. |
■■■;■■,■
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА
Основная
Информатика для юристов и экономистов / СВ. Симонович, ГА. Евсеев, В.И. Мураховский, А.Ю. Казуто; под ред. СВ. Симоновича. СПб.: Питер, 2001.
2. Кудрявцева Т.Н. Введение в Интернет: Методическое пособие. Ярославль: МУБиНТ, 2002.
■
Электронные ресурсы
Каталог лингвистических программ и ресурсов в Сети [Электрон ный ресурс] / Сост. СВ. Логичев; Русская виртуальная библиоте ка. М.: РВБ, 1999—2004. — Режим доступа: http://www.rvb.ru/soft/ catalogue/catalogue. html.
Компания ПРОМТ: технологии машинного перевода [Электрон ный ресурс]. М.: ООО «ПРОМТ», 2003—2004. — Режим доступа: http://www.translate.ru.
Международная конференция ДИАЛОГ [Электронный ресурс] / Ас социация «Компьютерная лингвистика и интеллектуальные тех нологии». М.: КОЛИНТ, [2004] — Режим доступа: http://www. dialog-21.ru.
6. Языковые и лингвистические проекты в Интернете [Электронный ресурс]: Указатель ресурсов / Веб-каталог EGO: страны мира, язы ки и Интернет. М., 1999—2002. — Режим доступа: http://www.Hnks- guide.ru/sprachen/yazyki-projekty.html.