Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Введение в электронные лингвистические ресурсы

.pdf
Скачиваний:
45
Добавлен:
09.06.2015
Размер:
2.36 Mб
Скачать

10

размечать текст маркерами, чтобы раздельно анализировать разные части текста (отдельно, например, заголовки, отдельно сами тексты или комментарии к текстам, речь разных персонажей в драматургических произведениях и под.). Конкорданс создает основу для получения статистических данных о тексте, прежде всего – абсолютных и относительных частот составляющих его слов, предлагает способы различной фильтрации и сортировки материала, получения ответов на специальные запросы пользователя, предусматривает обычно

и средства вывода полученных данных на печать.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Основы

работы

с

автоматическим

 

конкордансом

хорошо

изложены

в

книге

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

Ж.Г. Аношкиной «Подготовка частотных словарей и конкордансов на компьютере» (М., 1995)г.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

к

 

 

Получил

 

распространение

созданный

 

Ж.Г.

 

Аношкиной

 

текстоориентированный

пакет

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

вс

 

 

программ UNILEX с удобной настройкой,

морфологическим анализатором и значительным

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ш

 

 

 

 

количеством различных опций конкорданса.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

Интересную

систему

 

создания

 

конкордансов,

легко

настраиваемую

на обработку

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

русского материала, предлагает

R.J.C. Watt - www.concordancesoftware.co.uk.

 

 

ы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

Большая

подборка

 

ссылок

на

доступные

в

 

Сети

 

компьютер

ные

средства

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ч

 

 

 

 

 

 

 

 

 

(морфологические

и

синтаксические

 

парсеры,

 

программы

построения

конкордансов,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Г

 

 

 

 

 

 

 

 

 

 

программы преобразования текстов, средства психолингвистического .анализа, компьютерные

словари и тезаурусы)

содержится в Приложении к учебному пособию. А.В. Всеволодовой для

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Н

 

 

 

 

 

 

 

 

 

 

 

студентов, аспирантов, преподавателей-филологов «Компьютерная обработка лингвистических

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

данных»

(М.: Наука:

Флинта,

 

 

2007).

 

Из

перечисленных

в

инем

 

компьютерных

ресурсов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

 

 

 

 

 

 

филологам,

начинающим осваивать средства обработки лингвистического материала, можно

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

рекомендовать самостоятельно разобраться в работе с WordTabulatorм

v2.2

(автор – С.В. Логичев):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

http://www.rvb.ru/soft/index.html и

 

утилитой для

Windows Словогрыз (автор

 

И.

Сагалаев)

:

http://www.softwaremaniacs.org/TR/.

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

е

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Свободно распространяемая программа WordTabulator v.2.2.3 for Windows принимает на

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

входе тексты в

формате

HTML или «обычный

 

текст» и

строит упорядоченные

индексы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

искомых элементов, в качестве которых могутевыступать словоформы, «словосочетания» или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

«синтагмы»

(определения данных еди

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ц см. в подробной справке к WordTabulator). Если

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

выходной файл (индекс) задан в формате HTML-документа, то от каждого элемента индекса,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

й

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

например

 

 

 

словоформы,

возможен

 

переход

 

к

 

обрабатываемому

тексту,

 

в

котором

 

 

 

 

 

 

 

 

 

 

 

 

 

ы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

подсвечиваются

 

 

 

 

 

 

н

 

При просмотре результата с помощью встроенного в

искомые единицы.

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

программу

 

 

Обозревателя

фрагменты

 

исходного

 

текста

 

с

искомыми

единицами

могут

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

копироваться обычными для

еWindows способами.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Существенной

о обенностьют

WordTabulator’а

является

возможность

 

строить

 

и

 

 

 

 

 

 

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

параллельно обрабатывать два корпуса текстов, составы единиц которых могут

 

по желанию

 

 

 

 

 

 

д

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

пользователя либо объединятьсяа

в общем индексе, либо соотноситься по типу пересечения (на

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

выходе показываютсяу

только элементы, встречающиеся в обоих корпусах одновременно), либо

 

 

 

 

г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

соотноситься по типу исключения

(на

 

выходе показываются

только

те

элементы

первого

 

 

 

й

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

корпуса, которые не встречаются во втором корпусе.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

к

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В WordTabulator встроен разработанный Ж.Г. Аношкиной морфологический модуль,

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

использование которого (его подключение нужно специально указывать в настройке) позволяет

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

получатьв

 

 

информацию

обо

 

всех

словоформах

 

указываемого

 

в

запросе

 

слова.

База

а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

морфологическогот

модуля содержит 12000 фамилий, 2800 личных мужских и женских имен,

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2100 отчеств, 40600 существительных, 18000 прилагательных, 20800 глаголов, 4000 других

С

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

аслов (наречий, междометий, предлогов и т.п.).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Словогрыз 3.1 - бесплатная утилита для Windows с функцией поиска и замен, допускает использование гибкой системы шаблонов с определяемыми пользователем переменными, удобна при необходимости осуществлять многошаговые замены, позволяет сохранять сценарии производимых замен и при необходимости запускать их вновь.

При выполнении самых различных исследований и прикладных работ оказывается необходимым ставить в соответствие некоторому количеству словоформ, образующих тексты или входящих в полученные каким-то образом списки, грамматические признаки этих словоформ и устанавливать начальные формы характеризуемых слов, то есть производить их

11

 

лемматизацию. Автоматический морфологический анализ и лемматизация используются в

 

информационно-поисковых системах при обработке запросов, в больших текстовых корпусах

 

при аннотировании материала и в других случаях. Ориентированные на русский язык

 

специальные программы морфологического анализа (морфологические парсеры) опираются на

 

данные

уникального

по

 

полноте

и

строгости

 

описания

грамматических

парадигм

 

«Грамматического словаря русского языка» А.А. Зализняка (М., 1977), включающего около

 

100 000

слов. Однако

в

текстах кроме имен

нарицательных функционируют

и

имена

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

собственные,

а также устаревшие слова,

неологизмы,

окказионализмы и другие лексические

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

единицы,

не

 

представленные по

 

тем

или

иным

причинам в

словаре

А.А. Зализняка. гИх

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

к

 

 

морфологический анализ парсеры осуществляют по аналогии с представленными в их базе

 

лексическими единицами.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

вс

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ш

 

 

 

 

 

 

 

Если автоматический морфологический анализ не сопровождается учетом конт кста, то

 

ему недоступно

разграничение омонимичных единиц (омонимов, омоформ).

Когда

такие

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

единицы встречаются в анализируемом материале, парсер показывает на выходеывсе варианты

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

их морфологического разбора (варианты обычно отделяются один от другогорзнаком «|»). На

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ч

 

 

 

 

 

 

сайте компании

Яндекс (http://company.yandex.ru/technology/mystem/)

 

можно

скачать для

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Г

 

 

 

 

 

 

 

 

некоммерческого

использования

созданный

 

И.В.

Сегаловичем

консольный.

парсер

Mystem,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

работающий с русским речевым материалом.

 

 

 

 

 

 

 

 

 

 

Н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В качестве примера грамматического анализа, выполняемого парсером Mystem, покажем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

результат обработки парсером афоризма Б. Паскаля «Только коичая задуманное сочинение, мы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

 

 

уясняем себе, с чего нам следовало его начать»:

 

 

 

 

 

м

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

Только{только=ADV=|только=PART=|только=CONJ=| олько=PART=}

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

 

 

 

 

 

 

кончая{кончать=V=непрош,деепр,несов}

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

задуманное{задумывать=V=прош,им,ед,прич,сред,сов,страд|задумывать=V=прош,вин,ед,

 

 

 

 

 

прич,сред,сов,страд}

 

 

 

 

 

 

 

в

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

сочинение{сочинение=S,сред,неод=им,ед|сочинениее

=S,сред,неод=вин,ед}

 

 

 

 

 

 

 

мы{мы=SPRO,мн,од=им}

 

 

 

 

 

у

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

уясняем{уяснять=V=непрош,ед,прич,крн,муж,несов,страд|уяснять=V=непрош,мн,изъяв,

1-

 

 

 

 

 

л,несов}

 

 

 

 

 

 

 

 

й

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

себе{себя=SPRO,ед,од=дат,жен|себя=SPRO,ед,од=дат,муж|себя=SPRO,ед,од=пр,жен|себя=SPR

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

O,ед,од=пр,муж|себе=PART=}

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с{с=PR=}

 

 

 

 

 

т

е

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

чего{чего=ADVPRO=}

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

нам{мы=SPRO,мн,од=дат}

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

следовало{следоватьа=V,несов=прош,ед,изъяв,сред}

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

его{его=APRO=им,ед,жен|его=APRO=им,ед,муж|его=APRO=им,ед,сред|его=APRO=им,мн|его=

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

APRO=р д,ед,жен|его=APRO=род,ед,муж|его=APRO=род,ед,сред|его=APRO=

 

 

 

 

 

 

 

 

 

 

г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

й

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

род,мн|его=APRO=дат,ед,жен|его=APRO=дат,ед,муж|его=APRO=дат,ед,сред|его=APRO=

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дат,мн|его=APRO=вин,ед,жен|его=APRO=вин,ед,муж,од|его=APRO=вин,ед,

 

 

 

 

 

 

 

 

к

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

муж,неод|его=APRO=вин,ед,сред|его=APRO=вин,мн,од|его=APRO=вин,мн,неод|его=AP

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

вRO=твор,ед,жен|его=APRO=твор,ед,муж|он=SPRO,ед,муж,од=род|он=SPRO,ед,муж,од=в

 

 

а

 

ин|оно=SPRO,ед,сред,од=род|оно=SPRO,ед,сред,од=вин}

 

 

 

 

 

 

 

 

 

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

начать{начинать=V=инф,сов}

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

С

 

 

 

В фигурные скобки заключена вся информация, относящаяся к одной текстоформе.

 

 

 

 

 

 

После открывающей фигурной скобки записана начальная форма слова; знаком «=» разделены разные зоны грамматической характеристики: указания части речи, классифицирующих признаков, словоизменительных признаков. Знаком «|» разделяются, как уже сказано, грамматические варианты.

Обозначения частей речи, принятые в Mystem:

A - прилагательное, ADV – наречие,

12

 

CONJ – союз,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

INTJ - междометие,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NUM – числительное,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

PART – частица,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

PR - предлог ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S – существительное,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V – глагол,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ANUM - порядковое числительное,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

APRO - местоименное прилагательное,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

ADVPRO - местоименное наречие,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

SPRO - местоименное существительное.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

к

 

 

Целый

 

ряд

относительно

доступных

 

программных

 

продуктов

 

вс

 

 

 

 

 

поддерживает

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ш

 

 

 

 

сопоставление и тематическую рубрикацию различных документов, в томе

числе,

 

функционирующих

 

в

Сети.

Для

начального знакомства

с

этим

 

типом ресурсов

можно

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

рекомендовать распространяемую с бесплатным

испытательным сроком

 

программуы

Rubryx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

(авторы – В. Поляков и В. Синицын)

(www.sowsoft.com.rubryx/index.html).

 

Врсоответствии со

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ч

 

 

 

 

 

 

своими задачами пользователь (эксперт) указывает тематические классы (рубрики), по которым

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Г

 

 

 

 

 

 

 

 

 

программа Rubryx

 

должна распределять тексты, и подбирает для каждой.

рубрики несколько

 

достаточно типичных, по его мнению,

текстов в качестве образцов.На их основе программа

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Н

 

 

 

 

 

 

 

 

 

 

 

автоматически строит тематические микрословари особого формата. Существенно,

что в их

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

состав входят

 

однословные,

двусловные и трехсловные

ед ицы.

Результат

этой

работы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

 

 

 

 

 

доступен контролю со стороны эксперта и может корректироваться им.

 

При анализе новых

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

текстов программа сравнивает состав их однословных, двусловныхм

 

и трехсловных единиц с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

имеющимся в предварительно созданных микрословарях рубрик и устанавливает коэффициент

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

родства между ними. Опытные прогоны позволяют епоэтапно улучшать настройку программы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

на тематические рубрики.

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Лингвистические

принципы, положенные

в основу

Rubryx,

обсуждаются

в статье:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поляков В.Н. Использование технологий, ориентированных на лексическое значение, в задачах

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

поиска и классификации // Scripta

linguisticae applicatae. Проблемы прикладной лингвистики.

 

 

 

 

 

 

 

 

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вып. 2. М., 2004.

 

 

 

 

 

 

 

й

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Особый

большой

класс

лингвистических

ресурсов

образуют лингводидактические

 

 

 

 

 

 

 

 

 

 

 

ы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

программы, подробно

 

 

н

 

 

 

 

 

 

 

 

Бовтенко М.А. Компьютерная

 

рассматриваемые в учебном пособии

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

лингводидактика. М.: Наука: Фли та, 2007.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4. В создании электронныхе

ресурсов в области русистики важную роль сыграл проект

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

«Машинный фонд русского языка» – программа комплексной информатизации исследований в

 

русистике.

 

 

 

 

д

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Идея созданияаМашинного фонда русского языка (МФРЯ)

была высказана акад. А.П.

 

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ершовым в 1978 г. на конференции по компьютерной лингвистике и интеллектуальным

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

технологиям «Диалог». В 1980-х гг. был проведены специальные конференции, посвященные

 

 

г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

й

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

проблемам создания МФРЯ, сыгравшие важную роль в развитии отечественной компьютерной

 

лингвист ки. В это же время в Институте русского языка имени В.В. Виноградова РАН был

 

к

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

создан Отдел машинного фонда русского языка, разработана «Комплексная программа научных

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

исследований и прикладных разработок по созданию Машинного фонда русского языка на

 

а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1996т-2000 гг. и информатизации исследований в Институте русского языка АН СССР».

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Руководителями Отдела были последовательно член-корреспондент АН СССР Ю.Н. Караулов

а(1985-1991 гг.), доктор филологических наук В.М. Андрющенко (1992-1998 гг.), профессор,

С

доктор филологических наук А.Я. Шайкевич (1998-2006 гг.). В создании МФРЯ принимали

участие более 40 организаций-соисполнителей, среди них Московский, Санкт-Петербургский, Харьковский, Гродненский, Сыктывкарский и Саратовский университеты. В 2006 г. Отдел был ликвидирован, работы по развитию МФРЯ продолжаются в рамках отдела корпусной лингвистики и лингвистической поэтики, которым руководит член-корр. РАН В.А. Плунгян.

В основе концепции, выработанной 1-ой Всесоюзной конференцией по созданию МФРЯ 1983 г., лежали две взаимосвязанные главные задачи: 1) создание компонентов лингвистического обеспечения задач информатики и 2) информатизация научных исследований

13

 

в русистике. В соответствии с этим в качестве базовых компонентов МФРЯ

были определены:

 

источники

 

на

 

машинных

носителях

и

в

базах данных;

лингвистические

программно-

 

источниковые пакеты; компьютерные технологии подготовки научных трудов. На создание

 

этих продуктов были направлены первоочередные усилия разработчиков МФРЯ.

 

 

 

 

 

 

Уже на первом этапе создания МФРЯ (1985—1992 гг.) были накоплены

на машинных

 

носителях и частично в базах данных текстовые источники русской

литературы XIX-XX вв.,

 

главнейшие словари русского языка, Краткая академическая

грамматика,

некоторые другие

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

материалы справочного характера, созданы текстовые корпуса поэзии, художественной прозы,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

общественно-политических и технических текстов.

Были разработаны две подсистемы пакетаг

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

к

 

 

UNILEX на персональных компьютерах (под MS DOS): текстоориентированная подсистема –

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

UNILEX-T (разработчик

Ж.Г. Аношкина), предназначенная для создания частотных слосарей,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ш

 

 

 

 

словоуказателей (индексов слов к текстам) и конкордансов, и словарная

подсистемае

 

UNILEX-D (разработчик

Л.И. Колодяжная) – для создания

 

 

словарных баз данных и работы с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

ними. Было создано несколько программно-источниковых пакетов, таких как Автоматическийы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р

 

 

 

 

 

 

Синтаксический словарь русского языка,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

Автоматический словарь синонимов усского языка,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ч

 

 

 

 

 

 

 

 

Автоматический вариант Словаря

 

русского языка С.И. Ожегова,

Автоматический словарь

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Г

 

 

 

 

 

 

 

 

 

 

глагольного

управления

 

в

русском языке и др.;

разработаны технологии.

редакционно-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

издательской подготовки научных трудов и продуктов Машинного фонда русского языка.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Н

 

 

 

 

 

 

 

 

 

 

 

Одним из удачных примеров реализации идей МФРЯ был созданный под руководством

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

проф. Н.Н. Пшеничновой автоматический вариант Диалектологического атласа русского языка.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

 

 

 

 

 

База данных Диалектологического атласа представляет собой матрицу (характеристическую

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

м

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

таблицу), в которой число строк равно числу обследованных пунктов, а число столбцов – числу

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

языковых признаков, наличие или отсутствие которых характеризует соответствующие пункты.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

все

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

По наименованию пункта можно было получить

т

 

характеризующие его признаки,

а по

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

наименованию признака –

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Описание БД

 

список пунктов, в которых этот признак отмечен.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ДАРЯ приведено в издании [Андрющенко 1989].

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Наряду с работой по наполнению источниковойе

базы МФРЯ, разработкой программных

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

пакетов и компьютерных технологий для обработки лингвистических данных проводилось

 

 

 

 

 

 

 

 

 

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

обучение филологов информатике,

методамн

автоматизации филологических исследований,

 

 

 

 

 

 

 

 

 

 

 

 

й

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

работе с компонентами Машинного фонда русского языка.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Еще в 1980-е гг.,

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

на начальном этапе разработки проекта МФРЯ, были выдвинуты

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

важные теоретические идеи,

сохраняющие

свою

актуальность для дальнейшего развития

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

корпусной лингвистики (о корпуснойе

лингвистике см. лекцию 3).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

МФРЯ планировал я и реализовывался прежде всего как словарная база данных. В

 

 

 

 

 

 

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

соответствии с «лексикографической идеологией»

 

вся

 

информация

МФ

должна

была

 

 

 

 

 

 

д

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

группироваться

вокруга

слова, представлять

собой

 

базу

 

 

данных,

в

 

которой

содержатся

 

 

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

всевозможные

 

с

 

 

о

слове:

его

грамматические,

 

стилистические,

фонетические,

 

 

ведения

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

контекстуальные и т.п. характеристики, сведения о разнообразном варьировании слова, в том

 

 

 

г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

й

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

числе поэтическом, диалектном, диахронном варьировании. Эти положения изложены в статье

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ю.Н. Караулова «Методология лингвистического исследования и машинный фонд русского

 

к

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

языка» в борнике [Машинный фонд… 1986]. Для построения словарно-грамматической базы

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

данныхвпредлагалось перевести академические словари и грамматики в электронную форму;

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

создать автоматически пополняемые словоуказатели и словари на базе текстов делового и

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

азговорного стилей, научно-технической литературы и документации; соединить в единый

аязыковой фонд данные об общеупотребительном языке и данные терминологических фондов;

С

создать специальные программы машинной обработки лингвистического материала.

 

 

 

 

Лексикографическая ориентация МФРЯ не препятствовала параллельному

 

формированию его «текстовой идеологии», согласно которой в МФРЯ в качестве его

 

обязательной части должны были войти массивы (корпуса) текстов, представляющие

 

подъязыки русского языка – его функционально-стилистические разновидности, различные

 

сферы общения (Ю.Н. Караулов, Б.Ю. Городецкий,

А.С. Герд,

С.И. Гиндин, В.И. Перебейнос).

 

Обсуждалась и возможность текстоориентированнной разработки МФРЯ. Ср.: «основной

 

единицей хранения в фонде должна быть не лексическая единица, а текст (Ю.К. Орлов);

14

 

«тексты – то единственное первичное, достоверное, фактическое в языке, что вводится в

 

машину (А.Я. Шайкевич); о диалектологическом подфонде МФРЯ: «машинный фонд может

 

ориентироваться только на полные магнитофонные записи диалектных текстов» (А.С. Герд);

 

текстовые диалектологические корпуса отдельных говоров должны составить основу

 

диалектологического подфонда МФРЯ (В.Е. Гольдин).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

И все-таки первоначально в структуре МФРЯ текстовым корпусам отводилась

 

иллюстративная

роль,

 

текстовый

подфонд был

обозначен

 

 

как

«иллюстративно-текстовый»

 

[Андрющенко 1989].

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

 

 

 

Актуальными

 

 

для

 

современной

 

 

компьютерной

 

 

лингвистики

 

 

остаютсяг

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

к

 

 

сформулированные на конференциях по созданию МФРЯ общие принципы организации МФ:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

вс

 

 

 

 

 

автоматизированная система,

представляемая в МФРЯ, «должна быть адек атной и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ш

 

 

 

равнообъемной живому организму языка, но в то же время она должна быть анатомические

 

отпрепарированной, разъятой,

доступной

для

наблюдения,

 

изучения

 

и изменения» (А.П.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

Ершов);

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р

ы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

 

 

– «фонд должен быть не просто банком данных, а творческой лаборато ией. Это значит,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ч

 

 

 

 

 

 

 

 

что лингвист, пользующийся фондом,

не ограничивается наведением справок, а находится в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Г

 

 

 

 

 

 

 

 

 

 

собственно

 

исследовательской

 

позиции»,

 

 

имея

возможность .перекомбинирования,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

переконцентрации материала, возможность получения новых классификаций. Все это, в свою

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Н

 

 

 

 

 

 

 

 

 

 

 

 

очередь, обеспечивается «на основании максимально разветвленной и дробной параметризации

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

языковых данных и явлений» (Ю.Н. Караулов);

 

 

 

 

 

 

 

е

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

– в МФРЯ должен быть осуществлен принцип всесторонности и междисциплинарности

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

м

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

информации,

связанной

с

русским языком, фонд

 

 

и

 

 

включать

не

только

собственно

 

должен

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

лингвистические данные,

но и

учитывать

лингво-куль урную

и

историко-этнографическую

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

информацию (Ю.Н. Караулов, В.Е. Гольдин).

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Уже при первоначальной постановке задачи создания МФ подчеркивалось, что МФ – это

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

не только современная форма представления языкового материала, но и путь «к смене научной

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

парадигмы

в

 

лингвистике»,

 

возможностьеперехода

«от

 

наблюдательного

 

периода к

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

измерительному» (А.П.

 

Ершов). Обеспеч вая полноту данных, позволяя исследователю «не

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ограничиваться

образцами реализациинтого или иного правила, явления, иллюстрациями

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

й

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

проявления какого-то признака, приблизительными обозначениями некоторой материальной

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

области языковой структуры, а в каждом конкретном случае получать точное знание, доходить

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

до исчерпывающего перечня всех элементов соответствующего множества» (Ю.Н. Караулов),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

использование

МФРЯ

должное , по

мысли

его

инициаторов,

 

иметь

 

методологические

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

последствия: раздвинуть границы понимания самого объекта (русского языка), увидеть его в

 

 

 

 

 

 

 

 

 

 

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

новом ракурсе, выявить «белые пятна».

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

д

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Известно, что ниаодна научная парадигма не реализуется до конца, полностью. Обычно в

 

 

 

 

 

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ее недрах вызревают идеи сменяющей ее новой парадигмы, призванной разрешить трудности и

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

противоречия предыдущей. Проект Машинного фонда русского языка был своеобразной

 

 

 

 

 

 

г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

научной

 

й

 

 

 

 

 

 

Реализовать

ее

 

полностью

не

 

удалось.

 

 

Единого

 

комплекса,

 

парадигмой.

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

обеспечивающего информатизацию русистики, каким представлялся будущий Машинный фонд

 

 

 

 

к

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в начале работ по его созданию, сегодня не существует, но накопленные в нем материалы

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

пост

вянно используются; работают и программные продукты Машинного фонда, а связанные с

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

М шинным фондом научные идеи воплощаются в новых крупных проектах, в том числе – в

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Национальном корпусе русского языка.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а

 

 

5. Рекомендации и задания.

Для приобретения хотя бы самой общей,

первичной,

С

ориентации в

лингвистических ресурсах рекомендуется,

во-первых, пройти по

 

ссылкам на

 

Интернет-ресурсы, приведенным в тексте

 

лекции.

 

 

Во-вторых, полезно попробовать

 

самостоятельно отыскать в Сети ссылки на ресурсы, соответствующие той или иной

 

лингвистической тематике. В поиске необходимых лингвистических ресурсов большую

 

помощь

оказывают информационно-поисковые

 

системы:

 

Яndex

 

(www.yandex.ru),

Rambler

 

(www.rambler.ru), Апорт (www.aport.ru), Google (www.google.ru), Yahoo (www.yahoo.com), Copernic

 

(www.copernic.com) и др. Они позволяют находить не только отдельные лингвистические

 

источники,

но

и группы таких

источников,

в

 

том

числе

списки

 

«полезных

ссылок»,

15

 

представленные на многих сайтах и лингвистических порталах. Хотя часть ссылок со временем

 

неизбежно устаревает и перестает работать, а пополнение списков новыми данными не всегда

 

происходит, собрания полезных ссылок являются важным средством, поддерживающим работу

 

лингвистов. Их ценность состоит в том, что они обычно тематически организованы и помогают

 

пользователю обнаруживать дополнительные ресурсы, относящиеся к актуальной для него

 

проблеме.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Подробный и – что очень важно – хорошо ориентированный на нужды лингвистов

 

о

 

список рекомендуемых ссылок представлен Институтом лингвистики РГГУ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(http://il.rsuh.ru/links.html). В него входят Интернет-адреса сайтов образовательных учрежденийг,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

к

 

 

институтов РАН, международных лингвистических организаций и конференций,

 

 

вс

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

лингвистических рассылок и дайджестов, лингвистических корпусов по многим языкам мира,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ш

 

 

 

 

словарей и других баз данных. Завершается список адресами домашних страниц большогое

 

 

числа зарубежных и российских лингвистов, это позволяет знакомиться с перечнями их работ и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

скачивать отдельные научные и методические материалы.

 

 

 

 

 

 

 

е

ы

 

 

 

 

 

 

Детально

 

разработанный список

ссылок

на

 

лингвистические

 

 

рИнтернет-ресурсы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ч

 

 

 

 

 

 

 

 

предлагается на сайте Лаборатории общей и компьютерной лексикологии и лексикографии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Г

 

 

 

 

 

 

 

 

 

 

 

филологического факультета Московского государственного университета.

 

им. М.В.

 

Ломоносова (http://www.philol.msu.ru/~lex/links.htm). Он включает ссылки.

на лингвистические

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Н

 

 

 

 

 

 

 

 

 

 

 

 

 

сайты, ресурсы по русскому языку и иностранным языкам (словари, текстовые базы данных и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

корпуса),

 

на крупные

лингвистические

центры

и науч ыеи

проекты,

 

научные фонды,

 

библиотеки, личные страницы лингвистов.

 

 

 

 

 

 

 

и

е

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Добротный список ссылок на славистические изданмя, библиотеки, издательства можно

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

найти на сайте «RUTHENIA» (http://www.ruthenia.ru/web/index.html) Тартуского университета.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Многочисленные

 

собрания

ссылок

 

 

 

 

 

 

 

т

 

 

ресурсы размещены на домашних

 

 

 

на лингвистич ские

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

страницах исследователей и разработчиков, в

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о таве отдельных публикаций. Так, большой

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ссылочный

материал и

полезные

советы

по

лингвистическому поиску

 

в Сети

 

содержит

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

публикация профессионального переводчикаеЮ.В. Тиссена «Интернет в работе переводчика»

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(http://zhurnal.lib.ru/w/wagapow_a_s/tissen.shtml). Группой авторов (Ю.А.

 

Загорулько,

И.С.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Кононенко,

Е.Г.

Соколова)

создан

Интернетн

-портал знаний по компьютерной лингвистике

 

(http://uniserv.iis.nsk.su/cl).

 

 

 

й

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

х сведений выполните следующие задания:

 

 

 

 

 

 

 

Для закрепления получе

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.

 

Откройте

в

Интер ете

 

ресурс

 

 

«Рукописные памятники

 

 

Древней

Руси»

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(http://www.lrc-lib.ru/?id=1) и еознакомьтесь

с

 

 

представленными

 

на

его

 

 

главной

 

странице

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

сведениями о Некоммерчетком Партнерстве «Рукописные памятники Древней Руси».

 

 

 

 

 

Выясните:

 

 

 

д

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а) каковы целиаНекоммерческого Партнерства «Рукописные памятники Древней Руси»;

 

 

 

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б) чем обеспечивается научность информации, распространяемой Некоммерческим

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Партнерством «Рукописные памятники Древней Руси»;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

й

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в) каковы принципы взаимодействия Некоммерческого Партнерства «Рукописные

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

памятники Древней Руси» с правообладателями памятников;

 

 

 

 

 

 

 

 

 

 

 

 

 

к

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

г) каким образом обеспечивается защита представленных на сайте изображений от их

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а

внесанкционированной перепечатки?

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

д) какие типы рукописных памятников Древней Руси представлены на сайте?

 

 

 

 

 

р

 

 

 

 

Перейдите по ссылке на сайт «Древнерусские берестяные грамоты» и

 

2.

 

 

 

 

аознакомьтесь с представленной на нем информацией.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

С

 

Выведите

 

на

экран

и изучите грамоту

590.

Установите,

что

 

дает пользователю

открытие фотографии грамоты в новом окне (1680x540 px). Удается ли при этом различить написанный на бересте текст? Предусмотрено ли дополнительное увеличение изображения? Что это дает?

Представлен ли в базе текст данной грамоты с разделением его на слова? Доступен ли перевод данной грамоты?

Как документирована грамота (сведения о месте обнаружения, предположительной датировке грамоты, указание на ее тип и т.д.)?

16

3. Перейдите в Базу данных сайта «Древнерусские берестяные грамоты». Используя предложенный на сайте поисковый аппарат, получите список целых грамот жанра письмо, которые отнесены к 1050-1075 гг. и найдены в любом из новгородских раскопов. Выберите из списка грамоту «От Рожнета к Коснятину» и ознакомьтесь с представленной о ней информацией. По собственному выбору запросите в базе информацию о грамотах других жанров, другого типа сохранности, о грамотах, отнесенных к другим периодам времени, о грамотах, найденных не в Новгороде.

 

 

 

Ответьте на вопросы:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

 

 

а) какие именно данные,

относящиеся

 

к древнерусским

берестяным

грам тамг,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

к

 

 

сосредоточены в базе «Древнерусские берестяные грамоты»;

 

 

 

 

 

 

 

 

 

вс

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б) по каким параметрам организован поиск грамот в базе «Древнерусские берестяные

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ш

 

 

 

грамоты»;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

в) допускается ли указание в запросе сочетания нескольких параметров;

н

 

 

 

 

 

 

г) можно ли указывать в запросе одновременно несколько значений одногоыпараметра;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

д) является ли база завершенным электронным ресурсом или продолжаетр пополняться и

 

уточняться;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Г

Ч

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е) каковы источники информации, представленной на сайте;

 

.

 

 

 

 

 

 

 

 

ж) какова роль прорисей в расшифровке текстов берестяных грамот.

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Н

 

 

 

 

 

 

 

 

 

 

 

 

з) являются ли прориси источником первичного типа (обоснуйте своѐ мнение)?

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

Выясните,

какие

научные

 

тексты опубликованы

на сайтеи

и

в

 

 

каком

формате, как

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

 

 

 

построен библиографический указатель, что представляет собою «Кумулятивная библиография

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

трудов о берестяных грамотах».

 

 

 

 

 

 

 

 

 

 

т

м

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дайте

краткое

описание ресурса «Древнерусские берестяные грамоты» в виде

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ответов на предложенные выше вопросы.

 

 

 

и

е

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Лите атура

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Основная:

 

 

 

 

 

 

 

 

 

 

 

 

и

е

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Бовтенко М.А. Компьютерная лингводидакт ка. – М.: Наука: Флинта, 2007.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Всеволодова А.В. Компьютерная обработканлингвистических данных. – М.: Наука: Флинта,

 

 

 

 

2007.

 

 

 

 

 

 

 

 

 

 

й

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Зубов А.В., Зубова И.И. Информационные технологии в лингвистике. – М.: Издательский центр

 

 

 

«Академия», 2004.

в

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Машинный фонд русского языкае

: идеи и суждения. –

М., 1986.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дополнительная:

 

д

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Андрющенко В.М. Концепцияа

и архитектура машинного фонда русского языка. М.: Наука, 1989.

 

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Андрющенко

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(научно-

 

В.М. Машинный фонд русского языка: Интеграционный подход

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

методический материал). М.:, 1989.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

й

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Аношкина Ж.Г. Подготовка частотных словарей и конкордансов на компьютере. – М., 1995.

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Гуманитарные исследования в Интернете / Под ред. А.Е. Войскунского – М., «Можайск–

 

 

 

к

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Терра», 2000.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Лукашевич Н.В., Добров Б.В. Тезаурус для автоматического концептуального индексирования

 

а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р

т

как особый вид лингвистического ресурса

// Труды Международной

конференции

 

 

ДИАЛОГ-2001 –

М., 2001.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

аПоляков В.Н. Использование технологий, ориентированных на лексическое значение, в задачах

С

 

 

поиска

и

классификации

 

// Scripta linguisticae

 

applicatae.

Проблемы

прикладной

лингвистики. Вып. 2. М., 2004.

17
Лекция 2. Лингвистические аспекты гипертекстовой коммуникации
1. Введение.
2. Лингвосемиотические предпосылки гипертекстовой коммуникации.
3. Лингвистические средства системной организации
структурированных гипертекстов. го о 4. Рекомендации и задание. к
5. Литература. вс
1. Введение. Существуют различные определения гипертекста, но они швеосновном опираются на одну и ту же группу понятий: ‘текст’, ‘фрагмент’, ‘связь’, ‘ссылка’, и самое
общее представление о гипертексте сводится к тому, что это текстн, относительно р самостоятельные фрагменты которого связаны между собой явным обеазом с помощью
специальных ссылок. Ч . При таком широком понимании гипертекста он не обязательноГдолжен быть реализован
на основе компьютерной технологии: гипертекстами можно считать. , например, тексты кодексов законов в совокупности с множеством комментариевиН к ним, если каждый комментарий содержит явную ссылку на тот или иной комментируемыйн закон. В качестве гипертекста при таком его понимании можно рассматриватьмеи любой текст, состоящий из ряда частей, глав, разделов и т.п., если при нем имеется оглавлениеи с соответствующими номерами страниц, отмечающими пути перехода к каждой его част . Широкое понимание гипертекста не противоречит узкому, ограничивающему существованиете гипертекста компьютерной средой, но удобно тем, что позволяет обнаружить связи междуси общими тенденциями развития речевого общения и теми специфическими возможностямир организации письменного общения, которые предоставляют компьютерные технологии. ве
Представление об относительностини границ текста, предполагающее возможность подходить к тексту и как к целому, и одновременноу как к части другого целого, далеко не ново: его проявление можно видеть ужейв такой, например, сложившеюся в глубокой древности работе с текстами, как собираниеныи структурирование библиотек, архивов или составление сборников, включающих текстынсходной направленности. Во 2-ой пол. XX в. это представление
актуализировалось, обогатилосьве новыми связями и развилось в понятие ‘гипертекст’ в связи т с результатами разработкис компьютерных технологий, использующих стандартные способы
реализации текстовой относительностир , обеспечивающие мгновенность переходов по ссылкам а и возможность соз дав ть гипертексты немыслимых ранее структур и размеров. у Актуализацияс этих представлений выразилась в том, что теперь относительность
границ текстагостала осознаваться как одно из главных его свойств. Одновременно
изменилисьйтипы связываемых фрагментов, или гипотекстов; другими стали коммуникативные и роли авторак и получателя текстов; изменился характер создания, обработки, обслуживания и
потреблениявс текстов. Таким образом, внедрение гипертекстовых технологий затронуло саму
структуруо коммуникации, и сегодня под гипертекстом понимают и реализованный в т компьютернойа среде текст с относительно самостоятельными фрагментами, связанными
арс помощью специальных ссылок, и компьютерные технологии, поддерживающие создание и С использование таких текстов, и новую сферу общения, складывающуюся и функционирующую
на основе гипертекстовых технологий.
Историю гипертекста обычно начинают с 1945 г., когда в журнале «The Atlantic Monthly» появилась статья В. Буша (Vannevar Bush), бывшего советника по науке президента Ф. Рузвельта, «As we may think», в которой он описал настольную механическую систему Меmех, использующую технологию микрофильмирования и позволяющую устанавливать и сохранять связи между отдельными текстами, делать пометки на полях «страниц», присоединять к текстам комментарии и использовать все это как единую систему хранения информации. Автору системы представлялось, что таким или сходным образом работает на

18

 

основе ассоциативных связей и человеческий мозг и может строиться объединенная

 

информационная среда.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так была заявлена идея гипертекста, но до 60-х годов ни соответствующей

 

компьютерной технологии, ни самого термина «гипертекст»

 

еще не существовало. Термин

 

«гипертекст» был введен

 

Т. Нельсоном (Theodor Holm Nelson) в 1965 г. в связи возникшей

 

необходимостью определить специфику системы, предназначенной обслуживать на основе

 

компьютерной

 

технологии

множество

текстов

 

со

связывающими

их переходами.

Началась

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

разработка

специальных программных

средств

 

для

 

создания

и

поддержки

гипертекстовых

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

систем и их стандартизация. В 1990 г. сотрудник Европейского центра ядерных исследованийг

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

к

 

 

в Женеве Тим Бернерс-Ли (Tim Berners-Lee) разработал сетевой протокол передачи документов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

вс

 

 

HTTP (HyperText transfer protocol)

и язык гипертекстовой разметки HTML (Hypertext Markup

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ш

 

 

 

 

Language). Их применение, а также создание и совершенствование специальных

ебраузеров

 

открыли эру «Всемирной паутины» (World Wide Web), как определил Бернерс-Ли новую сферу

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

интеллектуального взаимодействия на базе гипертекстовых технологий.

 

р

ы

 

 

 

 

 

 

 

 

 

Последовавшее бурное развитие гипертекстовых систем,

 

 

 

 

е

 

 

 

 

 

 

 

 

 

 

 

 

с одной сто оны, несомненно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ч

 

 

 

 

 

 

 

 

 

 

обязано

совершенствованию

компьютерной

техники

и

 

информационных

 

технологий, без

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Г

 

 

 

 

 

 

 

 

 

 

 

которых

было

 

бы

невозможно

создание

и

функционирование

современных.

гипертекстов.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

С другой стороны,

столь же несомненно,

что развитие гипертекстовых систем обусловлено

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Н

 

 

 

 

 

 

 

 

 

 

 

 

информационными потребностями общества и всей историей знаковой репрезентации речи, а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

это уже входит в сферу интересов лингвистики.

 

 

 

 

 

 

 

 

 

 

е

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ниже из всего

 

комплекса проблем,

связанных с гип ртекстовой коммуникацией, мы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

м

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

сосредоточимся на

двух:

во-первых, на

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

предпосылках

 

развития

 

лингвосем отических

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

гипертекстовой

коммуникации

и,

во-вторых,

 

на

 

 

лингвистических

средствах

системной

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

организации структурированных гипертекстов.

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.

Лингвосемиотеческие

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

предпосылки

 

г пертекстовой коммуникации. Из числа

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

особенностей

 

коммуникации

на

гипертекстовой

 

основе, соответствующих

ее

главным

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

принципам, обратим внимание на следующие:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а)

на нелинейность композиции г пертекста (включенные в текст ссылки позволяют

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

«разветвлять» движение по тексту, выбиратьн

ту или иную последовательность ознакомления

 

с его частями),

 

 

 

 

 

 

 

 

 

 

й

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б)

на относительность

н

 

гипертекста

и

текстов

 

в

составе гипертекста (текст,

 

 

 

 

 

границ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

связанный

ссылками

 

с другими

текстами,

сохраняя

 

некоторую

автономность,

вместе

с тем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

структурно

и содержательноестановится

частью большего образования, и его собственные

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

границы теряют абсолютный характер),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в) на особую значимость роли читателя по отношению к гипертексту (именно читатель,

 

 

 

 

 

 

 

 

 

 

 

д

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

выбирая одни связи иаобавляя другие, формирует в конечном счете гипертекст).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Являются

 

 

 

ли

 

 

эти

 

 

коммуникативные

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

г

 

 

 

 

 

 

 

 

 

 

 

особенности совершенно новыми? Чем обусловлена

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

й

 

 

 

 

 

 

 

 

 

 

 

 

 

потребность

в

 

 

именно

 

таком

 

типе

обмена

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

к

 

 

 

 

 

 

 

 

 

 

 

 

 

 

письменными сообщениями?

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Обратим прежде всего внимание на то, что

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

для

одной

 

 

из

 

 

самых

древних

 

систем

 

передачи

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

сообщений

 

 

– пиктографии,

 

не

 

существовало

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

проблемы

 

 

 

линейности

 

текста.

 

Простейшее

а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

«рисуночное» письмо не имело «начала» и «конца» и

С

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

выражало

 

передаваемое

содержание

связью

всех

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

своих компонентов в целом. Это

 

свойство

 

 

Рисунок 6. Письмо индейца-чейена (по И.Е. Гельбу)

 

 

пиктографии

 

 

прослеживается

 

 

даже

 

в

 

тех

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

пиктографических посланиях, которые создавались

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

неграмотными

 

 

 

 

 

представителями

 

 

племен

 

американских индейцев уже в новое время, в эпоху преобладающего использования других

 

систем письма.

Таково, например, письмо индейца из племени чейенов по имени Черепаха-

19

 

Следующая-За-Своей-Женой, которое он отправил по почте в обычном конверте сыну по имени

 

Маленький Человек одновременно с переводом на его счет суммы в 53 доллара (см. Рис. 1).

 

 

 

 

 

 

И.Е. Гельб, воспроизводящий в своей монографии (Гельб 1982) данное письмо,

 

раскрывает его содержание следующим образом: «Над фигурой человека, нарисованного слева,

 

изображена черепаха, идущая вслед за своей женой и соединенная линией с головой этого

 

человека, а над фигурой человека справа изображен маленький человек, от которого также

 

проведена линия к голове этого второго человека. Над правой рукой этого второго человека

 

нарисован еще один маленький человечек, поза которого изображает прыжок или движение в

 

сторону Черепахи-Следующей-За-Своей-Женой, – человека, изображенного слева; от рта

 

го

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

к

 

последнего отходят две линии, загнутые на концах как бы углом или крючком, словно он тянетэто

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

вс

 

 

маленькую

 

фигурку

 

к

себе.

 

Эта

 

часть

рисуночного

послания,

очевидно,

 

и

составляет

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ш

 

 

 

 

содержание письма, то есть означает: ‘приезжай ко мне’. Более же крупные фигурые

и их

 

личные тотемы обозначают адресата и отправителя. Вверху между двумя крупными фигурами

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

нарисованы 53 круглых предмета, под которыми подразумеваются 53 доллараы. Оба индейца

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

изображены

в

набедренном

 

одеянии,

указывающем

 

на

 

их принадл жностьр

к

племени

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ч

 

 

 

 

 

 

 

 

 

чейенов…»

(Гельб

1982:

 

39). Как

сообщает

исследователь,

сын

Черепахи-Следующей-За-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Г

 

 

 

 

 

 

 

 

 

 

 

Своей-Женой понял содержание письма и сразу отправился за отправленными.

на его счет

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

долларами.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Благодаря изображенным

 

в

 

письме

 

человеческим

 

фигуркам

 

оно

получает

 

для

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

нас естественную ориентацию по вертикали. Следует ли, однакои, читать его слева направо или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

 

 

 

 

 

 

справа налево (напомним о существовании систем письма, располагающих текст справа налево

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

м

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

иным образом),

по

 

вертикали

или

 

вращая,

 

 

и

 

 

неизвестным

и,

 

по-видимому,

 

 

 

остается

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

несущественно.

Неясен

и

 

порядок сообщений

о двух ситуациях, отображенных в письме:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ситуации смены собственности (присылка сыну 53 долларов) и ситуации приглашения к отцу:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

этого порядка просто нет.

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пиктография

отображала

не

 

речь,

а

смысл

 

сообщения.

Однако,

как

известно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

историческое развитие систем письма совершалосье

в значительной мере в сторону все более

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

точной репрезентации ими внешней стороны речи, в том числе и такого ее свойства, как

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

линейность.

Линейность

 

постепенно

 

сталан

существенной характеристикой письменных и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

й

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

отдельных видов устных текстов (текстов ораторской речи, например) и закрепилась в виде

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

представлений об

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

их композиции. Ср. жесткий состав частей и порядок их следования в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

деловых документах и

 

не ме ее

 

важные,

но по-другому

реализуемые

 

композиционные

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

требования к литературно-художественныме

текстам.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

енденция «пред-гипертекстовой» коммуникации – придание всѐ

 

 

 

 

 

Вторая характерная

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

большего значения авто ству текстов и развитие представления об авторской точке зрения как

 

 

 

 

 

 

 

 

 

 

 

д

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

факторе, организующема

 

текст

 

и

выражающем

 

его

цельность.

История

культуры

 

 

 

 

 

 

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

свидетельствует о том, что современные представления об авторстве текстов, как и текстовая

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

линейность, складывались постепенно. Они явились следствием множества коммуникативных

 

 

 

 

 

 

 

г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

й

 

 

 

 

 

 

 

 

 

 

 

с одной

стороны,

 

процессы

усиления

роли

 

письменной

 

факторов, которыми были,

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

коммуникац и

 

в

сравнении

с устной,

укрупнения

 

и

 

усложнения

текстов,

развития

 

 

 

 

 

к

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с другой стороны, – обострение внимания к

 

возможностей их массового тиражирования и,

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

чел

веческой личности и повышение ценности индивидуального начала в общении.

Всѐ это

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

придавало авторскому тексту свойства большей выделенности,

 

укрепляло идею авторства и

 

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

самостоятельности, обособленности в континууме коммуникации.

 

 

 

 

 

 

 

 

 

 

 

 

а

 

 

 

Одновременно

 

с формированием

представления

об

авторе

письменного

текста

как

С

субъекте, создающем текст и имеющем на него особые права, формировалось и

 

соответствующее ему представление о читателе как потребителе текста, лишенном права

 

вносить в текст собственные изменения. Исторический процесс разделения коммуникантов на

 

авторов и потребителей текстов нашел, в частности, яркое проявление в истории русских

 

словарей,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Словари, отмечавшие и толковавшие слова иноязычного происхождения,

 

развивались

 

первоначально на основе заметок на полях, глосс, которые делались читателями, копировались

 

переписчиками текстов и со временем стали сводиться в словарные списки, упорядоченные по