Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
11-15.doc
Скачиваний:
8
Добавлен:
14.08.2019
Размер:
105.47 Кб
Скачать
  1. Соотношение описываемых единиц со словом: равны (слово, лексема), меньше (корни, служебные морфемы), больше (цитаты, пословицы)

  2. По форме, в которой представлен словарь: компьютерный, полиграфический

  3. Эпоха, описываемая словарем:

    • современные

    • исторические: проспективные (этимологический), перспективные (словари новых слов и значений)

  1. По способу упорядочивания входов:

    • прямой (алфавитный порядок)

    • обратный (напр., гр. словарь Зализняка)

    • частотный (для того, чтобы делать учебники, напр.)

    • аналогические словари (по семантическим полям)

    • тематические

    • алфавитно-гнездовой порядок (по родственным словам, напр. Словарь Даля)

  1. Отображение реалий:

  • реальный мир

вымышленный (напр., словари писателей)

Основные структурные компоненты словаря

1. Словник: сюда включаются все ед-цы, которые формируют область описания словаря и являются входами словарных статей. Отдельно обычно не выделяется. Может состоять из морфем (для словарей морфем и грамм. словарей), лексем (для тс), словоформ (для грамм-ких словарей) и словосочет. (для фразеол. словарей, идиом, синтагм).

2. Словарная статья — элементарная ед-ца словаря. Каждый отдельно взятый объект описания словаря и сопоставл. ему словарные характер-ки.

3. Указатели, или индексы. В тс указатели встречаются редко. Но часто в сл. фразеол. и идиом. Для облегч. поиска нужной идиомы во фразеол. словарях создаются указатели, которые позволяют находить идиому по любому из ее компонентов. Часто включаются и в структуру тезаурусов и двуязычных сл.. Указатели тезауруса дают возможность определить, в какие таксоны входит то или иное слово, а указатели двуязычных словарей отчасти выполняют функции обратного словаря по отношению к данному.

4. Список источников. Необходим, ибо использование любых уже опублик. текстовых материалов (в том числе в примерах) требует соответств. разрешения от держателя авторского права.

5. Вводная статья: как пользоваться словарем + info о структуре словарной статьи. Иногда структура словарн. статьи выносится в особый раздел словаря.

6. Список условных сокращений и алфавит.

Компьютерная поддержка создания и использования словарей.

Компьютерная поддержка лексикографических работ.

Специальные программы — базы данных, компьютерные картотеки, программы обработки текста — позволяют в автоматич. режиме формировать словарные статьи, хранить словарную info и обрабатывать ее.

Компьют. лексикогр-е прогр. делятся на 2 группы:

- программы поддержки лексикографических работ (ППЛгрР),

- автоматические словари (АС) разных типов, включающие лексикографич. базы данных.

ППЛгрР: традиционная форма фиксации словарных данных — каталожная карточка, где указывается описываемое слово, пример употребления, источник примера, автор, дополн. инфо. Комп. технологии позволяют упростить процесс сбора и хранения лексикогр. инфо, используя вместо картотеки базу данных. В отличие от обычной картотеки, записи базы данных дают возможность автоматически сортировать массив по выбранным параметрам, отбирать нужные примеры, объединять их в группы и т. д. Спец-ных лграф. баз данных нет. Но базы данных типа D-Base, ACCESS, FOX-Base, PARADOX вполне подходят.

#ЗАПИСЬ 28982 ID {идиома}

у черта на куличках EXAMPLE {пример}

поперся к Баранову к черту на кулички

SOURCE {источник}

Шапка

AUTH {автор} Войнович В.

Этап поиска примеров на слово и формирование картотеки примеров. В традиц. технологии сбор примеров производится вручную и отнимает много t. Компьютерные программы дают возможность выбирать примеры на нужное слово из корпусов текстов, хранящихся в машинном формате на компьютере, в автоматич режиме. Поиск примеров на употребл слова называется построением конкордансов. Некоторые компьютерные программы построения конкордансов по желанию пользователя могут преобр. найденные контексты в записи базы данных. # DIALEX позволяет получать конкордансы как в традиц форме (в виде файла для текстового редактора), так и в формате базы данных PARADOX.

После подготовки первичного словарного материала — словарной картотеки — следует этап составления словарной статьи. Новая словарная статья вводится в базу данных. Редактирование словарных статей также происходит в базе данных. Все это сокращает время разработки словаря, ибо упрощается обработка системы отсылок, в автомат режиме происходят сортировки (в том числе алфавитизация слов статей), легко порождаются различные указатели. Для редактирования словаря можно привлекать компьютерные программы проверки орфографии.

Последний этап — формирование текста словаря, создание оригинал-макета книги — тоже облегчается. ПО позволяет выдать текстовый материал сразу из базы данных с разметкой под топографематические выделения. Поля записи базы данных трансформируются в автоматическом режиме в зоны словарной статьи с соответствующими шрифтами, кеглями, курсивом, подчеркиваниями и пр.

Традиционная технология

Компьютерная технология

  1. Формирование словника словаря

  2. Поиск примеров и формирование картотеки примеров

  3. Написание словарных статей

  4. Создание рукописи словаря

  5. Перепечат. рукописей

  6. Редактирование слов. стат.

  7. Авторская доработка

  8. Перепечатка рукописи

  9. Корректура

  10. Перепечатка рукописи

  11. Набор, верстка

  12. Корректура

  13. Печать словаря

  14. Словарь

  1. Формирование корпуса текстов

  2. Автоматическое формирование корпуса примеров

  3. Написание словарных статей

  4. Ввод словарных статей в базу данных

  5. Редактирование словарных статей в БД

  6. Корректура текста в БД

  7. Порождение текста словаря и формир. оригинал-макета

  8. Печать словаря

  9. Словарь

Для создания оригинал-макета (верстки) словарей существуют специальные издательские системы: например, пакет программ Quark-X-Press, различные версии программ Page-Maker и WinWord. Позволяют редактировать и верстать текст, изменять стили и оформление текста, положение на странице и т.п.

Автоматические словари - словари в машинном формате, бывают:

- автоматические словари конечного пользователя-человека (АСКП),

- автоматические словари для программ обработки текста (АСПОТ).

АСКП по интерфейсу и структуре словарной статьи отличаются от АС, включ. в системы машинного перевода и т. д. Чаще всего они — компьют. версии хорошо известных обычных словарей. #компьют. аналоги толковых словарей англ. яза (автоматич. Версия ТС «Коллинз», автом. вар. «Нового большого англо-русск. словаря» Апресяна), компьют. версия словаря Ожегова. АСКП почти повторяют структуру словарной статьи обычных словарей, но есть преимущ-ва: многие АСКП позволяют сортировать данные по полям словарной статьи, проводить автоматич. поиск всех вокабул, имеющих в толковании определенный семантический компонент и т. д.

АСПОТ обычно не предназн. для пользователя. Особенности их структуры, сфера охвата словарного материала задаются теми программами, которые с ними взаимодейств. #количество зон словарной статьи такого словаря может варьировать от одной до сотни.

Области Лгр описания: может быть синтакс. словарь, семантич. сл., сл. морфем, словарь и т.д. АС, используемые в системах ИП, имеют вид тезаурусов, а АС систем машинного перевода включают подробную инфо о морфологических, синтаксических и семантических особенностях функционир. слова.

АС можно классиф. по тем же парам-рам, что и обычные словари.

«Грамматический словарь» Зализняка в машинной форме реализуется как часть большинства компьютерных программ, предусматривающих морфолог. анализ или синтез словоформ РЯ. #системы проверки орфографии, распознавания письм. текста.

Компьютерная форма представления словарной инфо и целевая ориентация АСПОТ позволяет создавать комплексные словари с разнообразной грамм. и лексич. инфо. #один из стандартов автомат. переводных словарей, разраб. во Всероссийском центре переводов (ВЦП), включает:

1) заглавная единица, или лексический вход (морфема, слово, словосочет. в канонич. форме);

2) лексико-грамматический класс (принадлежн. к части речи; для словосоч. часть речи определяется в зав-ти от синтаксич. ф-ции); 2 а) лексико-грамматический класс русского переводного эквивалента;

3) морфолого-грамматическая инфо (включает не только инфо о словоизменении, но и о стандартных сокращениях заглавной единицы); 3 а) сокращения русского переводного эквивалента;

4) тематическая рубрика и стилевая характеристика;

5) индекс надежности перевода, отражающий степень общепринятости русского эквивалента;

6) русские переводные эквиваленты (с порядковыми номерами); если перевода нет, то ставится спец маркер и заполняется зона толкования;

7) пояснительные пометы, уточняющие значение заглавной единицы;

8) толкование заглавной единицы;

9) примеры употребления;

10) фразеол сочетания с заглавной единицей;

11) инфо об авторе или редакторе словарной статьи;

12) источник переводного эквивалента;

13) дата составления или редактирования словарной статьи.

Самые известные автом. переводные словари — многоязычные. #AC LEXIC содержит лексикогр. данные по нем, англ, франц, русск, итал, датск и португ язам.

Автоматические словари конкордансов содержат в машинном виде примеры на употребление всех слов (словоформ), представл. в конкретном произвед. или в творческом наследии писателя.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]