Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
18-22.docx
Скачиваний:
1
Добавлен:
16.09.2019
Размер:
637.48 Кб
Скачать

18. Понятие компьютерной лексикографии и машинного словаря.

Компьютерная лексикография — совокупность методов и программных средств обработки текстовой информации для создания словарей.

Специальные программы — базы данных, компьютерные картотеки, программы обработки текста — позволяют в автоматическом режиме формировать словарные статьи, хранить словарную информацию и обрабатывать ее.

Группы:

  • Программы поддержки лексикографических работ;

  • Автоматические словари (АС) различных типов, включающие лексикографические базы данных.

Современные компьютерные технологии позволяют упростить процесс сбора и хранения лексикографической информации, используя вместо обычной картотеки базу данных, записи которой представляют собой аналог традиционной каталожной карточки.

Современные базы данных типа ACCESS, dBASE, PARADOX используются для ведения электронных словарных картотек.

Лексикографические базы данных фиксируют первичный лексикографический материал, который используется для написания словарных статей словаря.

  • Поддержка этапа поиска примеров на слово и формирования картотеки примеров:

Современные компьютерные программы дают возможность выбирать примеры на нужное слово из корпусов текстов, хранящихся в машинном формате на компьютере, в автоматическом режиме.

Поиск примеров на употребление слова называется построением конкордансов.

Некоторые компьютерные программы построения конкордансов по желанию пользователя могут преобразовывать найденные контексты в записи базы данных.

  • Поддержка этапа составления словарной статьи:

Новая словарная статья вводится в базу данных, которая становится исходной базой данных создаваемого словаря.

Редактирование словарных статей происходит в базе данных. В автоматическом режиме происходят сортировки словарных статей, порождаются различные указатели.

  • Поддержка этапа формирование текста словаря, создание оригинал-макета книги:

Поля записи базы данных трансформируются в автоматическом режиме в зоны словарной статьи с соответствующими шрифтами, кеглями, курсивом, подчеркиваниями и пр.

Автоматический словарь – это словарь в специальном машинном формате, предназначенный для использования на ЭВМ пользователем или компьютерной программой обработки текста.

Таким образом различаются:

  • автоматические словари конечного пользователя-человека

  • автоматические словари для программ обработки текста.

Автоматические словари, предназначенные для конечного пользователя, по интерфейсу и структуре словарной статьи существенно отличаются от автоматических словарей, включенных в системы машинного перевода, системы автоматического реферирования, информационного поиска и т.д.

Это могут быть компьютерные версии известных обычных словарей. Например: компьютерные аналоги толковых словарей английского языка (автоматический Вебстер, автоматический толковый словарь английского языка издательства Коллинз, автоматический вариант Нового большого англо-русского словаря под ред. Ю.Д.Апресяна и Э.М.Медниковой), компьютерная версия словаря Ожегова.

Автоматические словари для программ обработки текста можно назвать автоматическими словарями в точном смысле. Они, как правило, не предназначены для обычного пользователя. Особенности их структуры, сфера охвата словарного материала задаются теми программами, которые с ними взаимодействуют.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]