Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Булдакова - Компьютерная лексикография.docx
Скачиваний:
232
Добавлен:
26.03.2015
Размер:
58.24 Кб
Скачать

Тема 2. Методы компьютеризации лексикографических работ

Лексикографическая технология включает следующий набор основных процедур: отбор источников, анализ текстов, составле­ние словников и словоуказателей, анализ словоупотреблений, со­ставление полных или частичных конкордансов, т.е. «расписыва­ние» текста источника по выбранным словам или выписывание из текста иллюстративных примеров использования отобранных слов, составление словарных статей, компоновка словаря.

В традиционной лексикографической технологии названные процедуры реализуются путем создания так называемых лексико­графических картотек (библиографических описаний источников, словников и словоуказателей, цитат, словарных статей и т.п.). Как научная дисциплина лексикография в настоящее время находится под сильным воздействием новых методов обработки информации. Меняется инструментарий науки, создаются новые словарные тех­нологии, изменяется содержание труда лексикографа. Постепенно традиционные методы заменяются компьютерной обработкой лек­сикографических данных.

Традиционная технология создания словаря выглядит так:

Формирование словника словаря — Поиск примеров и форми­рование картотеки примеров — Написание словарных статей — Создание рукописи словаря — Перепечатка рукописи — Редакти­рование словарных статей -— Авторская доработка — Перепечатка рукописи — Корректура — Перепечатка рукописи — Набор, вер­стка словаря — Корректура — Печать словаря — Словарь.

Компьютерная технология создания словаря включает в себя следующее:

Формирование корпуса текстов — (Создание словника) — Ав­томатическое формирование корпуса примеров —- Написание сло­варных статей — Ввод словарных статей в базу данных — Редак­тирование словарных статей в базе данных — Корректура текста в базе данных — Порождение текста словаря и формирование ори- гинал-макета — Печать словаря — Словарь.

Значительная часть операций, совсем недавно являвшихся ис­ключительно «интеллектуальными» и известными лишь специали­стам-лексикографам, сегодня переходит в разряд рутинных и дос­тупных всем, кому интересно или необходимо работать с текстом. По этой причине изменяется и состав лексикографов. Многие из них осваивают некоторые смежные профессии в издательском де­ле, печати, компьютерной верстке, программировании, дизайне и становятся организаторами лексикографических исследований и издателями их результатов. Есть и «обратная волна», которая от­ражает процессы интеграции инструментов лексикографической и других информационных технологий. Определенное число спе­циалистов, прежде всего информатики, активно занимаются лекси­кографической деятельностью.

Внедрение современных компьютерных технологий в лексико­графию существенно расширило возможности разработки и экс­плуатации словарей. Создание компьютерных картотек и программ обработки текста позволило в автоматизированном режиме хра­нить и обрабатывать словарную информацию. Можно выделить две основные группы компьютерных лексикографических про­грамм: программы поддержки лексикографических работ и авто­матические словари различных типов, включающие лексикографи­ческие базы данных.

Современные компьютерные технологии позволяют упростить процесс сбора и хранения лексикографической информации, ис­пользуя вместо обычной картотеки базу данных, записи которой представляют собой аналог традиционной каталожной карточки. В отличие от обычной картотеки записи базы данных дают возмож­ность автоматически сортировать массив по выбранным парамет­рам, отбирать нужные примеры и объединять их в группы. Для ве­дения электронных словарных картотек могут использоваться со­временные базы данных, пригодные для решения широкого круга задач, например D-Base, ACCESS, Fox-Base, PARADOX. Такие базы данных фиксируют первичный лексикографический матери­ал, который используется для написания словарных статей слова­ря.

Современные компьютерные программы позволяют успешно решать важную часть лексикографической работы, а именно: ис­кать примеры на употребление слова, т.е. строить конкордансы и формировать в автоматическом режиме словарную картотеку из корпуса текстов, хранящихся в памяти компьютера. В традицион­ной лексикографии отбор примеров проводится ручным способом и требует больших временных затрат. Компьютерная поддержка позволяет после подготовки первичного словарного материала - словарной картотеки - успешно составлять словарную статью, что является следующим этапом работы лексикографа.

Новая словарная статья вводится в базу данных, которая ста­новится исходной базой данных создаваемого словаря. Редактиро­вание словарных статей также происходит в базе данных, а не в обычном текстовом файле. Таким образом, упрощается обработка системы отсылок, в автоматическом режиме происходит сортиров­ка (в том числе алфавитизация словарных статей), сравнительно легко порождаются различные указатели.

Наконец, последний этап - формирование текста словаря, соз­дание оригинал-макета книги - также существенно облегчается. Поля записи базы данных трансформируются в автоматическом режиме в зоны словарной статьи с соответствующими шрифтами, кеглями, курсивом, подчеркиваниями и пр. Существуют издатель­ские системы, используемые для создания оригинал-макета (верст­ки) словарей. К ним относятся, например, издательский пакет про­грамм Quark-X-Press, а также различные версии программPage­Maker.