Тема 2. Методы компьютеризации лексикографических работ
Лексикографическая технология включает следующий набор основных процедур: отбор источников, анализ текстов, составление словников и словоуказателей, анализ словоупотреблений, составление полных или частичных конкордансов, т.е. «расписывание» текста источника по выбранным словам или выписывание из текста иллюстративных примеров использования отобранных слов, составление словарных статей, компоновка словаря.
В традиционной лексикографической технологии названные процедуры реализуются путем создания так называемых лексикографических картотек (библиографических описаний источников, словников и словоуказателей, цитат, словарных статей и т.п.). Как научная дисциплина лексикография в настоящее время находится под сильным воздействием новых методов обработки информации. Меняется инструментарий науки, создаются новые словарные технологии, изменяется содержание труда лексикографа. Постепенно традиционные методы заменяются компьютерной обработкой лексикографических данных.
Традиционная технология создания словаря выглядит так:
Формирование словника словаря — Поиск примеров и формирование картотеки примеров — Написание словарных статей — Создание рукописи словаря — Перепечатка рукописи — Редактирование словарных статей -— Авторская доработка — Перепечатка рукописи — Корректура — Перепечатка рукописи — Набор, верстка словаря — Корректура — Печать словаря — Словарь.
Компьютерная технология создания словаря включает в себя следующее:
Формирование корпуса текстов — (Создание словника) — Автоматическое формирование корпуса примеров —- Написание словарных статей — Ввод словарных статей в базу данных — Редактирование словарных статей в базе данных — Корректура текста в базе данных — Порождение текста словаря и формирование ори- гинал-макета — Печать словаря — Словарь.
Значительная часть операций, совсем недавно являвшихся исключительно «интеллектуальными» и известными лишь специалистам-лексикографам, сегодня переходит в разряд рутинных и доступных всем, кому интересно или необходимо работать с текстом. По этой причине изменяется и состав лексикографов. Многие из них осваивают некоторые смежные профессии в издательском деле, печати, компьютерной верстке, программировании, дизайне и становятся организаторами лексикографических исследований и издателями их результатов. Есть и «обратная волна», которая отражает процессы интеграции инструментов лексикографической и других информационных технологий. Определенное число специалистов, прежде всего информатики, активно занимаются лексикографической деятельностью.
Внедрение современных компьютерных технологий в лексикографию существенно расширило возможности разработки и эксплуатации словарей. Создание компьютерных картотек и программ обработки текста позволило в автоматизированном режиме хранить и обрабатывать словарную информацию. Можно выделить две основные группы компьютерных лексикографических программ: программы поддержки лексикографических работ и автоматические словари различных типов, включающие лексикографические базы данных.
Современные компьютерные технологии позволяют упростить процесс сбора и хранения лексикографической информации, используя вместо обычной картотеки базу данных, записи которой представляют собой аналог традиционной каталожной карточки. В отличие от обычной картотеки записи базы данных дают возможность автоматически сортировать массив по выбранным параметрам, отбирать нужные примеры и объединять их в группы. Для ведения электронных словарных картотек могут использоваться современные базы данных, пригодные для решения широкого круга задач, например D-Base, ACCESS, Fox-Base, PARADOX. Такие базы данных фиксируют первичный лексикографический материал, который используется для написания словарных статей словаря.
Современные компьютерные программы позволяют успешно решать важную часть лексикографической работы, а именно: искать примеры на употребление слова, т.е. строить конкордансы и формировать в автоматическом режиме словарную картотеку из корпуса текстов, хранящихся в памяти компьютера. В традиционной лексикографии отбор примеров проводится ручным способом и требует больших временных затрат. Компьютерная поддержка позволяет после подготовки первичного словарного материала - словарной картотеки - успешно составлять словарную статью, что является следующим этапом работы лексикографа.
Новая словарная статья вводится в базу данных, которая становится исходной базой данных создаваемого словаря. Редактирование словарных статей также происходит в базе данных, а не в обычном текстовом файле. Таким образом, упрощается обработка системы отсылок, в автоматическом режиме происходит сортировка (в том числе алфавитизация словарных статей), сравнительно легко порождаются различные указатели.
Наконец, последний этап - формирование текста словаря, создание оригинал-макета книги - также существенно облегчается. Поля записи базы данных трансформируются в автоматическом режиме в зоны словарной статьи с соответствующими шрифтами, кеглями, курсивом, подчеркиваниями и пр. Существуют издательские системы, используемые для создания оригинал-макета (верстки) словарей. К ним относятся, например, издательский пакет программ Quark-X-Press, а также различные версии программPageMaker.
