- •Відображення у концептуальній моделі лексикографічних параметрів
- •Словник як абстрактний об’єкт.
- •Необхідність та підходи до класифікації словників.
- •Диференційні ознаки класифікації "принцип визначення значень лексикографічних одиниць" та "спосіб розміщення реєстрових одиниць".
- •Загальна характеристика макроструктури словника.
- •Загальна архітектура лексикографічних систем
- •Принципи відображення структури елементарних інформаційних одиниць у лексикографічних системах
- •V(l) — множина статей лексикографічної системи еls, які мають структуру ();
- •Категорія та агрегати лексикографічних структур
V(l) — множина статей лексикографічної системи еls, які мають структуру ();
четвірка об'єктів (H, A, , ) репрезентує структуру V(L), причому оператори макроструктури H і A визначені формулами () і () відповідно, а і — відображають мікроструктуру (L) і P(L);
— множина функцій системного сервісу лексикографічної системи.
Відображення у концептуальній моделі лексикографічних параметрів (2 різні статті /1 курсивом)
Враховуючи багатоплановість структури словника зобразимо його концептуальну інформаційну модель у вигляді ієрархії лексикографічних систем. Обов’язковими є перший рівень ієрархії, де словник подано у вигляді елементарної лексикографічної системи ELS[DICT], яка відповідає його макрорівню, та другий — де основа словника подана як лексикографічна система LSb[DICT], що відповідає медіо– та мікрорівню словника. Нижчі рівні ієрархії відповідають окремим лексикографічним параметрам, подання яких у вигляді лексикографічних систем залежить від ступеню деталізації їхнього відображення у ЛБД.
При моделюванні структури статті сучасна теоретична лексикографія оперує поняттям лексикографічного параметра, який вперше ввів Ю. Н. Караулов [3]. За його визначенням лексикографічний параметр – це деякий квант лінгвістичної інформації, що, в принципі, може мати самостійний інтерес для користувача, але, як правило, виступає в комбінації з іншими параметрами (квантами) і знаходить своє специфічне вираження у словниках; іншими словами – це особливе словникове відображення структурних рис мови. За своєю природою лексикографічні параметри діляться на дві групи. До однієї з них входять власне мовні, тобто структурогенні параметри: наголос, орфографічний параметр тощо. Їх значення дискретні і можливість варіювання поширюється лише на способи їх задання, фіксації у словнику. Другу групу становлять параметри, зміст яких за необхідності містить і екстралінгвістичний фактор – денотативний, історико- культурний, прагматичний, тобто моменти, вторинні відносно до мови, пов'язані не лише з самою мовою, але з її вивченням, тобто з мовознавством. Ці параметри недискретні за своєю природою, характеризуються змінною глибиною розкриття і відображають не власне структурні відношення, а процеси – діахронічні, синтагматичні, взаємодії мов, інтерференції тощо. Тобто, у структурному плані словникова стаття складається як з лексикографічних па- раметрів, що співвіднесені з відповідною реєстровою одиницею, так і з компонент, що показують її місце у мовній системі. Медіорівень – це зв’язки між різними лексикографічними одиницями, а мікрорівень – це зв’язки між лексикографічною одиницею та відповідними їй значеннями лекси- кографічних параметрів. Як бачимо, лексикографічні одиниці виконують роль зв’язку між медіо- та макрорівнями словника, причому на медіорівні це єдині об’єкти. Відношення між ними умовно можна розбити на семантичні та структурні
Технологічна лінія укладання словників Технологічною лінією розглядають автоматизацію лексикографічних робіт будемо розглядати, де на різних етапах застосовуються різні пакети програм, як спеціалізовані, так і загальні, які комплексно впроваджують у лексикографію новітні інформаційні технології. Перелічимо ще деякі обов’язкові вимоги до такої технологічної лінії:
взаємозв'язок між складовими такої лінії відбувається на рівні обміну даними;
пакети програм повинні бути зручним у користуванні та відповідати сучасним вимогам "дружності" інтерфейсу;
пакети програм повинні дозволяти безболісне нарощення можливостей.
Виділимо такі складові частини технологічної лінії укладання словників на комп’ютері:
Підготовча робота. Цьому етапу відповідають програмні засоби для автоматизації обробки джерел до укладання словника та створення початкової картотеки.
Наповнення та супровід початкової бази даних. Програмні засоби цього етапу повинні дозволяти ручний ввід інформації, імпорт даних з попереднього етапу, редагування та доповнення введеної інформації, комплексну перевірку структурної та семантичної корректності, несуперечливості та повноти зібраних даних.
Реструктуризація лексикографічної бази даних та вибір даних для конкретних застосувань. На цьому етапі програмні засоби повинні з лексикографічної бази даних створювати інформаційні бази конкретних застосувань (наприклад, текст словника для поліграфії або довідкова словникова система).
Конкретні застосування зібраних даних. Програмні засоби цього етапу дозволяють використовувати реструктуризовані дані конкретним чином:
для виготовлення оригінал-макету поліграфічного видання словника певного типу,
як спеціалізовану інформаційно-довідкову систему;
як складову частину інших програмних комплексів;
як вхідні дані різних лінгвістичних досліджень тощо.
Центральною складовою технологічної лінії є словникова база даних, яку назвемо лексикографічною базою даних (ЛБД). Зазначимо, що з точки зору інформаційного наповнення ЛБД не розглядається як така, що відповідає одному конкретному словнику. Лексикографічна база даних містить широку сукупність лексикографічної інформації, включно з робочою, тому на основі неї можна отримати цілу сукупність словників. Таким чином, основною задачею створення технологічної лінії є реалізація ЛБД на комп'ютері.
