- •Відображення у концептуальній моделі лексикографічних параметрів
- •Словник як абстрактний об’єкт.
- •Необхідність та підходи до класифікації словників.
- •Диференційні ознаки класифікації "принцип визначення значень лексикографічних одиниць" та "спосіб розміщення реєстрових одиниць".
- •Загальна характеристика макроструктури словника.
- •Загальна архітектура лексикографічних систем
- •Принципи відображення структури елементарних інформаційних одиниць у лексикографічних системах
- •V(l) — множина статей лексикографічної системи еls, які мають структуру ();
- •Категорія та агрегати лексикографічних структур
Принципи відображення структури елементарних інформаційних одиниць у лексикографічних системах
Початковим пунктом побудови структурної моделі лексикографічних систем є орієнтація на багатоаспектне відображення знакової природи лексичних одиниць як найбільш компактних та інформативних у будь-якій природній мові. З позиції лексикографічного ефекту це означає виокремлення у досліджуваній системі підсистеми її елементарних одиниць та встановлення їх системних характеристик.
Наступний момент врахування дихотомічної структури кожної елементарної одиниці, яка відображається у багатоаспектному співвідношенні форми та змісту елементарних інформаційних одиниць.
Багатоаспектність подання знакової природи елементарних інформаційних одиниць у загальних лексикографічних системах забезпечується врахуванням фонетичних, морфемних, граматичних, семантичних, стилістичних та інших лінгвістичних і когнітивних особливостей об’єктів лексиграфування. У інформаційно-лексикографічній моделі їм відповідає деяка множина комплексів даних і/або знань:
(
(1.8)
D, T) = {D={D[S(L)], Z}; T = {t , , W Z};, W tT, t: D[S(L)] D[S(L)]},
де:
S(L) — множина елементарних інформаційних одиниць системи L; якщо L – деяка природна мова, то S(L) є множиною елементарних інформаційно-лінгвістичних одиниць, що є об’єктами лексиграфування;
D = {D[S(L)], Z} множина описів S(L), де опис – відображення предметної області у деяку множину моделей даних чи знань:
d
(1.9)
: S(L) D[S(L)];описи з множини D: DPh[S(L)] — фонетичний; DMorph[S(L)] — морфемний; DGr[S(L)] — граматичний; DSem[S(L)] — семантичний; DSt[S(L)] — стилістичний; DStat[S(L)] — статистичний тощо.
T = {t, , W} позначено множину відображень (зв’язків) між різними видами описів.
Визначений таким чином комплекс (1.8) природно інтрепретується як граф, вершинами якого є різні описи предметної області S(L), а дугами — відображення чи зв’язки між різними видами описів D[S(L)].
У структурі лексикографічної системи категорії форми та змісту, внутрішньої та зовнішньої форми елементарних інформаційних одиниць повинні бути позначені явним чином та мати відповідне інформаційне вираження у структурах даних, що дає можливість подання кожної структури D[S(L)], Z и t, , W системи (1.8) у вигляді декомпозиції:
D
(1.10)
[S(L)] = {S0(L); DF[S(L)], DC[S(L)]}, Z, t = {tF, tC}, , W,
де:
DF[S(L)] — формальна частина опису (подання) множини S(L);
DC[S(L)] — її змістовна частина;
tF — формальна частина t;
tC — змістовна частини t.
При цьому граф (1.8) розкладається у пряму суму двох підграфів:
(
(1.11)
D, T) = (DF, TF) (DC, TC).
П
рямим
наслідком формули (1.11) є діаграма:
т
(1.12)
(1.13)
ак що загальна формула подання довільної лексикографічної системи (чи її реалізації) в інформаційно-лексикографічній моделі дістає вгляд:V(L) = {(L); P(L), H},
де в формулах (1.12) і (1. 13) через V(L) позначена лексикографічна система як множина статей, (L) — множина реєстрових одиниць лексикографічної системи, P(L) — множина її інтепретаційних; H — відображення (L) у P(L).
Таким чином, у визначені лексикографічної системи H виступає як функція, що ставить у відповідність реєстровій частині статті лексикографічної системи її інтерпретуючу частину і, таким чином забезпечує дихотомічну цілісність її структури.
У структурі лексикографічної моделі кожна стаття починається відповідним реєстровою одиницею x, що відіграє роль її ідентифікатора. Таким чином формула (1.13) запису статей лексикографічної системи деталізується таким чином:
д
(1.14)
е:
V(x) — словникова стаття лексикографічної системи V(L), яка очолена лексикографічною одиницею x;
(x) — ліва частина словникової статті лексікографічної системи;
Р(x) — права частина словникової системи.
V(x) є однозначною функцією від x, отже x виступає ідентифікатором V(x). Таким чином, з формули (1.14) видно, що лексикографічна система допускає природну інтерпретацію як розшарування з базою S0(L) і шарами V(x), х S0(L).
С
(1.15)
еред основних структуротвірних елементів лексикографічної системи V(L) виділимо підсистему її автоморфізмів, тобто відображень:А:V(L) V(L)
системи V(L) в себе. Множину всіх автоморфізмів лексикографічної системи LS позначимо через А: А А.
Відображення Н и А породжують макроструктуру лексикографічної системи. Окрім того, всяка лексикографічна система має свою внутрішню структуру, яка відображає неявним чином семантику предметної області розглядуваної лексикографічної системи. Вказана мікроструктура відноситься до будови об’єктів (x) і Р(x); вона індукується структурою графів (DF, TF) і (DС, TС), з чого випливає принципова можливість існування графічних (а, значить, і будь-яких інших їм ізоморфних) репрезентантів структури (x) и Р(x). Встановлення та визначення виду мікроструктур лексикографічних систем дозволяє формалізувати, а в багатьох випадках і автоматизувати процес побудови структур відповідних словникових баз даних, що дає структурному підходові значні переваги при проектуванні елементів лінгвістичного забезпечення інформаційних систем.
Лексикографічні системи розглядуваного типу будемо називати елементарними та дамо загальне визначення такої лексикографічної системи:
В
(1.16)
изначення 1. Елементарною лексикографічною системою ЕLS для системи L відносно лексикографічного ефекту Q назвемо сімку об'єктів ЕLSQ[L]:ELSQ[L] = { SQ(L); V(L) ((L); P(L)); H; A; ; ; }
де:
SQ(L) — множина елементарних інформаційних одиниць системи L;
