Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Кульчицький_залік.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
98.73 Кб
Скачать

Принципи відображення структури елементарних інформаційних одиниць у лексикографічних системах

Початковим пунктом побудови структурної моделі лексикографічних систем є орієнтація на багатоаспектне відображення знакової природи лексичних одиниць як найбільш компактних та інформативних у будь-якій природній мові. З позиції лексикографічного ефекту це означає виокремлення у досліджуваній системі підсистеми її елементарних одиниць та встановлення їх системних характеристик.

Наступний момент врахування дихотомічної структури кожної елементарної одиниці, яка відображається у бага­то­ас­пе­к­тному співвідношенні форми та змісту елементарних інформаційних одиниць.

Багатоаспектність подання знакової природи елементарних інформа­цій­них одиниць у загальних лексикографічних системах забезпечується врахуван­ням фонетичних, морфемних, граматичних, семантичних, стилістичних та інших лінгвістичних і когнітивних особливостей об’єктів лексиграфування. У інформа­ційно-лексикографічній моделі їм відповідає деяка множина комплексів даних і/або знань:

(

(1.8)

D, T) = {D={D[S(L)],   Z}; T = {t , ,   W  Z};

,  W  tT, t: D[S(L)]  D[S(L)]},

де:

S(L) — множина елементарних інформаційних одиниць системи L; якщо L – деяка природна мова, то S(L) є множиною елементарних інформаційно-лінгвістичних одиниць, що є об’єктами лексиграфування;

D = {D[S(L)],   Z} множина описів S(L), де опис – відображення предметної області у деяку множину моделей даних чи знань:

d

(1.9)

: S(L)  D[S(L)];

описи з множини D: DPh[S(L)] — фонетичний; DMorph[S(L)] — морфемний; DGr[S(L)] — грамати­ч­ний; DSem[S(L)] — семантичний; DSt[S(L)] — стилістичний; DStat[S(L)] — ста­тистичний тощо.

T = {t, ,   W} позначено множину відображень (зв’язків) між різними видами описів.

Визначений таким чином комплекс (1.8) природно інтрепретується як граф, вершинами якого є різні описи предметної області S(L), а дугами — відображення чи зв’язки між різними видами описів D[S(L)].

У структурі лексикографічної системи категорії форми та змісту, внутрішньої та зовнішньої форми елементарних інформаційних одиниць повин­ні бути позначені явним чином та мати відповідне інформаційне вира­жен­ня у структурах даних, що дає можливість подання кожної структури D[S(L)],   Z и t, ,   W системи (1.8) у вигляді декомпозиції:

D

(1.10)

[S(L)] = {S0(L); DF[S(L)], DC[S(L)]},

  Z, t = {tF, tC}, ,   W,

де:

DF[S(L)] — формальна частина опису (подання) множини S(L);

DC[S(L)] —  її змістовна частина;

tF — формальна частина t;

tC — змістовна частини t.

При цьому граф (1.8) розкладається у пряму суму двох підграфів:

(

(1.11)

D, T) = (DF, TF)  (DC, TC).

П рямим наслідком формули (1.11) є діаграма:

т

(1.12)

(1.13)

ак що загальна формула подання довільної лексикографічної системи (чи її реалізації) в інформаційно-лексикографічній моделі дістає вгляд:

V(L) = {(L); P(L), H},

де в формулах (1.12) і (1. 13) через V(L) позначена лексикографічна сис­тема як множина статей, (L) — множина реєстрових одиниць лекси­ко­графічної системи, P(L) — множина її інтепретаційних; H — відображення (L) у P(L).

Таким чином, у визначені лексикографічної системи H виступає як функція, що ставить у відповідність реєстровій частині статті лексикографічної системи її інтерпретуючу частину і, таким чином забезпечує дихотомічну цілісність її структури.

У структурі лексикографічної моделі кожна стаття починається відповідним реєстровою одиницею x, що відіграє роль її ідентифікатора. Таким чином формула (1.13) запису статей лексикографічної системи деталізується таким чином:

д

(1.14)

е:

V(x) — словникова стаття лексикографічної системи V(L), яка очолена лексикографічною одиницею x;

(x) — ліва частина словникової статті лексікографічної системи;

Р(x) — права частина словникової системи.

V(x) є однозначною функцією від x, отже x виступає ідентифікатором V(x). Таким чином, з формули (1.14) видно, що лексикографічна система допускає природну інтерпретацію як розшарування з базою S0(L) і шарами V(x), х  S0(L).

С

(1.15)

еред основних структуротвірних елементів лексикографічної системи V(L) виділимо підсистему її автоморфізмів, тобто відображень:

А:V(L)  V(L)

системи V(L) в себе. Множину всіх автоморфізмів лексикографічної системи LS позначимо через А:  А  А.

Відображення Н и А породжують макроструктуру лексикографічної системи. Окрім того, всяка лексикографічна система має свою внутрішню структуру, яка відображає неявним чином семантику предметної області розглядуваної лексикографічної системи. Вказана мікроструктура відноситься до будови об’єктів (x) і Р(x); вона індукується структурою графів (DF, TF) і (DС, TС), з чого випливає принципова можливість існування графічних (а, значить, і будь-яких інших їм ізоморфних) репрезентантів структури (x) и Р(x). Встановлення та визначення виду мікроструктур лексикографічних систем дозволяє формалізувати, а в багатьох випадках і автоматизувати процес побудови структур відповідних словникових баз даних, що дає структурному підходові значні переваги при проектуванні елементів лінгвістичного забезпечення інформаційних систем.

Лексикографічні системи розглядуваного типу будемо називати елементарними та дамо загальне визначення такої лексикографічної системи:

В

(1.16)

изначення 1. Елементарною лексикографічною системою ЕLS для системи L відносно лексикографічного ефекту Q назвемо сімку об'єктів ЕLSQ[L]:

ELSQ[L] = { SQ(L); V(L)  ((L); P(L)); H; A; ; ;  }

де:

SQ(L) — множина елементарних інформаційних одиниць системи L;