- •4. Загальні властивості інформації
- •4.1. Кількість інформації
- •4.1.1. Вимірювання
- •4.1.2. Оцінювання Математичні методи
- •Журналістські методи
- •4.2. Новизна інформації
- •4.2.1. Поняття й види новизни
- •4.2.2. Контекстна новизна
- •4.2.3. Реципієнтська новизна
- •4.2.4. Суспільна новизна
- •4.3. Якість інформації
- •4.3.1. Модальність інформації
- •4.3.2. Істинність інформації
- •4.3.3. Нормованість інформації
- •4.3.4. Псевдоінформація, параінформація, метаінформація
- •4.4. Цінність інформації
- •4.5. Достовірність інформації
- •4.5.1. Інформаційний шум та достовірність
- •4.5.2. Спотвореність і достовірність повідомлень під час коректури
- •4.5.3. Способи підвищення достовірності
- •4.6. Складність інформації
- •4.6.1. Поняття складності34
- •4.6.2. Синтаксична складність
- •4.6.3. Семантична складність
- •4.7. Компресованість інформації
- •4.7.1. Ущільнення
- •4.7.2. Розширення
- •4.7.3. Оцінювання компресованості
4.6.2. Синтаксична складність
Синтаксична складнiсть повідомлення залежить від ступеня агрегацiї одних одиниць мови — в інші (наприклад, звуків чи лiтер — у слова, слiв — у речення, речень — у надфразові єдності тощо). Можна сказати, що чим бiльшу кiлькість складових має певна лінгвістична одиниця (наприклад, слово чи речення), тим важче реципієнтові встановити зв'язки мiж цими одиницями (літерами, словами чи реченнями).
Існують дві групи методів визначення синтаксичної складностi. До першої, яка легко піддається формалізації й, відповідно, автоматизації, належать метод Флеша i метод CRES36, а до другої, яка не формалізується, — метод питань i вiдповiдей та метод резюме37.
Для англомовних текстів метод Флеша визначає складність усього повідомлення чи його фрагмента (R) на основi такої формули:
R = 206,835 - 0,846N - 1,015L, (18)
де N — середня довжина кожних 100 слів тексту в повідомленні, в кількості складiв; L — середня довжина речень, у кiлькостi слiв.
У табл. 4 подана кількісна характеристика рiзних значень R для англомовних текстiв.
Таблиця 4
Кількісна характеристики повідомлень різної складності
N
|
L |
R |
Складність повідомлення |
> 192 |
> 29 |
0…30 |
Дуже важкий |
167 |
25 |
31…50 |
Важкий |
155 |
21 |
51…60 |
Не дуже важкий |
147 |
1738 |
61…70 |
Звичайний |
139 |
14 |
71…80 |
Не дуже легкий |
131 |
11 |
81…90 |
Легкий |
<123 |
<8 |
91…100 |
Дуже легкий |
Метод CRES визначає складнiсть англомовних текстів за такою формулою:
R = 0,39L/P + 11,8N/L + 15,59, (19)
де L — середня довжина речень у фрагменті тексту, в кількості слів; P — довжина фрагмента, в кiлькості речень39; N — середня довжина слів у фрагменті, в кiлькості складiв.
Метод CRES є досконаліший, оскiльки враховує ще один важливий показник, а саме — кiлькiсть речень у НФЄ. Проте цей метод не узгоджений iз поданим у методi Флеша шкалюванням складності.
Ступінь складності для неформалiзованого методу питань i вiдповiдей визначають, заздалегiдь готуючи питання до повідомлення, складнiсть якого з’ясовують. Далi читачеві пропонують ознайомитися з повідомленням i вiдповiсти на підготованi запитання. За результатами вiдповiдей визначають складнiсть повідомлення (оцiнки ставлять експерти).
В методі резюме для повідомлення заздалегiдь готують кiлька варiантiв резюме, з яких тільки одне найповніше вiдтворює змiст повідомлення. Пiсля того, як реципiєнт прочитав текст, йому пропонують вибрати саме таке резюме. Залежно вiд вибору реципiєнта експерти встановлюють кiлькiсну оцiнку складності повідомлення.
Для україномовних текстів визначати складність за методом Флеша (R) можна за формулою40:
R = 206,835 - 0,283N - 5,952L, (20)
де N — середня довжина кожних 100 слів тексту в повідомленні, в кількості складiв; L — середня довжина речень, у кiлькостi слiв.
Проте така адаптована формула не враховує впливу довжини НФЄ. Тому доцільніше використовувати трипараметричний метод, який враховує одночасно довжину слів, речень і НФЄ та є адаптованим до шкалювання Флеша41. Розрахункова формула для такого методу має такий вигляд:
R = 77,0/N + 491,3/L + 8,2/P, (21)
де N — середня довжина слова у фрагменті тексту, в кількості літер; L — середня довжина речення у фрагменті тексту, в кількості слів; P — середня довжина надфразної єдності (абзацу), в кількості речень.
Із числа неформалізованих для україномовних повідомлень можна використовувати також метод, запропонований Б. Н. Головіним. У цьому методі складність визначають за формулою42:
R = [D(2K - 0,5T)]/4KL, (22)
де D — кількість повнозначних слів в уривку повідомлення; K — кількість простих речень в уривку повідомлення; T — кількість відокремлених членів речення в уривку повідомлення; L — кількість речень у повідомленні.
На підставі проведених експериментів Б. Н. Головін підрахував, що для казки складність становить 3,9, а для наукового тексту — 15,5.