Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
mini-WPORKA.docx
Скачиваний:
3
Добавлен:
04.09.2019
Размер:
61.73 Кб
Скачать
  1. Автоматичне читання тексту

Після завершення граматичної перевірки на екрані з'являються зведення про легкість для читання документа. (Ці відомості будуть приведені, якщо в діалоговому вікні, що відображується після натиснення кнопки Параметри (Options) (мал. 5.11), встановлений прапорець статистика легкості для читання (Show readability statistics) (див. главу 11, розділ «Налаштування параметрів перевірки правопису»).

Показники легкості читання характеризують перевірений текст з точки зору легкості читання і необхідного рівня підготовки читача для його прочитання. Вони характеризують перевірений текст з точки зору легкості читання і необхідного рівня підготовки читача для його прочитання. 

Рівень освіти

Цей показник заснований на освітньому індексі Флеша-кинсайда і показує, яким рівнем освіти повинен володіти читач документа, що перевіряється.

Легкість читання

Даний показник заснований на індексі легкості читання Флеша. Показник підраховується по середньому числу складів в слові і слів в пропозиції і варіюється від 0 до 100. Чим вище значення показника, тим легко прочитати текст і тим більшому числу читачів він буде зрозумілий.  Інтервал значень, що рекомендується, для звичайного тексту: від 60 до 70. 

Число складних фраз .

Цей показник показує у відсотках, яка кількість складних фраз міститься в перевіреному тексті.

Благозвучність

Даний показник вказує на легкість для читання тексту з фонетичної точки зору. Підрахунок показника заснований на обчисленні середньої кількості шиплячих і свистячих приголосних.

2.Реферат та анотація, Задача автоматичного реферування тексту.

Створення анотованої бази даних має на увазі створення бази даних пошукових образів первинних документів та їх кластеризацію, тобто автоматичне формування груп документів із близькими за деякими критеріями пошуковими образами (ПОД).

При формуванні анотованої бази даних найважливіший аспект - формування бази даних анотацій, тобто пошукових образів кластерів (ПОК), які, власне, і будуть використовуватися в процесі пошуку. Природно, ця база даних пов'язана з базою даних кластерів, кожен запис якої відповідає певному кластеру та включає, крім усього іншого, його опис (виконаний методами автоматичного реферування).

Структура і форма анотації не мають принципового значення, але в кожному разі вона повинна містити впорядкований набір термінів та/або фраз, що входять до складу відповідного документа і мають певний рівень вагових значень. Вага може характеризувати значимість термінів або фраз у документі і може визначатися різними методами залежно від властивостей предметної області та поставленої задачі.

  1. Методи автоматичного реферування (а точніше квазіреферування, заснованого на переважному використанні методів статистичного аналізу текстів) використовуються, з одного боку, для створення ПОД, а з іншого боку і описів, доступних користувачам.

У рамках даної концепції передбачається використання методів квазіреферування, перевага яких полягає в простоті реалізації.

При звертанні користувачів до бази даних передбачається така процедура: запит користувача відпрацьовується за базою даних анотацій, після чого пошуковою процедурою виконується формування набору релевантних кластерів, найменування та описи яких, з одного боку, можуть пред'являтися користувачам (якщо їх кількість не перевищує заданої заздалегідь), а, з іншого боку, якщо кількість результатів пошуку (кластерів) перевищує це значення, то результати пошуку автоматично групуються, утворюючи суперкластери, перелік яких і пред'являється користувачеві.