Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
курсак.doc
Скачиваний:
1
Добавлен:
15.09.2019
Размер:
166.4 Кб
Скачать

Дистрибутивний аналіз

Основні принципи дистрибутивної методики розробив у 20-х роках XX ст. Л.

Блумфільд, а в 30—50-х роках їх розвинув 3. Харріс, якого вважають

творцем цієї методики.

Дистрибуція (від лат. distributio «розподіл») — сукупність усіх оточень,

у яких перебуває досліджуваний елемент на відміну від оточень інших

елементів.

Дистрибутивний аналіз — методика дослідження мови на основі оточення

(дистрибуції, розподілу) окремих одиниць у тексті.

Це своєрідний дешифрувальний підхід за принципом сентенції «Скажи мені,

хто твій друг, і я скажу, хто ти» (назвіть мені оточення елемента, і я

скажу, про який елемент ідеться). Можливість використання дистрибутивної

методики при аналізі мовних явищ виходить із розуміння, що кожна мовна

одиниця має своє особливе оточення, тобто в дистрибутивних властивостях

мовної одиниці реалізуються її внутрішні властивості, які відображають

її функціональну роль. Немає двох одиниць, оточення яких би повністю

збігалося.

На основі аналізу дистрибуції мовних елементів виділяють дистрибутивні

класи. Існує таке дистрибутивне правило: якщо два елементи перебувають в

одному й тому самому оточенні, то вони належать до одного класу.

Перед лінгвістом у дистрибутивному аналізі стоять такі завдання (їх

можна інтерпретувати і як послідовні етапи аналізу): 1) сегментація

тексту (мовленнєвого потоку) на одиниці певного рівня (звуки, морфи,

слова тощо); 2) ідентифікація виділених одиниць, тобто об'єднання їх у

певні класи (фонеми, морфеми, лексеми тощо); 3) виявлення відношень між

виділеними класами. Для ідентифікації мовних одиниць використовують

прийом субституції (в межах того самого оточення підставляють різні

елементи).

Висновки до розділу I

Дослідження сполучуваності слова в лінгвістичних дослідженнях не втрачає своєї актуальності вже протягом тривалого часу. Сполучуваність – це здатність слова поєднуватися в тексті з іншими словами. Оскільки значення слова не можна встановити поза контекстом, установлення сполучуваності слова по праву вважають однією з найоб’єктивніших методик опису його значення. Проте останнім часом вивчення сполучуваності виходить за межі виключно структурної лінгвістики, а й успішно застосовується для експлікації концептів у когнітивній лінгвістиці [].

На сучасному етапі розвитку семантики особлива увага приділяється вивченню не тільки власне семантики, але й синтагматичних характеристик лексичних одиниць (ЛО), які виражаються через словосполучення. Для визначення відношень між словами в словосполученнях використовують терміни валентність, "сполучуваність". Валентність – здатність слова створювати навколо себе певні вільні позиціі, що займаються певними обов'язковими та факультативними актантами, тобто є лише потенційною сполучуваністю без реалізації сполучувальних задатків слова []. Сполучуваність – його здатність вступати з іншими словами у сполучення за певними синтаксичними моделями [].

Розділ іі Статистичні методи і прийоми у лінгвістиці Критерій хі - квадрата

Хі - квадрат (критерій згоди Пірсона - %2) є об'єктивною оцінкою близькості емпіричних розподілів до теоретичних. Використовується, як уже було сказано, у тих випадках, коли необхідно встановити відповідність двох порівнюваних рядів розподілу - емпіричного і теоретичного, або двох емпіричних. При цьому порівнюються частоти названих рядів розподілу, виявляються розбіжності між ними і визначається вірогідність цих розбіжностей.

За допомогою Хі - квадрат критерію можна виявити відміни в розподілі двох емпіричних рядів, порівнювати вибірки, які мають альтернативні ознаки, а також оцінювати вірогідність кореляції між альтернативними ознаками. Як і інші критерії згоди (Колмогорова А, Романовского, Фішера Б, Ястремского Ь), х2 являє собою деяку величину, яка оцінюється з певною ймовірністю. Він може приймати різні завжди додатні значення (малі й великі). При ^2=0 слід вважати, що відміни між частотами порівнюваних рядів розподілу відсутні. Даний критерій не рекомендується використовувати для оцінки малих вибірок.

За допомогою х2 - критерію можна здійснити статистичну перевірку гіпотез відносно розподілів, тобто відповідність емпіричних даних розподілу деякому теоретичному закону розподілу. Таку оцінку наближення емпіричного розподілу до теоретичного дає сума співвідношень частот де пф, пт - відповідно частоти емпіричного і теоретичного ряду.

Збіг емпіричних і теоретичних частот зумовлює величину х1 = 0. Це вказує на підтвердження нульової гіпотези. (Но). При наявності достовірної різниці у частотах емпіричного і теоретичного ряду величина х1 буде свідчити про неправильність висунутої гіпотези.

Значення параметра ХІ - квадрат зростає із збільшенням різниці між частотами. Величина х2 також залежить від числа ступенів вільності. Чим менше значення х2, тим вищі його ймовірність і вірогідність. Таким чином, при зміні величини х2 від 0 до а> імовірність його змінюється від 1 до 0. У міру наближення п к а> розподіл х2 наближається до нормального.

При використанні ХІ - квадрат критерію необхідно пам'ятати про достатньо велике число одиниць вибірки (п > 50) і величини частот (п > 5). Як було сказано раніше при п, < 5 об'єднують сусідні інтервали ряду розподілу. Якщо вибіркова сукупність досить велика,

Хі - квадрат критерій буде обґрунтований, тобто у такому випадку він майже завжди спростовує невірну гіпотезу. Серед розроблених критеріїв згоди цей критерій забезпечує мінімальну помилку в прийнятті невірної гіпотези.

При оцінці відмінностей між емпіричним і теоретичним розподілами потрібно знати величини х1 , які відповідають визначеним рівням значимості. Для цієї мети К.Пірсон розробив стандартні таблиці, в яких на перетині значень х1 і числа ступенів вільності подані ймовірності, які оцінюють величину х1 (додаток 6) .

Якщо за розрахунковими даними значення ймовірності виявиться дуже малою величиною, наприклад 0,01, то відмінності між досліджуваними рядами потрібно вважати істотними, тобто нульова гіпотеза не приймається. Якщо ж імовірність виявиться не малою, розбіжності вважаються випадковими і нульова гіпотеза приймається. Р.Фішер довів, що ризик зробити помилку буде невеликим, якщо провести суміжну лінію у ймовірності Р = 0,05. Значення х1 , які лежать за цією лінією (0,04; 0,03; 0,02 тощо), .вказують на наявність істотних відхилень.

При розрахунку числа ступенів вільності досліджуваних частот враховують кількість обчислювальних статистичних характеристик теоретичної функції розподілу. У даному випадку використовувана кількість таких параметрів дорівнює 2 (~,<т) , звідси и =І-1- 2 .

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]