Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
matstatistika_vse.docx
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
4.74 Mб
Скачать

30 Метод найменших квадратів

Припустимо, що вибірка обсягу не згрупована. Оскільки ми припустили існування лінійного зв’язку між результативною та факторною ознаками, то діаграма розсіювання точок має вигляд:

Основна ідея методу найменших квадратів полягає в тому, що точковими оцінками і параметрів і вибирають такі числа, для яких пряма є “найближчою” до точок

Мірою відхилення шуканої прямої від точок вибирають величину:

тобто суму квадратів різниць між ординатами прямої та ординатами точок для одних і тих самих значень

Якщо числа і – такі, що функція має найменше значення, то пряма найменше відхиляється від точок

Методом найменших квадратів називається метод знаходження статистичних оцінок і параметрів і за допомогою функції виходячи з рівності:

Для знаходження мінімуму функції маємо розв’язати систему рівнянь:

яку елементарними перетвореннями зводимо до такого вигляду:

У випадку згрупованої вибірки для визначення невідомих параметрів і маємо систему двох рівнянь:

де  – частоти відповідних варіант та ;

– частота появи події

Припускаючи, що ознака не є сталою, тобто серед варіант обов’язково є різні числа, робимо висновок про визначник системи:

Звідси випливає, що досліджувана система рівнянь має єдиний розв’язок:

де

Таким чином, шукане рівняння регресії набуває такого вигляду:

Коефіцієнт називають коефіцієнтом регресії, який характеризує відношення величини приросту результативної ознаки до величини приросту факторної ознаки

Лінійне рівняння регресії можна подати в іншому вигляді через статистичну оцінку коефіцієнта кореляції:

Необхідно зауважити, що в разі порушення припущення про лінійність зв’язку між результативною та факторною ознаками, а про це можна зробити висновок із діаграми розсіювання вибірки, використовують нелінійні регресійні моделі. У нелінійних регресійних моделях зв’язок може виражатися, наприклад, такими рівняннями: або або Статистичні оцінки параметрів у цих нелінійних моделях також можна знайти за допомогою методу найменших квадратів.Для обчислення ймовірностей використовують формули:

(3.42)

Зазначимо, що для обчислення ймовірностей і у формулах (3.42) покладають, відповідно, і Тоді

Отримані результати обчислень зручно записати у вигляді таблиці 3.13:

Таблиця 3.13

Згідно з критерієм Пірсона для перевірки гіпотези вводиться випадкова величина (статистика) K:

де – кількість груп у статистичному розподілі вибірки;

– емпірична частота ознаки в -й групі;

 – теоретична частота;

– ймовірність того, що значення належить -й групі.

Відомо, що при закон розподілу статистики прямує до закону розподілу з ступенями вільності, де – кількість груп у статистичному розподілі вибірки; – кількість параметрів гіпотетичного розподілу Наприклад, – для нормального розподілу, – для розподілу Пуассона, – для рівномірного розподілу.

Для критерію будують правосторонню критичну область за правилом:

(3.43)

За даним рівнем значущості і кількістю ступенів вільності із таблиці критичних точок розподілу (в якій дано розв’язки рівняння (3.43)), знаходять критичну точку (додаток В).

На підставі даних вибірки, записаних у таблиці, обчислюють емпіричне значення критерію Пірсона:

Порівнюємо значення і Якщо то гіпотезу відхиляють. Якщо ж то гіпотезу приймають.

Застосування критерію вимагає дотримання таких умов:

  • експериментальні дані мають бути незалежними, тобто вибірка має бути випадковою;

  • обсяг вибірки має бути достатньо великим (практично не меншим ніж 50 одиниць), а частота кожної групи – не меншою за 5.

Якщо остання умова не виконується, то проводиться попереднє об’єднання нечисленних груп.

Критерій згоди Пірсона дає відповідь на питання, чи є розбіжність між емпіричними і теоретичними частотами зумовлена випадковістю, чи вона є значущою.

Як і будь-який інший критерій, критерій згоди Пірсона не доводить справедливості гіпотези , а лише дозволяє встановити на прийнятому рівні значущості узгодженість чи неузгодженість гіпотези із даними спостережень.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]