Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Органиация производства заочн / лекції організація 1.doc
Скачиваний:
54
Добавлен:
03.03.2016
Размер:
1.69 Mб
Скачать

Задачі кореляційно-регресійного аналізу:

  1. Встановлення форми зв'язуи між перемінними і отримання рівняння регресії в явному вигляді.

  2. Оцінка тісноти зв'язку між перемінними.

Задача 1. Встановлення форми зв'язку і отримання рівняння регресії в явному вигляді.

Першочергова задача регресійного аналізу – встановлення форми зв'язку, тобто підбір такої функції, яка якнайкраще характеризувала б усереднений масовий перебіг явища.

Вибір форми зв'язку здійснюється на основі знання характеру поведінки досліджуваного процесу, а в крайньому випадку – на основі побудови (якщо можливо) за експериментально одержаними даними емпіричних графіків.

Розглянемо абстрактний приклад.

Хай в результаті експерименту одержаний ряд з "n" пар чисел, що характеризують (що описують) деякий процес (табл.2.1).

Таблиця 2.1 – Масив експериментально одержаних даних

X

1,0

1,5

3,0

4,5

5,0

У

1,25

1,4

1,5

1,75

2,25

Оскільки змінних дві, а характер поведінки даного процесу невідомий – побудуємо кореляційне поле в декартовій системі координат (рис.2.9).

Кореляційне поле (точковий графік) – це графічне зображення сукупності експериментально одержаних даних у вигляді крапок в системі координат.

Якщо з'єднати всі крапки у порядку зростання Х відрізками прямої одержимо емпіричну (спостережувану) лінію регресії. Причому, якщо в серії експериментів деякому значенню X відповідає декілька значень У, то перед побудовою емпіричної лінії регресії для кожного такого Х повинно бути визначено вибіркове середнє. Тому в загальному випадку емпірична лінія регресії будується по вибіркових середніх, визначених при тих, що мають місце в експерименті значеннях Х.

Характер лінії (у загальному випадку – поверхні) регресії дає уявлення про очікувану поведінку середнього значення У під впливом врахованих чинників (у даному прикладі – X).

Рис.2.9. Кореляційне поле, емпірична і теоретична лінії регресії

Статистичні дані, представлені в числовому вигляді, не завжди зручні і наочні. Вони значно краще сприймаються, якщо представлені в аналітичному вигляді, тобто у вигляді функцій.

Але оскільки емпіричні дані по Х і по У не є достатньо точними (помилки вимірювань, вплив інших чинників, обмежений об'єм експериментальних даних), представляє інтерес вибір такої апроксимуючої функції f(X), щоб значення її знаходилися достатньо близько від відомих значень, але не обов'язково співпадали з ними в крапках .

Наприклад, по розташуванню емпіричної лінії регресії на рис.2.9 можна припустити, що форма кореляційного зв'язку – лінійна.

Рівняння лінійної регресії:

,

де - параметри рівняння регресії.

Лінія регресії, побудована по рівнянню регресії, називається теоретичною лінією регресії.

Як міра «близькості» часто приймається квадрат відстані між емпіричною функцією, заданою таблицею значень, і аналітичним аналогом. Таке наближення функції розв'язується методом якнайменших квадратів.

Оцінка параметрів лінійного рівняння регресії методом якнайменших квадратів (мнк)

Сутність методу в тому, щоб сума квадратів відхилень розрахункових значень (визначених по теоретичній лінії регресії) від експериментально набутих значень була якнайменшою.

Метод побудови апроксимуючої функції з цієї умови називається методом якнайменших квадратів.

Відповідно до ідеї МНК необхідно мінімізувати функціонал

,

де - значення змінних в i-той точці (спостережувані в експерименті значення);

- теоретичні (розрахункові) значення У при спостережуваних в експерименті значеннях ;

n - кількість експериментально одержаних точок.

Мінімум функціонала Q досягається в тій точці, в якій перші приватні похідні від Q по параметрах b0 і b1 обертаються в нуль:

;

.

В результаті одержуємо систему нормальних лінійних рівнянь щодо невідомих параметрів b0 і b1:

;

.

Вирішивши систему, одержимо:

  • коефіцієнт регресії

;

  • вільний член

,

де

- середні значення відповідно X і У для даного масиву експериментальних даних.

Дані для розрахунку параметрів рівняння регресії представлені в табл.2.2.

Таблиця 2.2 - Дані для розрахунку параметрів рівняння регресії

i

X

У

1

2

3

4

5

1,0

1,5

3,0

4,5

5,0

1,25

1,40

1,50

1,75

2,25

1,00

2,25

9,00

20,25

25,00

1,250

2,100

4,500

7,875

11,250

1,5625

1,9600

2,2500

3,0625

5,0625

?

15,0

8,15

57,50

26,975

13,8975

?/5

3,0

1,63

11,50

5,395

2,7795

;

.

Тоді оцінене рівняння парної лінійної регресії в явному вигляді:

.

Якби між У і X існував чисто функціональний зв'язок, то всі значення У лежали б на теоретичній лінії регресії.