- •Лабораторна робота № 3
- •Постановка задачі
- •Витрати на утримання та перерахування митних установ
- •Метод комбінаційного групування (п. 2.1).
- •Комбінаційне групування за факторною (х) та результативною (y) ознаками
- •Метод аналітичного групування (п. 2.2).
- •Робоча таблиця
- •Таблично задана лінія регресії
- •Метод дисперсійного аналізу (п. 2.3)
- •Метод кра (п. 2.4)
- •Розрахункова таблиця {глянь в Excel, 1-й лист, о9}
- •Розрахункова таблиця {в Excel 3-X, 4-y, 5-z, 6-aa, 7-ac}
- •Метод кореляції знаків Фехнера (п. 2.5)
- •Розрахункова таблиця {Excel – m & n}
- •Метод кореляції рангів Спірмена (п. 2.6).
- •Розрахункова таблиця {Excel – g, h, I & j}
Таблично задана лінія регресії
-
k
xk
1
2
3
2.025
2.909
3.671
34.875
40.782
49.786
Для наочності побудуємо
графік лінії регресії. Для цього в
прямокутній системі координат
зобразимо точки з координатами (xk;
)
(тобто кореляційне поле) і послідовно
сполучимо їх відрізками прямих (див.
рис.3.7).
Із аналізу таблиці 3.4 і графіка (рис. 3.2) можна зробити такий висновок: більшим витратам на утримання відповідають більші перерахування до бюджету, що підтверджує попередній висновок про можливість існування прямого зв’язку між Х та Y, зроблений за результатами комбінаційного групування. При цьому із вигляду графіка можна припустити, що зростання Y має, можливо, прискорений характер.
Рис. 3.2. Графік лінії регресії
Метод дисперсійного аналізу (п. 2.3)
Усю
сукупність 20-ти пар (хі;
уі),
що вивчається, розділимо за факторною
ознакою на 3 групи, використавши поділ,
зроблений у таблиці 3.5. За формулою
(3.1) обчислимо загальну середню
для всієї сукупності значень уі
(і=
):
.
Обчислимо загальну дисперсію ознаки Y за відповідною формулою:
.
Обчислимо міжгрупову дисперсію, використавши раніше знайдені значення групових середніх (табл. 3.4) і частот fk (табл. 3.2):
За формулою обчислюємо спостережене значення кореляційного відношення:
звідки витікає, що 75,9 % загальної варіації ознаки Y пов’язано з варіацією ознаки Х, а це свідчить про можливість існування залежності Y від Х.
Для
формального підтвердження або спростування
даного припущення знайдемо критичне
значення величини η2
для рівня значущості
.
За таблицею критичних значень (з Додатку
2 Лабораторного практикуму) для степенів
вільності k1=m–1=3–1=2,
k2=n–m=22–3=19
знаходимо
.
Оскільки
,
то з імовірністю
=0,95
можна вважати, що Y
істотно залежить від
Х. Для
оцінки щільності зв’язку застосовуємо
правило трисекції: 0,7
+ 0,3=0,49;
0,3
+ 0,7=0,781.
Оскільки
[0,7
+ 0,3;
0,3
+ 0,7],
то щільність зв’язку можна вважати
помірною, але близькою до сильної.
Метод кра (п. 2.4)
Вважатимемо, що для вибору виду рівняння регресії (тобто, виду функції f(x) ) у нас немає ніякої іншої інформації, крім заданої сукупності пар (хі; уі). Це означає, що вид функції f(x) визначатиметься тільки видом кореляційного поля (рис. 3.1), із візуального аналізу якого можна припустити, що залежність Y від Х має бути лінійною або нелінійною (зокрема, квадратичною) з незначною нелінійністю. Певним аргументом на користь останнього припущення може бути вже побудований графік лінії регресії, заданої таблицею (рис. 3.2). Оскільки однозначний і беззаперечний вибір виду функції f(x) в даному випадку зробити досить складно, то проведемо повне дослідження для обох видів рівняння регресії, після чого остаточно виберемо кращий варіант за критерієм мінімуму регресійної дисперсії.
Для
обчислення параметрів а,
b,
р, q,
r
лінійної
а+bх
та квадратичної
р+qx+rx2
залежностей застосовуємо загальноприйнятий
метод найменших квадратів.
Для
зручності сприймання розрахунків
перейдемо до умовних варіант
та
,
вибравши А=3, B=0,
С=40, D=1
та округлюючи значення
та
до тисячних:
;
Обчислення коефіцієнтів систем лінійної та квадратичної залежностей зручно організувати в таблиці (табл. 3.5).
В результаті одержуємо дві системи у вигляді:
і
Розв’язавши
їх будь-яким з відомих методів, одержуємо
умовні рівняння регресії:
,
.
Перейдемо до фактичних рівнянь регресії шляхом заміни умовних варіант на первинні:
Таблиця 3.5
