
- •Лабораторные работы №№ 6 – 8 Анализ корреляционных связей. Цель работы.
- •Двойная группировка данных.
- •Корреляционное поле
- •Расчет параметров линейной модели.
- •Оценка тесноты и значимости корреляционной связи.
- •Доверительные интервалм на цетры групп.
- •Оценка тесноты и значимости линейной модели.
- •Проверка адекватности (линейности) модели.
- •Выбор нелинейной формы связи
- •Доверительные интервалы на расчетные значения.
- •Коэффициенты контингенции.
- •Контрольні питання
- •Роз’яснити зміст “діагональної регресії”, відповісти, чи є діагональна регресія регресією взагалі (згідно з визначенням цього поняття), у яких випадках доцільно використовувати цю модель.
- •Викласти ідею принципу Лежандра (мнк), роз’яснити зміст системи нормальних рівнянь, скласти систему нормальних рівнянь для лінійної і квадратичної моделей однієї змінної.
- •Перелічити основні передумови регресійного аналізу. Сформулювати ідею принципу максимальної правдоподібності і показати, що по цьому принципу найкращими оцінками параметрів моделі є мнк–оцінки.
- •Викласти ідею розрахунку дисперсій коефіцієнтів регресії і дисперсій розрахункових значень. Описати графічний спосіб побудови 95%-вої довірчої смуги на лінію регресії.
Двойная группировка данных.
Здесь будет описан другой надежный способ группировки данных, отличный от того, который был использован в предыдущих лабораторных работах.
Находим для каждой переменной максимальные и минимальные значения и вычисляем ориентировочно величину шага группировки на 10 интервалов (обозначим ориентировочные значения hhx и hhy). Принимаем значения шага ближайшее к ориентировочному, но допускаемому по ГОСТ (ДСТУ). Принимаем также значения начала первого интервала (они должны быть меньше минимальных значений и кратны принятому шагу или полушагу). Принятые значения, как и раньше, выделяем красным цветом.
n = |
44 |
n = |
44 |
Xmax = |
1,329 |
Ymax = |
132 |
Xmin = |
0,495 |
Ymin = |
52 |
hhx = |
0,083 |
hhy = |
8 |
hx = |
0,1 |
hy = |
10 |
х0 = |
0,4 |
у0 = |
50 |
p = |
10 |
q = |
9 |
xp = |
1,4 |
yq = |
140 |
р = ОКРУГЛВВЕРХ((Xmax – х0) / hx; 0),
q = ОКРУГЛВВЕРХ((Ymax – y0) / hy; 0),
xp = x0 + p*hx, yp = y0 + p*hy.
Теперь для каждого наблюдения вычисляем номера групп:
№Х = ОКРУГЛВВЕРХ((x – х0) / hx; 0),
№У = ОКРУГЛВВЕРХ((y – y0) / hy; 0).
В последней колонке таблицы для каждого наблюдения вычислен Шифр = 100*№Х + №У, объединяющий в краткой записи номера групп по Х и по У.
Функцией СЧЁТЕСЛИ подсчитываем количества одинаковых шифров и записываем найденные частоты mij в таблицу размером p q.
Корреляционное поле
|
i => |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
j |
Y X |
0,45 |
0,55 |
0,65 |
0,75 |
0,85 |
0,95 |
1,05 |
1,15 |
1,25 |
1,35 |
l |
9 |
135 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
8 |
125 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
7 |
115 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
2 |
6 |
105 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
5 |
95 |
0 |
1 |
2 |
4 |
0 |
0 |
0 |
0 |
0 |
1 |
8 |
4 |
85 |
0 |
0 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
2 |
3 |
75 |
0 |
0 |
0 |
2 |
5 |
0 |
0 |
0 |
0 |
0 |
7 |
2 |
65 |
0 |
0 |
0 |
0 |
1 |
10 |
8 |
0 |
0 |
0 |
19 |
1 |
55 |
0 |
0 |
0 |
0 |
0 |
1 |
1 |
3 |
0 |
0 |
5 |
|
k |
2 |
2 |
3 |
7 |
6 |
11 |
9 |
3 |
0 |
1 |
44 |
В верхней строке таблицы записываем номера групп по переменной Х (индексы i). В левом столбце таблицы записываем номера групп по переменной У (индексы j ), причем для визуального сходства с графиком разброса индексы j записываем в полядке убывания (т.к. ось У направлена вверх). Для каждого индекса можно сгенерировать значения центров интервалов (вторая строка, второй столбец таблицы). Частоты вычисляются формулой mij = СЧЁТЕСЛИ(Шифры; 100*Индекс_i + Индекс_j), которая набирается для одной ячейки таблицы и копируется в остальные. При копировании не должны изменяться ссылки на диапазон Шифров, ссылки на строку Индекс_i и ссылки на столбец Индекс_j (при наборе в формуле адресов этих операндов клавишей F4 делается абсолютными ссылками или на весь адрес, или только на адрес строки, или только на адрес столбца). Центральная часть таблицы частот mij иногда называется "Корреляционное поле".
С помощью условного форматирования можно нулевые частоты вывести серыми символами, чтобы они не отвлекали внимания. На корреляционном поле ясно виден выброс, который мы уже обнаружили ранее на графике разброса.
n = |
43 |
n = |
43 |
Xmax = |
1,182 |
Ymax = |
132 |
Xmin = |
0,495 |
Ymin = |
52 |
hhx = |
0,069 |
hhy = |
8 |
hx = |
0,1 |
hy = |
10 |
х0 = |
0,45 |
у0 = |
50 |
p = |
8 |
q = |
9 |
xp = |
1,25 |
yq = |
140 |
В нашем примере из таблицы удаляются два последних столбца (с индексами i = 9, 10), размер таблицы сокращается до 9 8.
|
i => |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
|
|
j |
Y X |
0,5 |
0,6 |
0,7 |
0,8 |
0,9 |
1 |
1,1 |
1,2 |
l |
mX |
V |
9 |
135 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
0,5 |
0,500 |
8 |
125 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
7 |
115 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
2 |
1,1 |
0,550 |
6 |
105 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
5 |
95 |
0 |
3 |
4 |
0 |
0 |
0 |
0 |
0 |
7 |
4,6 |
0,657 |
4 |
85 |
0 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
2 |
1,3 |
0,650 |
3 |
75 |
0 |
0 |
2 |
5 |
0 |
0 |
0 |
0 |
7 |
5,4 |
0,771 |
2 |
65 |
0 |
0 |
0 |
1 |
3 |
8 |
7 |
0 |
19 |
19,2 |
1,011 |
1 |
55 |
0 |
0 |
0 |
0 |
0 |
2 |
1 |
2 |
5 |
5,5 |
1,100 |
|
k |
2 |
5 |
7 |
6 |
3 |
10 |
8 |
2 |
43 |
|
|
|
mY |
250 |
485 |
615 |
440 |
195 |
630 |
510 |
110 |
|
|
|
|
U |
125,00 |
97,00 |
87,86 |
73,33 |
65,00 |
63,00 |
63,75 |
55,00 |
|
|
|
Подсчитываем
суммы частот по столбцам и строкам
таблицы:
;
.
Делается это так – выделяем диапазон
частот вместе
с дополнительной сторокой снизу и
дополнительным столбцом справа; далее
на панели инструментов нажимаем мышкой
нажимаем кнопку .
При этом в дополнительные ряды записываются
формулы
суммирования, а не числа.
В
последних двух строках таблицы вычислены
средние интервальные значения
для каждого интервала по Х. Аналогично,
в последних двух строках таблицы
вычислены средние интервальные значения
для каждого интервала по Y.
Суммы mY и mX еще понадобятся в дальнейшем.