- •Министерство общего и профессионального образования
- •2. Проверить однородность совокупности по величине факторного признака х1, используя правило «трёх сигм». Исключить выбросы.
- •3. По вновь сформированному массиву построить ряд распределения предприятий по величине у с равными интервалами (число групп определить по формуле Стэрджесса). Рассчитать:
- •1.Средняя арифметическая:
- •2. Мода:
- •3. Медиана:
- •1. Размах вариации:
- •2. Среднее линейное отклонение:
- •3. Дисперсия:
- •4. Среднее квадратическое отклонение:
- •4. Проверить правило сложения дисперсий по результативному признаку
- •7. Предполагая, что анализируемая совокупность представляет собой 15%-ную случайную выборку предприятий региона, определить:
4. Проверить правило сложения дисперсий по результативному признаку
В данной задаче результативным признаком является годовой объём продукции каждого предприятия за год.
№ |
Интервал |
Частота fi |
y' |
y' * f |
1 |
[15,37; 72,95) |
11 |
44,16 |
485,76 |
2 |
[72,95; 130,53) |
10 |
101,74 |
1017,4 |
3 |
[130,53; 188,11) |
4 |
159,32 |
637,28 |
4 |
[188,11; 245,69) |
1 |
216,9 |
216,9 |
5 |
[245,69; 303,27) |
1 |
274,48 |
274,48 |
6 |
[303,27; 360,85) |
1 |
332,06 |
332,06 |
Итого: |
28 |
1128,66 |
2963,88 |
2963,88 |
Средняя арифметическая для всей изучаемой совокупности:
Общая дисперсия:
Для расчета межгрупповой и средней внутригрупповой дисперсий построим ещё одну дополнительную таблицу:
Интервал |
Объем продукции, y |
Частота , f |
Среднее по группе, ycpi |
(y - ycpi)2 |
(ycpi-yo)2*f |
(y-yo)2 |
|
15,37 |
|
|
727,1112 |
|
8186,63 |
|
23,68 |
|
|
348,009 |
|
6751,909 |
|
27,83 |
|
|
210,395 |
|
6087,12 |
|
34,98 |
|
|
54,09603 |
|
5022,557 |
|
35,68 |
|
|
44,28903 |
|
4923,829 |
[15,37; 72,95) |
49,29 |
11 |
42,335 |
48,37203 |
44375,7075 |
3199,034 |
|
57,09 |
|
|
217,71 |
|
2377,538 |
|
58,81 |
|
|
271,4256 |
|
2212,762 |
|
59,69 |
|
|
301,196 |
|
2130,746 |
|
67,24 |
|
|
620,259 |
|
1490,732 |
|
69,3 |
|
|
727,1112 |
|
1335,903 |
|
76,5 |
|
|
288,3204 |
|
861,4225 |
|
78,06 |
|
|
237,7764 |
|
772,2841 |
|
79,12 |
|
|
206,2096 |
|
714,4929 |
[72,95; 130,53) |
79,93 |
10 |
93,48 |
183,6025 |
1530,169 |
671,8464 |
|
92,03 |
|
|
2,1025 |
|
190,9924 |
|
92,57 |
|
|
0,8281 |
|
176,3584 |
|
98,99 |
|
|
30,3601 |
|
47,0596 |
|
100,38 |
|
|
47,61 |
|
29,9209 |
|
104,28 |
|
|
116,64 |
|
2,4649 |
|
110,46 |
|
|
288,3204 |
|
21,2521 |
|
135,8 |
|
|
589,7612 |
|
897,0025 |
[130,53; 188,11) |
142,63 |
4 |
160,085 |
304,677 |
11765,7409 |
1352,768 |
|
173,95 |
|
|
192,2382 |
|
4637,61 |
|
184,37 |
|
|
589,7612 |
|
6165,39 |
[188,11; 245,69) |
230,76 |
1 |
115,38 |
13312,54 |
90,8209 |
15602,51 |
[245,69; 303,27) |
281,06 |
1 |
140,53 |
19748,68 |
1202,7024 |
30698,54 |
[303,27; 360,85) |
360,83 |
1 |
180,415 |
32549,57 |
5559,93923 |
65014,8 |
Итого |
|
|
|
72258,98 |
64525,0799 |
171575,5 |
Межгрупповая дисперсия:
, где- средняя по отдельной группе
Средняя внутригрупповая дисперсия:
Общая, межгрупповая и средняя внутригрупповая дисперсии взаимосвязаны между собой следующим равенством:
Подставим полученные выше значения дисперсий для проверки данного правила:
=2304,45 +2580,68
≈5195,5
Ввиду некоторых округлений в середине расчёта, вполне возможны такие неточности в конце, а именно 0,03. Так что можно утверждать, что правило выполняется.
5. Для проведения парного регрессионного анализа между у и х1 построить поле корреляции, с помощью инструмента анализа данных РЕГРЕССИЯ электронного пакета Excel вывести результаты регрессионного анализа, определить параметры линейной регрессии. Проанализировать полученные итоги – значение коэффициента корреляции и коэффициента детерминации. Оценить значимость построенной модели. Для оценки адекватности модели рассчитать критерий Дарбина-Уотсона.
С Р Е Д Н Е Г О Д О В А Я
Ч И С Л Е Н Н О С Т Ь
П П П,
Тыс. чел |
|
|
Объем продукции (млн. руб.) |
Построим поле корреляции:
Уравнение регрессии имеет вид: Y=3,788+0,092*X
Результаты регрессионного анализа:
Регрессионная статистика |
| |
Множественный R |
0,941634955 | |
R-квадрат |
0,886676388 | |
Нормированный R-квадрат |
0,882317787 | |
Стандартная ошибка |
27,34116898 | |
Наблюдения |
28 |
Дисперсионный анализ |
| |||||
|
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
1 |
152073,0442 |
152073,0442 |
203,431444 |
8,32912E-14 | |
Остаток |
26 |
19436,02755 |
747,5395213 |
|
| |
Итого |
27 |
171509,0718 |
|
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
| |
Y-пересечение |
-24,61086566 |
10,41148514 |
-2,363818929 |
| |
Переменная X 1 |
9,615834413 |
0,674183214 |
14,26293953 |
| |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% | |
0,025841411 |
-46,0119939 |
-3,209737423 |
-46,0119939 |
-3,209737423 | |
8,32912E-14 |
8,230030061 |
11,00163876 |
8,230030061 |
11,00163876 |
Отсюда следует, что регрессионная модель для данной задачи имеет следующий вид:
Нижние и верхние границы для параметров модели:
ан= -46,0119939; ав= -3,209737423;bн8,230030061;bв= 11,00163876
Интервалы варьирования параметров а и bне перекрывают нулевое значение. р-статистика свидетельствует о том, что полученные значения для параметра а меньше 0,05 – 5% уровня значимости, а параметраb– больше 5% уровня значимости. О значимости модели свидетельствует близкое к единице значение коэффициента детерминации= 0,8867 и критерий Фишера:
Проверим критерий Фишера:
;
= 276070,33; = 444738,86
= (276070,33*26)/ 444738,86= 16,14
Расчетное значение F-статистики 8,32912E-14, что меньше табличного значенияF-критерия:F=16,14
Значение коэффициента корреляции: r= 0,941634955≈ 0,94
Так как линейный коэффициент корреляции имеет положительный знак, то зависимость прямая, так как он практически равен 1, то очень тесная.
Оценим адекватность модели по критерию Дарбина-Уотсона:
d= 0,000771061
Выдвигаем гипотезу о том, что все серийные корреляции равны 0: = …= 0
Для n=28 критических значений и к=1 числу оцениваемых параметров статистика Дарбина-Уотсона:d1= 1,33 иd2= 1,48. Так как 4-d>d2, нулевая гипотеза о равенстве нулю серийных корреляций принимается и делается вывод об адекватности построенной модели.
6. Для проведения множественного регрессионного анализа воспользоваться инструментом анализа данных РЕГРЕССИЯ электронного пакета Excel. Вывести итоги, проанализировать полученные показатели. Оценить значимость построенной модели. Для оценки адекватности модели рассчитать критерий Дарбина-Уотсона.
Регрессионная статистика |
| |||
Множественный R |
0,970134002 |
| ||
R-квадрат |
0,941159983 |
| ||
Нормированный R-квадрат |
0,936452781 |
| ||
Стандартная ошибка |
20,09138796 |
| ||
Наблюдения |
28 |
| ||
|
| |||
|
| |||
|
| |||
|
| |||
|
|
Дисперсионный анализ |
| |||||
|
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
2 |
161417,475 |
80708,73752 |
199,9404541 |
4,17744E-16 | |
Остаток |
25 |
10091,59676 |
403,6638703 |
|
| |
Итого |
27 |
171509,0718 |
|
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
| |
Y-пересечение |
-10,67113122 |
8,197729609 |
-1,301717882 |
| |
Переменная X 1 |
7,389999047 |
0,664530866 |
11,12062573 |
| |
Переменная X 2 |
0,155436549 |
0,029058473 |
5,349095645 |
| |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% | |
0,204880548 |
-27,55465957 |
6,212397123 |
-27,55465957 |
6,212397123 | |
3,60521E-11 |
6,021373068 |
8,758625026 |
6,021373068 |
8,758625026 | |
1,5144E-05 |
0,095589546 |
0,215283552 |
0,095589546 |
0,215283552 |
Уравнение регрессии имеет вид: Y=-10,557+7,455*X+0,142*Z
Для проверки значимости регрессионной модели выдвинем нулевую гипотезу Но: b1=b2=…=bk=0.
Статистикой критерия для проверки гипотезы Но является отношение
= 395,55
> , а это значит, что гипотеза Но не принимается и регрессионная модель значима.
Коэффициент детерминации: 0,941159983.
Оценим адекватность модели по критерию Дарбина-Уотсона:
d= 0,000833425
Выдвигаем гипотезу о том, что все серийные корреляции равны 0: = …= 0
Для n=28 критических значений и к=2 числу оцениваемых параметров статистика Дарбина-Уотсона:d1= 1,26 иd2= 1,56. Так как 4-d>d2, нулевая гипотеза о равенстве нулю серийных корреляций принимается и делается вывод об адекватности построенной модели.