
Лаб.работы по статистике за 2011 год (Ёлкин) / Готовые лабы / Kostikov_3
.docОтчет по лабораторной работе № 3
«Показатели вариации. Однофакторный дисперсионный анализ»
студента Костиков А.О. группы У5-721. Дата сдачи:____________
Ведущий преподаватель: Елкин С.В. оценка: подпись:_______
Вариант № 8
Цель работы: в данной лабораторной работе рассчитываются различные показатели вариации для данных, разделённых на группы. На основании эмпирического корреляционного отношения устанавливается степень тесноты связи исследуемого и группировочного признаков. Для проверки значимости влияния группировочного признака на исследуемый используется однофакторный дисперсионный анализ. Результаты статистического анализа представляются в виде статистических таблиц.
Исходные данные: База данных продаж квартир в Москве.
1.Постановка задачи: Зависит ли стоимость проданной жилой площади от типа дома?
a. Группировка данных
Исследуемый признак: стоимость жил. площади
Группировочный признак: тип дома
Число значений группировочного признака l = 4
Значения группировочного признака |
Число единиц совокупности, ni |
Суммарное значение признака, xi |
Групповые средние,xi |
Групповые дисперсии, Di |
блочный |
24 |
132362 |
5515,08333 |
7805553,18 |
кирпичный |
28 |
260448 |
9301,71429 |
2404245,27 |
монолит |
35 |
373413,3 |
10668,9514 |
4869820,79 |
панельный |
63 |
551100,4 |
8747,6254 |
1563882,3 |
ИТОГО |
150 |
1317323,7 |
|
|
b. Таблица дисперсий
|
Формула |
Значение |
Всего единиц, n |
|
150 |
Общая средняя,x |
|
8782,158 |
Внутригрупповая дисперсия, Dвнутригр |
|
3490803,046
|
Межгрупповая дисперсия, Dмежгр |
|
2589357,918
|
Общая дисперсия, Dобщ |
|
6080160,963 |
Правило сложения дисперсий |
|
Правило сложения дисперсий выполняется |
2. Однофакторный дисперсионный анализ
с. Таблица дисперсионного анализа
Формулы и названия
Источник вариации |
Тип дисперсии |
Число степеней свободы |
Несмещённая оценка дисперсии |
Исследуемый фактор |
Межгрупповая дисперсия
|
|
|
Остаточные факторы |
Внутригрупповая дисперсия |
|
|
Все факторы |
Общая дисперсия |
|
|
Значения
Источник вариации |
Тип дисперсии |
Число степеней свободы |
Несмещённая оценка дисперсии |
Исследуемый фактор |
2589357,918 |
3 |
129467896 |
Остаточные факторы |
3490803,046 |
146 |
3586441,49 |
Все факторы |
6080160,963 |
149 |
6120967,41 |
d. Проверка тесноты связи между исследуемым и группировочным признаками
Показатель |
Формула |
Значение |
Эмпирический коэфф. детерминации, эмп2 |
|
42,59% |
Эмпирическое корреляц. отношение, эмп |
|
65,26% |
Рассчитанное значение эмпирического коэффициента детерминации показывает, что группировочный прзнак объясняет 42,59% всей вариации исследуемого признака.
Рассчитанное значение эмпирического корреляционного отношения показывает, что между признаками исследуемым и группировочным существует заметная связь.
e. Дисперсионный анализ
Проверяемая статистическая гипотеза H0: Dфакт = Dост
Уровень значимости =0,05
Формула для расчёта
статистики критерия:
В случае справедливости H0 статистика критерия распределена по закону Фишера-Снедекора с параметрами К1=3, K2=146
Функция плотности распределения статистики критерия
Fкр=2,7 Fнабл=36,1
|
Формула |
Значение |
Выборочное значение статистики критерия, Fвыб |
|
36,1 |
Критическая точка, F0 |
F(0,05;3;146)
|
2,7 |
Указать на графике функции плотности распределения статистики критерия область допустимых значений, критическую область и нанести выборочное значение статистики критерия.
Статистическое решение: основная гипотеза H0 принимается / отвергается
Вывод: Группировочный фактор оказывает влияние на исследуемый.
2. Расчёт показателей вариации
Значения признака Показатель вариации |
блочный |
кирпичный |
монолит |
панельный |
Число единиц совокупности, ni |
24 |
28 |
35 |
63 |
Групповые средние,xi |
5515,1 |
9301,7 |
10668,9 |
8747,6 |
Размах вариации, R=xмакс-хмин |
10257,1 |
5709,8 |
8289 |
4925,2 |
Среднее линейное отклонение,
|
2497,1 |
1511,2 |
1363,4 |
1279,5 |
Дисперсия, D |
7805553,2 |
2404245,3 |
4869820,8 |
1563882,3 |
Среднеквадратич. отклонение,
σ= |
2793,8 |
1550,6 |
2206,8 |
1250,6 |
Линейный коэффициент вариации,
|
45,3% |
16,3% |
12,8% |
14,6% |
Коэффициент вариации,
|
50,7% |
16,7% |
20,7% |
14,3% |
Однородность выборки |
Выборка неоднородна |
Выборка однородна |
Выборка однородна |
Выборка однородна |
МЧС
Заключение.
В данной работе исследовалась зависимость стоимости проданной жилой площади от типа дома. С этой целью, проводился однофакторный дисперсионный анализ, который включает в себя группировку стоимости по типам домов, расчет дисперсий и средних и анализ полученных результатов, при помощи проверки гипотезы о равенстве межгрупповой и внутригрупповой дисперсий, а также расчета эмпирического коэффициента детерминации и эмпирического корреляционного отношения. Для оценки надежности данных проводились расчеты различных показателей вариации. Полученные результаты представлялись в виде таблиц. Результаты полученные в ходе однофакторного дисперсионного анализа согласуются с гипотезой о зависимости стоимости жилой площади от типа дома. В частности это подтверждает отвергнутая гипотеза о равенстве межгрупповой и внутригрупповой дисперсий, а также рассчитанное эмпирическое корреляционное отношение, равное 65,26% и показывающее, что между группировочным признаком (типом дома) и исследуемым признаком (стоимостью жилой площади) существует заметная связь. Из рассчитанных показателей вариации особый интерес представляют показатели для блочных домов. Из полученного коэффициента вариации(50,7%) можно сделать вывод, что выборка блочных домов является неоднородной, что может привести к возникновению ошибок репрезентативности и, в конечном счете, сказывается на надежности полученных результатов.