
- •4.1. Число групп определяется системой автоматически по умолчанию 9
- •4.2. Число групп, рассчитанное по формуле Стерджеса 11
- •1. Представление исходных данных
- •2. Расчет основных статистических показателей
- •3. Построение группировок
- •3.1. Число групп определяется системой автоматически по умолчанию
- •3.2. Число групп, рассчитанное по формуле Стерджеса
- •4. Графические изображения ряда распределения
- •4.1. Число групп определяется системой автоматически по умолчанию
- •4.2. Число групп, рассчитанное по формуле Стерджеса
- •5. Показатели распределения
- •5.1. Показатели центра распределения: средняя, мода и медиана
- •5.2. Показатели структуры распределения. Квартили распределения
- •5.3. Показатели вариации
- •5.4. Относительные показатели
- •5.5. Показатели формы распределения
- •5.6. Моменты распределения
- •6. Оптимальная группировка
- •7. Проверка гипотезы о соответствии распределения регионов рф по уровню дохода, приходящейся на одного человека за 2012год нормальному закону. Расчет критерия .
6. Оптимальная группировка
Существуют определенные требования к последующему решению задачи анализа распределений - построения модельного распределения (сглаживание эмпирической гистограммы теоретической кривой). Главное требование очевидно - эмпирическая гистограмма по своим очертаниям должна быть схожа с теоретической кривой плотности. Безусловно, что сходство эмпирической гистограммы и теоретической кривой плотности есть следствие выполнения следующих условий:
непрерывность распределения в пределах размаха вариации (не должно быть «пустых» групп с нулевыми частотами);
распределение должно быть унимодальным, т.е. иметь один ярко выраженный максимум. Наличие нескольких вершин и гистограмме распределения (несколько «локальных» модальных значений) не допускается, т.к. нет ни одного теоретического закона со свойством многовершинности);
распределение должно быть симметричным или обладать положительной асимметрией.
Первые
два условия характеризуют однородность
совокупности. Как уже было установлено,
изучаемая совокупность неоднородна.
Мы рассмотрели два варианта группировки:
число групп к=9
с
выделением экстремальных значений
(решение системы по умолчанию) и к=7.
Увеличение числа групп для неоднородных
совокупностей не целесообразно, так
как в результате, мы все равно получим
«пустые» группы, уменьшать число групп
также не рекомендуется, так как это
может привести к невозможности расчета
критерия Пирсона
.
Таблица 6.1. Оптимальная группировка
№ |
Нижняя граница интервала |
Середина интервала |
Верхняя граница интервала |
fт |
fэ |
1 |
250 |
350,00 |
450 |
5 |
9,10 |
2 |
450 |
550,00 |
650 |
37 |
21,28 |
3 |
650 |
750,00 |
850 |
19 |
24,42 |
4 |
850 |
950,00 |
1050 |
9 |
13,75 |
5 |
1050 |
1150,00 |
1250 |
2 |
3,80 |
6 |
1250 |
1350,00 |
1450 |
1 |
0,51 |
7 |
1450 |
1550,00 |
1650 |
2 |
0,03 |
Далее строим модельное распределение – сглаживание эмпирической гистограммы кривой нормального распределения.
Рис. 6.1. Сглаживание гистограммы распределения регионов РФ по уровню дохода
7. Проверка гипотезы о соответствии распределения регионов рф по уровню дохода, приходящейся на одного человека за 2012год нормальному закону. Расчет критерия .
Основная проверяемая гипотеза: распределение регионов РФ по уровню дохода, приходящейся на одного человек за 2012 год, соответствует нормальному теоретическому закону.
Альтернативная гипотеза: распределение регионов РФ по уровню дохода, приходящейся на одного человек за 2012 год, не соответствует нормальному теоретическому закону.
Уровень значимости равен 0,05.
Для проверки гипотезы рассчитаем критерий согласия .
При расчете критерия
следует иметь в виду следующее ограничение:
теоретические частоты не должны быть
малыми
.
Это ограничение выполняется путем
слияния малочисленных интервалов «на
хвостах» распределения с последующим
уменьшением числа степеней свободы.
Критерий
рассчитывается по каждой группе, а затем
суммируется.
Число степеней свобод рассчитывается после объединения групп равно r=k-l-1=4-2-1=1 (l=2, т, к. нормальное распределение определяют два параметра: средняя и дисперсия).
рассчитанный критерий не превышает
максимально возможную величину
расхождений эмпирических и теоретических
частот, которая может возникнуть в силу
случайных колебаний выборочных данных.
В этом случае гипотеза о соответствии
распределения регионов РФ но уровню
дохода, приходящейся на одного жителя
за 2012 год нормальному закону, подтверждается
с вероятностью 0,95.