Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
стат1.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
103.39 Кб
Скачать

6. Оптимальная группировка

Существуют определенные требования к последующему решению задачи анализа распределений - построения модельного распределения (сглаживание эмпирической гистограммы теоретической кривой). Главное требование очевидно - эмпирическая гистограмма по своим очертаниям должна быть схожа с теоретической кривой плотности. Безусловно, что сходство эмпирической гистограммы и теоретической кривой плотности есть следствие выполнения следующих условий:

  • непрерывность распределения в пределах размаха вариации (не должно быть «пустых» групп с нулевыми частотами);

  • распределение должно быть унимодальным, т.е. иметь один ярко выраженный максимум. Наличие нескольких вершин и гистограмме распределения (несколько «локальных» модальных значений) не допускается, т.к. нет ни одного теоретического закона со свойством многовершинности);

  • распределение должно быть симметричным или обладать положительной асимметрией.

Первые два условия характеризуют однородность совокупности. Как уже было установлено, изучаемая совокупность неоднородна. Мы рассмотрели два варианта группировки: число групп к=9 с выделением экстремальных значений (решение системы по умолчанию) и к=7. Увеличение числа групп для неоднородных совокупностей не целесообразно, так как в результате, мы все равно получим «пустые» группы, уменьшать число групп также не рекомендуется, так как это может привести к невозможности расчета критерия Пирсона .

Таблица 6.1. Оптимальная группировка

Нижняя граница интервала

Середина интервала

Верхняя граница интервала

fт

fэ

1

250

350,00

450

5

9,10

2

450

550,00

650

37

21,28

3

650

750,00

850

19

24,42

4

850

950,00

1050

9

13,75

5

1050

1150,00

1250

2

3,80

6

1250

1350,00

1450

1

0,51

7

1450

1550,00

1650

2

0,03

Далее строим модельное распределение – сглаживание эмпирической гистограммы кривой нормального распределения.

Рис. 6.1. Сглаживание гистограммы распределения регионов РФ по уровню дохода

7. Проверка гипотезы о соответствии распределения регионов рф по уровню дохода, приходящейся на одного человека за 2012год нормальному закону. Расчет критерия .

Основная проверяемая гипотеза: распределение регионов РФ по уровню дохода, приходящейся на одного человек за 2012 год, соответствует нормальному теоретическому закону.

Альтернативная гипотеза: распределение регионов РФ по уровню дохода, приходящейся на одного человек за 2012 год, не соответствует нормальному теоретическому закону.

Уровень значимости равен 0,05.

Для проверки гипотезы рассчитаем критерий согласия .

При расчете критерия следует иметь в виду следующее ограничение: теоретические частоты не должны быть малыми . Это ограничение выполняется путем слияния малочисленных интервалов «на хвостах» распределения с последующим уменьшением числа степеней свободы. Критерий рассчитывается по каждой группе, а затем суммируется.

Число степеней свобод рассчитывается после объединения групп равно r=k-l-1=4-2-1=1 (l=2, т, к. нормальное распределение определяют два параметра: средняя и дисперсия).

рассчитанный критерий не превышает максимально возможную величину расхождений эмпирических и теоретических частот, которая может возникнуть в силу случайных колебаний выборочных данных. В этом случае гипотеза о соответствии распределения регионов РФ но уровню дохода, приходящейся на одного жителя за 2012 год нормальному закону, подтверждается с вероятностью 0,95.