
- •4.1. Число групп определяется системой автоматически по умолчанию 9
- •4.2. Число групп, рассчитанное по формуле Стерджеса 11
- •1. Представление исходных данных
- •2. Расчет основных статистических показателей
- •3. Построение группировок
- •3.1. Число групп определяется системой автоматически по умолчанию
- •3.2. Число групп, рассчитанное по формуле Стерджеса
- •4. Графические изображения ряда распределения
- •4.1. Число групп определяется системой автоматически по умолчанию
- •4.2. Число групп, рассчитанное по формуле Стерджеса
- •5. Показатели распределения
- •5.1. Показатели центра распределения: средняя, мода и медиана
- •5.2. Показатели структуры распределения. Квартили распределения
- •5.3. Показатели вариации
- •5.4. Относительные показатели
- •5.5. Показатели формы распределения
- •5.6. Моменты распределения
- •6. Оптимальная группировка
- •7. Проверка гипотезы о соответствии распределения регионов рф по уровню дохода, приходящейся на одного человека за 2012год нормальному закону. Расчет критерия .
4.1. Число групп определяется системой автоматически по умолчанию
Рис. 4.1.1 Гистограмма распределения регионов РФ по уровню дохода за 2012 год
Рис. 4.1.2 Полигон распределения регионов РФ по уровню дохода за 2012 год
Рис. 4.1.3 Кумулята распределения регионов РФ по уровню дохода за 2012 год
4.2. Число групп, рассчитанное по формуле Стерджеса
Рис. 4.2.1 Гистограмма распределения регионов РФ по уровню дохода за 2012 год
Рис. 4.2.2 Полигон распределения регионов РФ по уровню дохода за 2012 год
Рис. 4.2.3 Кумулята распределения регионов РФ по уровню дохода за 2012 год
По построенным графикам можно сделать следующие выводы. Распределение одновершинно, имеет одну ярко выраженную моду и несимметрично (правосторонняя положительная асимметрия).
5. Показатели распределения
Рассчитаем основные статистические характеристики распределения регионов РФ по уровню дохода в 2012 году. Исходный ряд распределения с числом групп 7.
В качестве значений признака xi рассматриваются значения середин интервалов. При построении интервального вариационного ряда предполагается отсутствие вариации признака в пределах группы, т.е. равномерное (прямоугольное) распределение. Отсюда вид гистограммы как совокупности прямоугольников (совокупность прямоугольных распределений признака в группах с разным числом единиц).
Таблица 5.1. Исходные данные для расчета
№ |
Нижняя граница интервала |
Середина интервала |
Верхняя граница интервала |
Абсолютная частота |
Относительная частота |
Накопленная частота |
1 |
250 |
350,00 |
450 |
5 |
6,67% |
5 |
2 |
450 |
550,00 |
650 |
37 |
49,33% |
42 |
3 |
650 |
750,00 |
850 |
19 |
25,33% |
61 |
4 |
850 |
950,00 |
1050 |
9 |
12,00% |
70 |
5 |
1050 |
1150,00 |
1250 |
2 |
2,67% |
72 |
6 |
1250 |
1350,00 |
1450 |
1 |
1,33% |
73 |
7 |
1450 |
1550,00 |
1650 |
2 |
2,67% |
75 |
ИТОГО |
|
|
|
75 |
100,00% |
|
5.1. Показатели центра распределения: средняя, мода и медиана
Средняя рассчитывается по формуле средневзвешенной через абсолютные или относительные частоты.
Модальное значение признака рассчитывается по формуле:
Медиана рассчитывается по формуле:
5.2. Показатели структуры распределения. Квартили распределения
Расчет порядковых статистик для
интервального ряда распределения
ведется по тем же правилам, что и медиана.
Единственное изменение – коэффициент
при
.
Например, для нижнего (первого) квартиля:
Аналогично рассчитывается верхний
(третий) квартиль:
5.3. Показатели вариации
Простейший показатель такого типа –
среднее линейное отклонение или
среднее абсолютное отклонение как
среднее арифметическое значение
абсолютных отклонений признака от его
среднего уровня:
.
Для расчета среднего линейного отклонения
определяются взвешенные абсолютные
отклонения значений признака (середины
интервалов) от средней величины. В
качестве веса используется относительная
частота.
Дисперсия для сгруппированных
данных
.
Для расчета дисперсии необходимо
рассчитать взвешенные квадраты разностей
значений признака от средней.
Среднее квадратическое отклонение
представляет собой квадратный корень
из дисперсии и показывает, на сколько
в среднем колеблется величина признака
у единиц исследуемой совокупности:
.