Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ВЫШКА - Теоретическая часть.doc
Скачиваний:
9
Добавлен:
01.05.2025
Размер:
8.19 Mб
Скачать

Тема 10.4. Сравнительная оценка параметров эмпирического и нормального распределений. Критерий Пирсона «хи» квадрат

Нормальный характер распределения свидетельствует о количественной однородности статистических данных и об отсутствии каких-либо причин существенным образом определяющих вариацию изучаемого явления.

Поэтому статистический анализ нередко начинается с проверки того, как фактически (эмпирически) данные ложатся на идеальную теоретическую кривую или аппроксимируются. То есть сравниваются эмпирические и теоретические данные какой-либо кривой. Это производится путем оценки гипотезы нормального характера распределения. Вероятностные статистические предположения выдвигаются в виде нулевой гипотезы. Отклонения эмпирических данных от «нормальных» носят случайный характер. Оценку нулевой гипотезы в данном случае осуществляют графическим методом или путем расчета специальных обобщающих показателей сходства, называемых критериями согласия.

Независимо от выбранного метода генеральные ряды распределения преобразуются в дискретные и стандартизируются.

Пример: Известно, что среднемесячная заработная плата всех рабочих =1402,42 руб., среднеквадратическое отклонение =338,58 руб.

Данные распределения среднемесячной заработной платы:

Средне-месячная заработная плата

Число раб-ков, (эмпир.)

(теор.)

До 700

16

600

-2,37

-2,81

0,0241

12,93

3,07

9,41

0,73

700,1-900

56

800

-1,78

-1,58

0,0819

44,04

11,96

142,95

0,73

900,1-1100

89

1000

-1,19

-0,71

0,1969

105,82

-16,82

282,90

3,25

1100,1-1300

172

1200

-0,60

-0,18

0,3337

179,35

-7,35

54,05

2,67

1300,1-1500

244

1400

-0,01

0,00

0,3989

214,44

29,56

873,70

0,30

1500,1-1700

163

1600

0,58

-0,17

0,3365

180,87

-17,87

319,44

4,07

1700,1-1900

93

1800

1,17

-0,69

0,2002

107,62

-14,62

213,80

1,77

1900,1-2100

64

2000

1,76

-1,56

0,0840

45,17

18,83

354,42

1,99

Свыше 2100,1

13

2200

2,36

-2,77

0,0249

13,38

-0,38

0,14

7,85

Итого

910

0,01

22,63

В связи с тем, что табличные значения рассчитаны для непрерывно изменяющегося признака с дисперсией равной 1, необходимо скорректировать полученные частности на фактическую величину интервала и среднеквадратическое отклонение.

, где величина интервала. Так как все интервалы равны , тогда .

Графики не позволяют определить насколько существенны отклонения эмпирических и теоретических значений, поэтому более точным считается способ расчета критерия согласия Пирсона известного под названием, как «хи» квадрат:

.

В соответствии с формулой, чем сильнее совпадение кривых, тем меньше величина . При отсутствии отклонений , но даже при небольших отклонениях величина зависит от числа слагаемых, то есть от числа групп. Если >0, то необходима его вероятностная оценка.

- число степеней свободы и заданная вероятность несущественности отклонений эмпирических данных и теоретических. r – число групп, k - число параметров, которые нельзя изменить.

Поскольку фактическое значение (22,63) гораздо больше табличного (5,348) даже для вероятности 0,5, гипотеза о случайном характере отклонений эмпирических данных от теоретических отклоняется.