Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
математическая статистика.doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
1.48 Mб
Скачать

13.2 Проверка гипотезы о нормальном распределении генеральной совокупности

Обычно эмпирические и теоретические частоты различаются. Случайно ли расхождение частот? Возможно, что расхождение случайно (незначимо) и объясняется либо малым числом наблюдений, либо способом их группировки, либо другими причинами. Возможно, что расхождение неслучайно (значимо) и объясняется тем, что теоретические частоты вычислены исходя из неверной гипотезы о нормальном распределении генеральной совокупности.

Критерий Пирсона отвечает на поставленный выше вопрос. Как и любой другой критерий, он не доказывает справедливость гипотезы, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений.

Правило:

Для того, чтобы при заданном уровне значимости α проверить нулевую гипотезу Н0: генеральная совокупность распределена нормально, надо сначала вычислить теоретические частоты, а затем наблюдаемое значение критерия: и по таблице критических точек , по заданному уровню значимости α и числу степеней свободы (s – число вариант (частичных интервалов)) найти критическую точку .

Если < - нет оснований отвергнуть нулевую гипотезу. Если > - нулевую гипотезу отвергают.

Пример 13.2.

При уровне значимости α=0,05 проверить гипотезу о нормальном распределении генеральной совокупности по данным примера 13.1.

Решение:

Для нахождения наблюдаемого значения критерия составим расчетную таблицу:

xi

ni

48

54

60

66

72

14

36

34

13

3

12

35

37

14

2

0,3333

0,0286

0,2432

0,0714

0,5

сумма

100

100

1,1765

=1,1765.

По таблице критических точек распределения , по уровню значимости 0,05 и числу степеней свободы k=m-3=5-3=2 находим критическую точку (0,05;2)=6.

Т.к. < - нулевую гипотезу принимаем, другими словами, различие между эмпирическими значениями и теоретическими не значимо, т.е. данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.

14 Функциональная, статистическая и корреляционная зависимости

Во многих задачах требуется установить и оце­нить зависимость изучаемой случайной величины Y от одной или нескольких других величин.

Строгая функциональная зависимость реализуется ред­ко, так как обе величины или одна из них подвержены еще действию случайных факторов, причем среди них могут быть и общие для обеих величин (под «общими» здесь подразумеваются такие факторы, которые воздействуют и на Y и на X). В этом случае возникает статистическая зависимость.

Статистической называют зависимость, при которой изменение одной из величин влечет изменение распреде­ления другой. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой; в этом случае ста­тистическую зависимость называют корреляционной.

Приведем пример случайной величины Y, которая не связана с величиной X функционально, а связана кор­реляционно. Пусть Y - урожай зерна, X - количество удобрений. С одинаковых по площади участков земли при равных количествах внесенных удобрений снимают различный урожай, т. е. Y не является функцией от X. Это объясняется влиянием случайных факторов (осадки, температура воздуха и др.). Вместе с тем, как показы­вает опыт, средний урожай является функцией от количе­ства удобрений, т. е. Y связан с X корреляционной зависи­мостью.

Рассмотрим две зависимые случайные величины. Представим одну из них как функцию другой. Пусть Х связана с Y линейной зависимостью: у=a+bx, которую называют линейной регрессией.

Для расчета параметров a и b линейной регрессии решаем систему нормальных уравнений относительно a и b.

=na+b

=a +b

Для определения степени тесноты линейной зависимости служит выборочный коэффициент корреляции.

Выборочный коэффициент корреляции может принимать значения в пределах от -1 до 1. Чем ближе он по абсолютной величине к 1, тем тесте связь. Знак при нем указывает направление связи: знак + соответствует прямой зависимости, т.е. с увеличением х увеличивается и у, знак - соответствует обратной зависимости, т.е. с увеличением х, у уменьшается.

Если r=±1, то х и у связаны линейной функциональной зависимостью. Если r=0, то величины не зависимы.

Выборочный коэффициент корреляции определяется следующим образом: rв = .

Если выборочный коэффициент корреляции найден по выборке и оказался не равен 0. Т.к. выборка отобрана случайно, то нельзя заключать, что коэффициент корреляции генеральной совокупности также отличен от 0. Возникает необходимость проверить гипотезу о значимости (существенности) выборочного коэффициента корреляции или о равенстве нулю коэффициента корреляции генеральной совокупности.

Правило:

Для того, чтобы при заданном уровне значимости α проверить нулевую гипотезу Н0: rг=0 о равенстве нулю коэффициента корреляции генеральной совокупности при конкурирующей гипотезе Н1: rг≠0, надо вычислить наблюдаемое значение критерия: Тнабл.=rв / и по таблице критических точек распределения Стьюдента, по заданному уровню значимости и числу степеней свободы k=n-2 найти критическую точку tкр(α, k) для двусторонней критической области.

Если |Тнабл|<tкр, нулевую гипотезу принимаем, в противном случае отвергаем.

Пример 14.1.

По следующим данным построить уравнение линейной регрессии, определить выборочный коэффициент корреляции и проверить нулевую гипотезу Н0: rг=0 о равенстве нулю коэффициента корреляции генеральной совокупности при конкурирующей гипотезе Н1: rг≠0, при уровне значимости α=0,05:

Х

12

15

19

22

27

31

33

35

40

42

Y

23

28

35

41

55

52

59

55

50

51

Решение:

Составим выборочное уравнение регрессии Y на Х: у=a+bx.

Параметры уравнений найдем путем составления и решения системы уравнений:

=na+b

= a + b

Составим расчетную таблицу:

x

y

xy

x2

y2

12

15

19

22

27

31

33

35

40

42

23

28

35

41

55

52

59

55

50

51

276

420

665

902

1485

1612

1947

1925

2000

2142

144

225

361

484

729

961

1089

1225

1600

1764

529

784

1225

1681

3025

2704

3481

3025

2500

2601

276

449

13374

8582

21555

Возьмем значения из последней строчки таблицы.

4 49=10а+276b

13374=276а+8582b.

Решим систему b=1,02; а=16,81.

Составим уравнение ух=16,81+1,02х

Вычислим выборочный коэффициент корреляции: rв= , где = ,

,

,

= 9,82,

= 11,81.

rв= 0,846.

Т.к. rв>0, то делаем вывод, что связь между признаками прямая, а т.к. rв близок к 1, то связь тесная.

При уровне значимости α=0,05 проверим нулевую гипотезу Н0: rг=0 о равенстве нулю коэффициента корреляции генеральной совокупности при конкурирующей гипотезе Н1: rг≠0.

Найдем наблюдаемое значение критерия: Тнабл.= ≈8,42.

По условию конкурирующая гипотеза имеет вид: rг≠0, поэтому критическая область – двусторонняя.

Находим критическую точку по таблице критических точек распределения Стьюдента по уровню значимости 0,05 tкр.(0,05; 8)=2,31.

Так как Тнабл>tкр - нулевую гипотезу отвергаем, другими словами выборочный коэффициент корреляции значимо отличается от нуля.