Задача 5. Тема «Критерий согласия Пирсона».
По результатам наблюдений определены
частоты nj
попадания случайной величины Х в
заданные интервалы [aj;
aj+1),
j=1,2,…, k.
Рассчитать по данному статистическому
ряду оценки параметров
и
,
пользуясь формулами:
,
,
где n – объем выборки;
k – число интервалов группировки;
– середина j-го
интервала.
С помощью критерия согласия Пирсона
на уровне значимости α=0,05 выяснить,
можно ли считать случайную величину Х
нормально распределенной с параметрами
и s, рассчитанными по
выборке:
|
[aj; aj+1) |
[2,0; 2,3) |
[2,3; 2,6) |
[2,6; 2,9) |
[2,9; 3,2) |
[3,2; 3,5) |
[3,5; 3,8) |
|
nj |
3 |
5 |
10 |
8 |
4 |
2 |
Решение:
Сформулируем основную и альтернативные гипотезы:
Н0: Х~N(
)
– случайная величина Х подчиняется
нормальному закону с параметрами
и
.
Так как истинных значений параметров
и
,
то рассчитаем их по выборке.
Н1: случайная величина Х не подчиняется нормальному закону с данными параметрами.
Рассчитаем значения
и
:
![]()
![]()

=
,
Рассчитаем наблюдаемое значение Кнабл статистики Пирсона по формуле:
![]()
Эмпирические частоты nj уже известны, а для вычисления вероятностей pj, в предположении, что гипотеза Н0 справедлива, применим формулу
и таблицу функции Лапласа. Полученные результаты сведем в таблицу 5.1
![]()
![]()
![]()
![]()
![]()
.
Сравнение наблюдаемых и ожидаемых частот Таблица 5.1
|
№ п/п |
Интервалы группировки [aj; aj+1) |
Наблюдаемая частота nj |
Вероятность pj попадания в j-й интервал |
Ожидаемая частота npj |
Слагаемые статистики Пирсона
|
|
1 |
[2,0; 2,3) |
3 |
0,0654 |
2,0928 |
0,3933 |
|
2 |
[2,3; 2,6) |
5 |
0,1803 |
5,7696 |
0,1027 |
|
3 |
[2,6; 2,9) |
10 |
0,2867 |
9,1744 |
0,0743 |
|
4 |
[2,9; 3,2) |
8 |
0,2628 |
8,4096 |
0,01995 |
|
5 |
[3,2; 3,5) |
4 |
0,1389 |
4,4448 |
0,0445 |
|
6 |
[3,5; 3,8) |
2 |
0,0423 |
1,3536 |
0,3087 |
|
|
- |
32 |
0,9764 |
31,2448 |
Кнабл=0,9435 |
Наблюдаемое значение статистики Пирсона равно Кнабл=0,9435.
Определим границу критической области.
Так как статистика Пирсона измеряет
разницу между эмпирическим и теоретическим
распределениями, то чем больше ее
наблюдаемое значение Кнабл,
тем сильнее довод против основной
гипотезы. Поэтому критическая область
для этой статистики всегда правосторонняя:
[Ккр; +∞). Ее границу Ккр=
находим по таблицам распределения
«хи-квадрат» и заданным значениям
α=0,05, число интервалов k=6,
r=2 (так как параметры
и
оценены по выборке):
.
Наблюдаемое значение статистики Пирсона не попадает в критическую область: Кнабл< Ккр, поэтому нет оснований отвергать основную гипотезу.
Вывод: на уровне значимости 0,05 справедливо предположение о том, что данная случайная величина Х имеет нормальное распределение.
Задача 6. Тема «Ранговая корреляция».
Найти выборочный коэффициент ранговой корреляции Спирмена и проверить значимость полученного результата при α=0,05.
Восемь годовых консолидированных балансов проранжированы по двум признакам: Х – объем продаж, Y – цена товара.
|
Ранг Х |
2 |
5 |
7 |
4 |
6 |
8 |
3 |
1 |
|
Ранг Y |
3 |
6 |
4 |
8 |
7 |
5 |
2 |
1 |
Решение:
По исходной таблице рассчитаем коэффициент корреляции Спирмена. Последовательностям значений хi и yi будет соответствовать последовательность рангов (таблица 6.1).
Ранговые последовательности Таблица 6.1
|
i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
ri |
2 |
5 |
7 |
4 |
6 |
8 |
3 |
1 |
|
si |
3 |
6 |
4 |
8 |
7 |
5 |
2 |
1 |
|
di |
-1 |
-1 |
3 |
-4 |
-1 |
3 |
1 |
0 |
В последней строке таблицы указана разность рангов di=ri-si, i=1,2,…,8.
Величина S равна:
.
Коэффициент корреляции Спирмена рассчитываем по формуле при n=8:
.
По значению коэффициента корреляции Спирмена можно сказать, что между признаками X и Y есть слабая положительная линейная корреляционная связь.
Проверим значимость коэффициента корреляции.
Основная гипотеза Н0 состоит в том, что коэффициент корреляции rs не значим Н0: rs=0, то есть между переменными X и Y нет линейной связи. Альтернативная гипотеза Н1: rs>0 – коэффициент корреляции значим, переменные X и Y связаны положительной линейной зависимостью.
Наблюдаемое значение статистики К равно:
.
Согласно заданному уровню значимости α=0,05 и n=8 определим границу критической области по таблице распределения Стьюдента. По виду альтернативной гипотезы заключаем, что критическая область является правосторонней: [Ккр; +∞). Находим значение Ккр:
.
Наблюдаемое значение
не
попадает в критическую область [1,94; +∞),
поэтому альтернативную гипотезу
отвергаем в пользу основной: коэффициент
корреляции rs
не значим и при уровне значимости α=0,05
между переменными X
и Y нет линейной связи.
