
- •Тема 1. Вариационные ряды и их характеристики
- •1.1. Выборка и генеральная совокупность
- •1.2. Вариационные ряды и их графическое изображение
- •Пользуясь формулой, вычисляем накопленные частоты интервалов. В частности,
- •1 .3. Статистические характеристики вариационного ряда
- •Тема 2. Статистические оценки параметров распределения
- •( Число степеней свободы)
- •Тема 3. Статистическая проверка гипотез
- •Тема 4. Корреляционный и регрессионный анализ
- •4.1. Корреляционный анализ
- •Пример 2. Определить тесноту взаимосвязи между результатами, показанными легкоатлетами в беге на 100 м, и местом, занятым ими же в соревновании по тройному прыжку. Данные приведены в табл.
- •4.2. Оценка достоверности коэффициента корреляции
- •4.3. Регрессионный анализ
Пример 2. Определить тесноту взаимосвязи между результатами, показанными легкоатлетами в беге на 100 м, и местом, занятым ими же в соревновании по тройному прыжку. Данные приведены в табл.
Результат на 100м (х,с) |
10,7 |
10,6 |
10,7 |
10,5 |
10,9 |
10,4 |
10,3 |
10,7 |
10,7 |
Место в тр.прыжке (у) |
5 |
2 |
6 |
4 |
3 |
7 |
9 |
8 |
1 |
Решение. При решении этой задачи лучше все вычисления постепенно заносить в таблицу.
-
Результаты в беге ранжируем, то есть располагаем их в порядке возрастания:
10,3; 10,4; 10,5; 10,6; 10,7; 10,7; 10,7; 10,7; 10,9.
Для тех результатов, которые повторяются несколько раз, ранг берем как среднее рангов этих результатов. Результат 10,7 повторяется четыре раза, занимая в ряду ранги 5, 6, 7, 8. Тогда
.
|
|
|
|
|
|
|
1 |
10,7 |
5 |
6,5 |
5 |
1,5 |
2,25 |
2 |
10,6 |
2 |
4,0 |
2 |
2,0 |
4,00 |
3 |
10,7 |
6 |
6,5 |
6 |
0,5 |
0,25 |
4 |
10,5 |
4 |
3,0 |
4 |
-1,0 |
1,00 |
5 |
10,9 |
3 |
9,0 |
3 |
6,0 |
36,00 |
6 |
10,4 |
7 |
2,0 |
7 |
-5,0 |
25,00 |
7 |
10,3 |
9 |
1,0 |
9 |
-8,0 |
64,00 |
8 |
10,7 |
8 |
6,5 |
8 |
-1,5 |
2,25 |
9 |
10,7 |
1 |
6,5 |
1 |
5,5 |
30,25 |
|
|
|
|
|
|
165 |
Для
ранг
это занятое место, поэтому
,
и 5-й столбец таблицы повторяет 3-й
столбец.
-
Находим разность рангов:
(предпоследний столбец).
-
Разность рангов возводим в квадрат и суммируем:
.
-
Находим:
.
-
Вывод: между исследуемыми признаками существует средне-выраженная отрицательная зависимость, показывающая, что при уменьшении признака
(времени бега на 100 м) результат прыжка в длину увеличивается.
4.2. Оценка достоверности коэффициента корреляции
Полученные в
примерах коэффициенты корреляции
являются выборочными, так как они
определены для выборок из соответствующих
генеральных совокупностей. Поэтому
всегда существует ошибка
коэффициента корреляции.
Эта ошибка - расхождение между коэффициентом
корреляции выборки объемом
и коэффициентом корреляции для генеральной
совокупности
определяется формулами:
при
;
и
при
.
Оценка достоверности
коэффициента линейной корреляции
осуществляется с помощью
-критерия
Стьюдента:
.
В данном случае
критерий служит для проверки нулевой
гипотезы
о том, что значение коэффициента
корреляции для генеральной совокупности
равно нулю, т.е. в
генеральной совокупности отсутствует
корреляция.
Альтернативной является гипотеза
.
Критическое
значение
определяется по таблице Стьюдента.
Число степеней свободы
связано с объемом выборки
формулой:
.
Если
,
то нуль-гипотеза отвергается, то есть
вычисленный коэффициент корреляции
значимо отличается от нуля с вероятностью
.
Пример 3. Коэффициент корреляции между показателями "Толчок штанги" и "Прыжок в высоту с места" для 13 тяжелоатлетов равен 0,855. Требуется оценить достоверность коэффициента корреляции.
Решение.
Так как
,
то для вычисления расчетное значение
критерия Стьюдента пользуемся формулой:
.
Задаемся уровнем
значимости коэффициента корреляции
(вероятность ошибки):
.
По формуле находим число степеней
свободы:
.
Из таблицы критических значений распределения Стьюдента следует:
.
То есть
(5,48>4,437). Следовательно, связь между
показателями, выраженная коэффициентом
корреляции, статистически значима с
вероятностью 0,999.