- •Тема 1. Вариационные ряды и их характеристики
- •1.1. Выборка и генеральная совокупность
- •1.2. Вариационные ряды и их графическое изображение
- •Пользуясь формулой, вычисляем накопленные частоты интервалов. В частности,
- •1 .3. Статистические характеристики вариационного ряда
- •Тема 2. Статистические оценки параметров распределения
- •( Число степеней свободы)
- •Тема 3. Статистическая проверка гипотез
- •Тема 4. Корреляционный и регрессионный анализ
- •4.1. Корреляционный анализ
- •Пример 2. Определить тесноту взаимосвязи между результатами, показанными легкоатлетами в беге на 100 м, и местом, занятым ими же в соревновании по тройному прыжку. Данные приведены в табл.
- •4.2. Оценка достоверности коэффициента корреляции
- •4.3. Регрессионный анализ
Пример 2. Определить тесноту взаимосвязи между результатами, показанными легкоатлетами в беге на 100 м, и местом, занятым ими же в соревновании по тройному прыжку. Данные приведены в табл.
Результат на 100м (х,с) |
10,7 |
10,6 |
10,7 |
10,5 |
10,9 |
10,4 |
10,3 |
10,7 |
10,7 |
Место в тр.прыжке (у) |
5 |
2 |
6 |
4 |
3 |
7 |
9 |
8 |
1 |
Решение. При решении этой задачи лучше все вычисления постепенно заносить в таблицу.
-
Результаты в беге ранжируем, то есть располагаем их в порядке возрастания:
10,3; 10,4; 10,5; 10,6; 10,7; 10,7; 10,7; 10,7; 10,9.
Для тех результатов, которые повторяются несколько раз, ранг берем как среднее рангов этих результатов. Результат 10,7 повторяется четыре раза, занимая в ряду ранги 5, 6, 7, 8. Тогда
.
1 |
10,7 |
5 |
6,5 |
5 |
1,5 |
2,25 |
2 |
10,6 |
2 |
4,0 |
2 |
2,0 |
4,00 |
3 |
10,7 |
6 |
6,5 |
6 |
0,5 |
0,25 |
4 |
10,5 |
4 |
3,0 |
4 |
-1,0 |
1,00 |
5 |
10,9 |
3 |
9,0 |
3 |
6,0 |
36,00 |
6 |
10,4 |
7 |
2,0 |
7 |
-5,0 |
25,00 |
7 |
10,3 |
9 |
1,0 |
9 |
-8,0 |
64,00 |
8 |
10,7 |
8 |
6,5 |
8 |
-1,5 |
2,25 |
9 |
10,7 |
1 |
6,5 |
1 |
5,5 |
30,25 |
|
|
|
|
|
|
165 |
Для ранг это занятое место, поэтому , и 5-й столбец таблицы повторяет 3-й столбец.
-
Находим разность рангов: (предпоследний столбец).
-
Разность рангов возводим в квадрат и суммируем: .
-
Находим: .
-
Вывод: между исследуемыми признаками существует средне-выраженная отрицательная зависимость, показывающая, что при уменьшении признака (времени бега на 100 м) результат прыжка в длину увеличивается.
4.2. Оценка достоверности коэффициента корреляции
Полученные в примерах коэффициенты корреляции являются выборочными, так как они определены для выборок из соответствующих генеральных совокупностей. Поэтому всегда существует ошибка коэффициента корреляции. Эта ошибка - расхождение между коэффициентом корреляции выборки объемом и коэффициентом корреляции для генеральной совокупности определяется формулами:
при ; и при .
Оценка достоверности коэффициента линейной корреляции осуществляется с помощью -критерия Стьюдента:
.
В данном случае критерий служит для проверки нулевой гипотезы о том, что значение коэффициента корреляции для генеральной совокупности равно нулю, т.е. в генеральной совокупности отсутствует корреляция. Альтернативной является гипотеза .
Критическое значение определяется по таблице Стьюдента. Число степеней свободы связано с объемом выборки формулой:
.
Если , то нуль-гипотеза отвергается, то есть вычисленный коэффициент корреляции значимо отличается от нуля с вероятностью .
Пример 3. Коэффициент корреляции между показателями "Толчок штанги" и "Прыжок в высоту с места" для 13 тяжелоатлетов равен 0,855. Требуется оценить достоверность коэффициента корреляции.
Решение. Так как , то для вычисления расчетное значение критерия Стьюдента пользуемся формулой:
.
Задаемся уровнем значимости коэффициента корреляции (вероятность ошибки): . По формуле находим число степеней свободы:
.
Из таблицы критических значений распределения Стьюдента следует:
.
То есть (5,48>4,437). Следовательно, связь между показателями, выраженная коэффициентом корреляции, статистически значима с вероятностью 0,999.