- •Глава 13. Математическая статистика.
- •§1. Выборка, способы её записи, графическое представление и числовые характеристики.
- •13.9 13.10
- •Основные числовые характеристики выборки.
- •§2. Статистические оценки параметров распределения.
- •2.1 Точечные оценки.
- •2.2 Интервальные оценки. Необходимый объём выборки.
- •Доверительные интервалы для параметров инормально распределённой генеральной совокупности.
- •Доверительный интервал для параметра биномиального распределения.
- •§3. Проверка статистических гипотез.
- •3.1 Проверка гипотез о параметрах нормально распределённой генеральной совокупности. Проверка гипотез о средних нормального распределения.
- •3.2 Проверка гипотез о параметре биномиального распределения.
- •3.3 Проверка гипотезы о виде распределения генеральной совокупности.
- •§4. Корреляционно-регрессионный анализ.
- •13.80 13.81
- •13.86 13.87
- •13.88 13.89
- •13.90 13.91
- •13.92 13.93
- •13.96 13.97
§4. Корреляционно-регрессионный анализ.
На практике часто бывает важно знать, существует ли зависимость между некоторыми наблюдаемыми величинами, насколько тесно они связаны между собой, можно ли по значению одной величины сделать какие-либо выводы о предполагаемом значении другой величины и т.д. Для решения задач такого рода и применяется корреляционно-регрессионный анализ.
Пусть - выборка из двумерной генеральной совокупности. Предварительное представление о зависимости между случайными величинамииможно получить изобразив в прямоугольной системе координат на плоскости точки. Такое графическое представление двумерной выборки называютдиаграммой рассеивания (корреляционным полем).
Количественной характеристикой степени линейной зависимости между величинами иявляетсякоэффициент корреляции . Состоятельной оценкой коэффициента корреляции служит статистика, где,,,,.
Если , то все выборочные точки,лежат на одной прямой. Привыборочные данные только имеют тенденцию сосредотачиваться около прямых:
, ,
называемых (теоретическими) прямыми регрессии наина, соответственно. Здесь,. Первое уравнение даёт наилучший в среднем квадратичном прогноз ожидаемых значенийпо наблюдениям, второе – прогноз значенийпо наблюдениям.
Прямые ,называютсяэмпирическими прямыми регрессии наина, соответственно. Здесь ,,,,- найденные по выборке,, значения статистик,,,,, являющихся состоятельными оценками параметров,,,,двумерной генеральной совокупности. Если выборка представлена корреляционной таблицей,,,, где,- или отдельные различные выборочные значенияиили середины интервалов группировки выборочных значенийи,- частота с которой в выборке встречается пара, то значения статистик вычисляются по формулам:
, ,,,
,,
В задачах 13.80-13.81 для указанных выборок вычислить коэффициенты корреляции и построить диаграммы рассеивания.
13.80 13.81
В задачах 13.82-13.83 для указанных выборок вычислить коэффициенты корреляции, определить и нанести на диаграмму рассеивания прямые регрессии и.
13.82
13.83
, ,,,
В задачах 13.84-13.85 вычислить коэффициент корреляции и найти уравнения прямых регрессии ипо данным в следующих корреляционных таблицах:
13.84
13.85
В случае выбора из двумерной нормально распределённой генеральной совокупности равенство влечёт независимость случайных величини. Проверка параметрической гипотезыоснована на статистике, которая имеет распределение Стьюдента сстепенями свободы.
Проверка гипотезы о значимости выборочного коэффициента
корреляции .
Гипотеза |
Статистика критерия |
Критическое множество |
|
, где |
Здесь: -критическая точка распределения Стьюдента (приложение 6.4),.- объём выборки.
Доверительный интервал для коэффициента корреляции.
Здесь: - корень уравнения (приложение.6.2); -выборочный коэффициент корреляции;- объём выборки. Значения гиперболического тангенса вычисляются по таблице приложения 6.6.
В задачах 13.86-13.89 построить доверительные интервалы для коэффициентов корреляции двумерной нормально распределённой генеральной совокупности по следующим данным: