Оглавление
1 Статистическое описание и выборочные характеристики двумерного случайного вектора. 1
2 Линейная регрессия. 2
3 Однофакторный дисперсионный анализ. 3
Практическая часть. 5
Теоретическая часть.
-
Статистическое описание и выборочные характеристики двумерного случайного вектора.
Пусть
,
– выборка объема
из наблюдений случайного двумерного
вектора
.
Предварительное представление о
двумерной генеральной совокупности
можно получить, изображая элементы
выборки точками на плоскости с выбранной
декартовой системой координат. Это
представление выборки называется
диаграммой рассеивания.
Распределением двумерной выборки
называется распределение двумерного
дискретного случайного вектора,
принимающего значения
,
с вероятностями, равными
.
Выборочные числовые характеристики
вычисляются как соответствующие числовые
характеристики двумерного случайного
вектора дискретного типа.
Выборочная линейная регрессия
на
по выборке
,
определяется уравнением
![]()
![]()
Выборочные средние находятся по формулам
.
Вычислим суммы квадратов отклонений от среднего и произведений отклонений от средних:
![]()
![]()
![]()
Отсюда
![]()
Коэффициенты
и
называются выборочными коэффициентами
регрессии. Они вычисляются по формулам
![]()
Аналогично определяется выборочная
линейная регрессия
на
:
![]()
коэффициенты
и
которой находятся по формулам
![]()
Для контроля правильности расчетов используют соотношение
![]()
Прямые регрессии пересекутся в точке
.
-
Линейная регрессия.
В регрессионном анализе изучается связь
между зависимой переменной
и одной или несколькими независимыми
переменными. Пусть переменная
зависит от одной переменной
.
При этом предполагается, что переменная
принимает фиксированные значения, а
зависимая переменная
имеет случайный разброс из-за ошибок
измерения, влияния неучтенных факторов
и т.д. Каждому значению переменной
соответствует некоторое вероятностное
распределение случайной величины
.
Предположим, что случайная величина
в
среднем линейно зависит от значений
переменной
.
Это означает, что условное математическое
ожидание случайной величины
при заданном значении переменной
имеет вид
![]()
Функция переменной, определяемая правой
частью формулы, называется линейной
регрессией
на
,
а параметры
и
-
параметрами линейной регрессии. На
практике параметры линейной регрессии
неизвестны и их оценки определяют по
результатам наблюдений переменных
и
.
Пусть проведено
независимых наблюдений случайной
величины
при значениях переменной
при этом измерения величины
дали
следующие результаты:
Так как эти значения имеют «разброс»
относительно регрессии, то связь между
переменными
и
можно записать в виде линейной
регрессионной модели:
![]()
где
-
случайная ошибка наблюдений, причем
Значение дисперсии ошибок наблюдений
неизвестно, и оценка ее определяется
по результатам наблюдений.
Задача линейного регрессионного анализа
состоит в том, чтобы по результатам
наблюдений
,![]()
-
получить наилучшие точечные и интервальные оценки неизвестных параметров
и
модели; -
проверить статистические гипотезы о параметрах модели;
-
проверить достаточно ли хорошо модель согласуется с результатами наблюдений.
Разности между наблюдаемыми значениями
переменной
при
,
и
расчетными значениями
называются остатками и обозначаются
:
![]()
Качество аппроксимации результатов
наблюдений
,
выборочной регрессии определяется
величиной остаточной дисперсии,
вычисляемой по формуле:
![]()
Величина
,
определяемая выражением
![]()
называется остаточной суммой квадратов.
В практических вычислениях остаточную сумму квадратов получают из тождества
![]()
которое записывается в виде
,
где
![]()
Величина
называется суммой квадратов, обусловленной
регрессией.
Полезной характеристикой линейной
регрессии является коэффициент
детерминации
,
вычисляемый по формуле
![]()
Коэффициент детерминации
равен той доле разброса результатов
наблюдений
,
относительно горизонтальной прямой
,
которая объясняется выборочной
регрессией.
В случае линейной регрессии
на
между коэффициентом
и выборочным коэффициентом корреляции
имеется следующее соотношение:
.
