Московский государственный институт электронной техники
(Технический университет)
Курсовая работа
“ Анализ данных в линейной регрессионной модели ”
по курсу
“ Теория вероятностей и
математическая статистика ”
Преподаватель:Бардушкина и.В. Студент: группа экт-23
Белоусов А.В.
Москва 2005
Теоретическая часть.
1.Статистическое
описание и выборочные характеристики
двумерного случайного вектора.
Пусть
,
-
выборка объема
из наблюдений случайного двумерного
вектора
.
Предварительное представление о
двумерной генеральной совокупности
можно получить, изображая элементы
выборки точками на плоскости с выбранной
декартовой системой координат. Это
представление выборки называется
диаграммой рассеивания.
Распределением двумерной выборки
называется распределение двумерного
дискретного случайного вектора,
принимающего значения
,
с вероятностями, равными
.
Выборочные числовые характеристики
вычисляются как соответствующие числовые
характеристики двумерного случайного
вектора дискретного типа.
Выборочная линейная регрессия
на
по выборке
,
определяется уравнением
![]()
![]()
Выборочные средние находятся по формулам
.
Вычислим суммы квадратов отклонений от среднего и произведений отклонений от средних:
![]()
Отсюда
Коэффициенты
и
называются выборочными коэффициентами
регрессии. Они вычисляются по формулам
![]()
Аналогично определяется выборочная
линейная регрессия
на
:
![]()
коэффициенты
и
которой находятся по формулам
![]()
Для контроля правильности расчетов используют соотношение
![]()
Прямые регрессии пересекутся в точке
.
2.Линейная регрессия.
В регрессионном
анализе изучается связь между зависимой
переменной
и одной или несколькими независимыми
переменными. Пусть переменная
зависит от одной переменной
.
При этом предполагается, что переменная
принимает фиксированные значения, а
зависимая переменная
имеет случайный разброс из-за ошибок
измерения, влияния неучтенных факторов
и т.д. Каждому значению переменной
соответствует некоторое вероятностное
распределение случайной величины
.
Предположим, что случайная величина
в
среднем линейно зависит от значений
переменной
.
Это означает, что условное математическое
ожидание случайной величины
при заданном значении переменной
имеет вид
Функция переменной, определяемая правой
частью формулы, называется линейной
регрессией
на
,
а параметры
и
-
параметрами линейной регрессии. На
практике параметры линейной регрессии
неизвестны и их оценки определяют по
результатам наблюдений переменных
и
.
Пусть проведено
независимых наблюдений случайной
величины
при значениях переменной
при этом измерения величины
дали
следующие результаты:
Так как эти значения имеют «разброс»
относительно регрессии, то связь между
переменными
и
можно записать в виде линейной
регрессионной модели:
![]()
где
-
случайная ошибка наблюдений, причем
Значение дисперсии ошибок наблюдений
неизвестно, и оценка ее определяется
по результатам наблюдений.
Задача линейного регрессионного
анализа состоит в том, чтобы по результатам
наблюдений
,![]()
-получить наилучшие точечные и интервальные
оценки неизвестных параметров
и
модели;
-проверить статистические гипотезы о параметрах модели;
-проверить достаточно ли хорошо модель согласуется с результатами наблюдений.
Разности между наблюдаемыми значениями
переменной
при
,
и
расчетными значениями
называются остатками и обозначаются
:
![]()
Качество аппроксимации результатов
наблюдений
,
выборочной регрессии определяется
величиной остаточной дисперсии,
вычисляемой по формуле:
Величина
,
определяемая выражением
называется остаточной суммой квадратов.
В практических вычислениях остаточную сумму квадратов получают из тождества
![]()
которое записывается в виде
,
где
![]()
Величина
называется суммой квадратов, обусловленной
регрессией.
Полезной характеристикой линейной
регрессии является коэффициент
детерминации
,
вычисляемый по формуле
![]()
Коэффициент детерминации
равен той доле разброса результатов
наблюдений
,
относительно горизонтальной прямой
,
которая объясняется выборочной
регрессией.
В случае линейной регрессии
на
между коэффициентом
и выборочным коэффициентом корреляции
имеется следующее соотношение:
.
