Министерство общего и профессионального образования
Российской федерации
Московский государственный институт электронной техники
(Технический университет)
Курсовая работа
“ Анализ данных в линейной регрессионной модели ”
по курсу
“ Теория вероятностей и
математическая статистика ”
Преподаватель: Бардушкин В.В.
Студент: группа ЭКТ-27
Выборнов А.С.
Москва 2004
Теоретическая часть.
1.Статистическое описание и выборочные характеристики
двумерного случайного вектора.
Пусть ,- выборка объема из наблюдений случайного двумерного вектора. Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой системой координат. Это представление выборки называется диаграммой рассеивания.
Распределением двумерной выборки называется распределение двумерного дискретного случайного вектора, принимающего значения , с вероятностями, равными . Выборочные числовые характеристики вычисляются как соответствующие числовые характеристики двумерного случайного вектора дискретного типа.
Выборочная линейная регрессия на по выборке , определяется уравнением
Выборочные средние находятся по формулам
.
Вычислим суммы квадратов отклонений от среднего и произведений отклонений от средних:
Отсюда
Коэффициенты и называются выборочными коэффициентами регрессии. Они вычисляются по формулам
Аналогично определяется выборочная линейная регрессия на :
коэффициенты и которой находятся по формулам
Для контроля правильности расчетов используют соотношение
Прямые регрессии пересекутся в точке .
2.Линейная регрессия.
В регрессионном анализе изучается связь между зависимой переменной и одной или несколькими независимыми переменными. Пусть переменная зависит от одной переменной . При этом предполагается, что переменная принимает фиксированные значения, а зависимая переменная имеет случайный разброс из-за ошибок измерения, влияния неучтенных факторов и т.д. Каждому значению переменной соответствует некоторое вероятностное распределение случайной величины . Предположим, что случайная величина в среднем линейно зависит от значений переменной . Это означает, что условное математическое ожидание случайной величины при заданном значении переменной имеет вид
Функция переменной, определяемая правой частью формулы, называется линейной регрессией на , а параметры и - параметрами линейной регрессии. На практике параметры линейной регрессии неизвестны и их оценки определяют по результатам наблюдений переменных и .
Пусть проведено независимых наблюдений случайной величины при значениях переменной при этом измерения величины дали следующие результаты: Так как эти значения имеют «разброс» относительно регрессии, то связь между переменными и можно записать в виде линейной регрессионной модели:
где - случайная ошибка наблюдений, причем Значение дисперсии ошибок наблюдений неизвестно, и оценка ее определяется по результатам наблюдений.
Задача линейного регрессионного анализа состоит в том, чтобы по результатам наблюдений ,
-получить наилучшие точечные и интервальные оценки неизвестных параметров и модели;
-проверить статистические гипотезы о параметрах модели;
-проверить достаточно ли хорошо модель согласуется с результатами наблюдений.
Разности между наблюдаемыми значениями переменной при ,и расчетными значениями называются остатками и обозначаются :
Качество аппроксимации результатов наблюдений , выборочной регрессии определяется величиной остаточной дисперсии, вычисляемой по формуле:
Величина , определяемая выражением
называется остаточной суммой квадратов.
В практических вычислениях остаточную сумму квадратов получают из тождества
которое записывается в виде
,
где
Величина называется суммой квадратов, обусловленной регрессией.
Полезной характеристикой линейной регрессии является коэффициент детерминации ,
вычисляемый по формуле
Коэффициент детерминации равен той доле разброса результатов наблюдений , относительно горизонтальной прямой , которая объясняется выборочной регрессией.
В случае линейной регрессии на между коэффициентом и выборочным коэффициентом корреляции имеется следующее соотношение:
.