
- •Математическая статистика
- •Лабораторная работа 1 Основы статистического описания
- •Упорядочение выборки
- •Построение эмпирической функции распределения и гистограммы
- •Нахождение числовых характеристик выборки
- •Пример выполнения и оформления лабораторной работы
- •Контрольные вопросы
- •Лабораторная работа 2 Проверка статистической гипотезы о законе распределения генеральной совокупности по выборке
- •Построение гистограммы и выдвижение гипотезы о распределении генеральной совокупности
- •Определение оценок параметров распределения
- •Проверка согласия теоретического и статистического распределений
- •Примеры
- •Пример выполнения и оформления лабораторной работы
- •Контрольные вопросы
- •Исходные данные для лабораторных работ 1 и 2
- •Лабораторная работа 3 Построение доверительных интервалов математического ожидания и дисперсии в случае выборки из нормальной генеральной совокупности
- •Нахождение оценок математического ожидания и дисперсии
- •Построение доверительного интервала математического ожидания
- •Построение доверительного интервала дисперсии
- •Пример выполнения и оформления лабораторной работы
- •Контрольные вопросы
- •Исходные данные для лабораторной работы 3
- •Лабораторная работа 4 Линейная регрессия
- •Построение линии регрессии
- •Построение доверительных интервалов для коэффициентов регрессии
- •Проверка модели на адекватность
- •Заключение
- •Контрольные вопросы
- •Варианты заданий к лабораторной работе 4
- •Функция Лапласа
- •Двусторонние границы t – распределения: значения , для которых .
- •- Распределение
- •Библиографический список
Лабораторная работа 4 Линейная регрессия
Порядок выполнения работы
1. Ознакомиться с методическими указаниями.
2. Для данного
набора значений независимой переменной
и зависимой переменной
,
построив точки на плоскости, выдвинуть
гипотезу о порядке линейной модели.
3. Методом наименьших квадратов найти оценки неизвестных параметров и
построить полученную линию регрессии.
4. Построить доверительные интервалы для оценок неизвестных параметров
для доверительной
вероятности
.
Проверить гипотезу
.
5. Построить
доверительные интервалы для предсказанных
значений
для доверительной вероятности
и показать их на графике.
6. Проверить построенную модель на адекватность.
7. Составить отчет, в котором привести графики, результаты счета, выводы.
8. Ответить устно на контрольные вопросы.
Построение линии регрессии
Связь зависимой переменной с одной или несколькими независимыми пере-
менными представляют
в виде уравнения регрессии
.
Построение уравнения регрессии предполагает решение двух задач:
а) выбор независимых переменных, существенно влияющих на зависимую величину, и определение вида уравнения регрессии;
б) оценивание параметров (коэффициентов) уравнения.
Пусть для одной
независимой переменной
по расположению точек
на плоскости выдвинута гипотеза о
линейной зависимости между переменными
,
т. е.
- исход
-ого
опыта, можно представить в виде:
,
(1)
где
- число опытов,
-
случайные добавки, при учете которых
любой индивидуальный
получает возможность не попасть на
линию регрессии,
-
неизвестные параметры. Предполагается,
что
распределены нормально с параметрами
и независимы. Начнем с предположения,
что модель установлена, но на последующих
стадиях будем проверять, так ли это на
самом деле. Модель (1) линейна относительно
неизвестных параметров, относительно
неизвестной функции модель (1) первого
порядка.
В соответствии
с методом наименьших квадратов оценки
параметров
находятся из условия обращения в минимум
величины
(2)
Дифференцируя
равенство (2) по
и приравнивая полученные частные
производные нулю, для нахождения оценок
получим так называемую нормальную
систему:
(3)
Решив систему (3),
найдем оценки
неизвестных параметров
:
(4)
Замечание. Для линейной модели второго порядка
,
нормальная система
для нахождения оценок
неизвестных параметров
будет иметь вид
(5)
Если ввести следующие обозначения
то система (5) может быть записана в виде
.
(6)
Для модели
,
,
где
- значение
–й
независимой переменной
,
в
-м
опыте, нормальная система также будет
иметь вид (6), если
.
Построение доверительных интервалов для коэффициентов регрессии
Для построения
доверительных интервалов для
необходимо знать законы распределения
их оценок
.
Если
распределены нормально с параметрами
и
независимы, то случайные величины
также распределены нормально и независимы.
После преобразования формул (4) получим
,
Оценки
также имеют нормальное распределение,
как линейные комбинации нормально
распределенных случайных величин. Можно
показать, что
(7)
где
- ошибка опыта. Случайная величина
распределена нормально с параметрами
.
Но
неизвестно, поэтому в (7) заменим
его оценкой
.
Тогда
.
(8)
Замена неслучайной
величины
ее оценкой, являющейся случайной
величиной, приводит к тому, что величина
только асимптотически нормальна
.
Для малых
величина
имеет
-распределение,
число степеней свободы определяется
способом нахождения
,
точнее способом нахождения
.
Лучшим способом
является нахождение
по параллельным опытам (опытам,
поставленным в одной точке). В этом
случае
,
(9)
где
-
-е
значение
в точке
,
– число повторных наблюдений в точке
,
- число точек, в которых проводятся
повторные опыты.
Тогда величина
имеет
-распределение
с
степенями свободы. Доверительный
интервал для
,
соответствующий доверительной вероятности
,
имеет вид
,
где
- значение
,
при котором
.
Замечание.
Если параллельных опытов нет, то оценка
может быть найдена следующим образом.
Пусть
- предсказанное значение
данного
,
когда
определены, т. е.
.
В качестве оценки
может быть принято следующее отношение:
.
(10)
Сумма
имеет
степени свободы, т. к. по данным испытаний
определяются два коэффициента.
Величина
в этом случае имеет
-распределение
с
степенями свободы.
Доверительный
интервал для
можно использовать для проверки гипотезы
.
Если доверительный интервал, соответствующий
доверительной вероятности
,
содержит значение
,
то гипотеза
не отвергается на уровне значимости
.
В частности доверительный интервал
может быть использован для проверки
гипотезы
.
Если гипотеза
отвергается, то параметр
называется значимым. Аналогичными
рассуждениями можно получить доверительный
интервал для
,
где
определяется способом нахождения
.
Интерес для практики
представляет доверительный интервал
для линии регрессии. Для его построения
необходимо знать оценку дисперсии
.
,
где
определяется по формуле (9) или (10).
Доверительный
интервал для
имеет вид
.
(11)
Доверительная зона (11) определяет местоположение линии регрессии, а не воз-
можных значений
зависимой переменной. Доверительный
интервал для значений
определяется по формулам
.