Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
otvety_stat_metody.docx
Скачиваний:
35
Добавлен:
24.09.2019
Размер:
1.8 Mб
Скачать
  1. Метод наименьших квадратов

Пусть множество точек (xi, yi), i = 1,…, n расположено на плоскости вдоль некоторой прямой

Т огда в качестве функции fa(x), аппроксимирующей функцию регрессии f(x) = M [Y|x] естественно взять линейную функцию аргумента x:

Т. е. в качестве базисных функций здесь выбраны ψ0(x)≡1 и ψ1(x)≡x. Такую регрессию называют простой линейной регрессией.

Если множество точек (xi, yi), i = 1,…, n расположено вдоль некоторой кривой, то в качестве fa(x) естественно попробовать выбрать семейство парабол

Эта функция является нелинейной по параметрам θ0 и θ1, однако путем функционального преобразования (в данном случае логарифмирования) ее можно привести к новой функции f’a(x) , линейной по параметрам:

  1. Простая линейная регрессия

Простейшей моделью регрессии является простая (одномерная, однофакторная, парная) линейная модель, имеющая следующий вид:

где εi – некоррелированные между собой случайные величины (ошибки), имеющие нулевые математические ожидания и одинаковые дисперсии σ2, a и b – постоянные коэффициенты (параметры), которые необходимо оценить по измеренным значениям отклика yi.

Для нахождения оценок параметров a и b линейной регрессии, определяющих наиболее удовлетворяющую экспериментальным данным прямую линию:

применяется метод наименьших квадратов.

С огласно методу наименьших квадратов оценки параметров a и b находят из условия минимизации суммы квадратов отклонений значений yi по вертикали от “истинной” линии регрессии:

Пусть было произведено десять наблюдений случайной величины Y при фиксированных значениях переменной X

Для минимизации D приравняем к нулю частные производные по a и b:

В результате получим следующую систему уравнений для нахождения оценок a и b:

Решение этих двух уравнений дает:

Выражения для оценок параметров a и b можно представить также в виде:

Тогда эмпирическое уравнение регрессионной прямой Y на X можно записать в виде:

Н есмещенная оценка дисперсии σ2 отклонений значений yi oт подобранной прямой линии регрессии дается выражением

Рассчитаем параметры уравнения регрессии

Таким образом, прямая регрессии имеет вид:

А оценка дисперсии отклонений значений yi oт подобранной прямой линии регрессии

  1. Проверка значимости линии регрессии

Найденная оценка b ≠ 0 может быть реализацией случайной величины, математическое ожидание которой равно нулю, т. е. может оказаться, что никакой регрессионной зависимости на самом деле нет.

Чтобы разобраться с этой ситуацией, следует проверить гипотезу Н0: b = 0 при конкурирующей гипотезе Н1: b ≠ 0.

Проверку значимости линии регрессии можно провести с помощью дисперсионного анализа.

Р ассмотрим следующее тождество:

Величина yi ŷi = εi называется остатком и представляет собой разность между двумя величинами:

  • отклонением наблюдаемого значения (отклика) от общего среднего откликов;

  • отклонением предсказанного значения отклика ŷi от того же среднего

Записанное тождество можно записать в виде

Возведя обе его части в квадрат и просуммировав по i, получим:

Г де величины получили название:

полной (общей) суммой квадратов СКп, которая равна сумме квадратов отклонений наблюдений относительно среднего значения наблюдений

сумма квадратов, обусловленной регрессией СКр, которая равна сумме квадратов отклонений значений линии регрессии относительно среднего наблюдений.

о статочная сумма квадратов СК0. которая равна сумме квадратов отклонений наблюдений относительно значений линии регрессии

Таким образом, разброс Y-ков относительно их среднего значения можно приписать в некоторой степени тому факту, что не все наблюдения лежат на линии регрессии. Если бы это было так, то сумма квадратов относительно регрессии была бы равна нулю. Отсюда следует, что регрессия будет значимой, если сумма квадратов СКр будет больше суммы квадратов СК0.

Вычисления по проверки значимости регрессии проводят в следующей таблице дисперсионного анализа

Если ошибки εi распределены по нормальному закону, то при справедливости гипотезы Н0: b = 0 статистика:

распределена по закону Фишера с числом степеней свободы 1 и n−2.

Нулевая гипотеза будет отклонена на уровне значимости α, если вычисленное значение статистики F будет больше α-процентной точки f1;n−2;α распределения Фишера.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]