
- •Тема 9. Введение в регрессионный анализ.
- •1. Теоретическая и практическая задачи регрессионного анализа.
- •2. Задача линейной регрессии и оценка по методу наименьших квадратов.
- •3. Свойства оценки по методу наименьших квадратов в задаче линейной регрессии.
- •4. Оценка остаточной дисперсии.
- •5. Качество регрессии и коэффициент детерминации.
- •6. Задача нормальной линейной регрессии.
- •7. Интервальное оценивание в задаче нормальной линейной регрессии.
Тема 9. Введение в регрессионный анализ.
1. Теоретическая и практическая задачи регрессионного анализа.
Основная
задача регрессионного анализа заключается
в исследовании зависимости между
случайной величиной
и совокупностью случайных величин
.
Теоретическая задача регрессионного анализа.
В
процессе анализа одним из методов
строится некоторая случайная величина
,
зависящая только от
,
которая сравнивается с исходной величиной
.
Условие
«зависящая только от
»
означает, что случайная величина
не является самостоятельной, а является
детерминированной функцией от случайных
величин
:
.
Пусть
на некотором множестве элементарных
событий
вектор случайных величин
принимает одно и тоже значение
:
:
,
тогда
на множестве
случайная величина
может принимать только одно постоянное
значение
,
а случайная величина
может принимать совершенно произвольные
значения. Если диапазон значений
окажется широким, то каким бы образом
ни выбиралась постоянная
«расхождение» между величиной
и величиной
окажется значительным. Напротив, если
диапазон значений
окажется узким, то, подобрав подходящее
значение
,
можно сделать «расхождение» между
и
незначительным.
Если
между величиной
и величинами
имеется «сильная вероятностная
зависимость», тогда на множествах, где
вектор
принимает постоянные значения, величина
изменяется незначительно (по заданным
значениям
можно с хорошим приближением указать
значение
),
тогда, выбирая подходящим образом
постоянные значения для величины
на этих множествах, можно сделать
«суммарное расхождение» между
и
малым.
Если
между величиной
и величинами
имеется лишь «слабая вероятностная
зависимость», тогда на множествах, где
вектор
принимает постоянные значения, величина
изменяется значительно (по заданным
значениям
невозможно предугадать значение
),
тогда каким бы образом ни выбирались
значения для
«суммарное расхождение» между
и
нельзя сделать малым.
Пусть
«суммарное расхождение» между величинами
и
измеряется среднеквадратичным отклонением
:
,
и
требуется найти такую величину
,
которая доставляет минимальное значение
.
Известно, что такой величиной является
условное математическое ожидание
.
Определение 9.1.
Регрессией
случайной величины
по
,…,
называется
условное математическое ожидание
.
Условное
математическое ожидание является
случайной величиной особого вида, для
построения которой требуется совместное
вероятностное распределение
.
В общем случае, нахождение условного
математического ожидания может
представлять сложную задачу, тем не
менее, в некоторых частных простых
случаях можно получить явное выражение
для условного математического ожидания.
Например, если
и вектор
имеет нормальное распределение, тогда:
.
Практическая задача регрессионного анализа.
На
практике совестное вероятностное
распределение
редко бывает известно, тем не менее, в
некоторых случаях можно вполне обоснованно
предположить, что условное математическое
ожидание является функцией определенного
вида:
,
где
– некоторый неизвестный числовой
вектор.
Пусть
случайная величина
,
тогда:
,
.
В
качестве исходных данных для задачи
построения регрессии выступает наблюдение
,
в котором каждая случайная величина
получена при условии, что
,
…,
:
,
…
,
где
– векторная случайная величина,
– числовые значения (
,
),
– векторная случайная величина. Введем
обозначение
для матрицы числовых значений
:
.
Задача
построения регрессии заключается в
нахождении оценки неизвестного вектора
параметров
на основе наблюдения
,
например, в нахождении такого вектора
параметров
,
при котором среднеквадратичное отклонение
:
.
принимает наименьшее возможное значение:
.
Вектор
в общем случае зависит от наблюдения
,
поэтому
,
вообще говоря, является некоторой
векторной случайной величиной.