
- •Содержание
- •Введение
- •Раздел 1 Введение в регрессионный анализ и планирование эксперимента Тема 1 Основы регрессионного анализа
- •1.1 Понятие корреляционного и регрессионного анализа
- •1.2. Определение параметров линейного однофакторного уравнения регрессии
- •1.3. Оценка величины погрешности линейного однофакторного уравнения
- •1.4. Проблема автокорреляции остатков. Критерий Дарбина-Уотсона
- •Тема 2 Использование линейного регрессионного анализа
- •2.1 Построение уравнения степенной регрессии
- •2.2. Двухфакторные и многофакторные уравнения регрессии
- •2.3. Применения уравнения регрессии. Эконометрика
- •2.4. Примеры линеаризации уравнения регрессии
- •Контрольные вопросы к темам 1,2:
- •Тема 3 Основные понятия и определения планирования эксперимента
- •3.1. Основные понятия и определения планирования эксперимента
- •Разложение функции отклика в степенной ряд, кодирование факторов
- •Тема 4 Преобразования при обработке результатов эксперимента
- •4.1 Матричные преобразования при обработке результатов эксперимента
- •Ортогональное планирование эксперимента
- •Контрольные вопросы к темам 3,4:
- •Раздел 2 Статистическое исследование зависимостей Тема 5 Типовые задачи практики статистического исследования зависимостей
- •5.1 Схема взаимодействия переменных при статистическом исследовании зависимостей
- •5.2 Конечные прикладные цели статистического исследования зависимостей
- •5.3 Типовые задачи практики статистического исследования зависимостей
- •5.4 Основные типы зависимостей между количественными переменными
- •Тема 6 Корреляционный анализ
- •6.1 Корреляционный анализ
- •6.2 Оценка степени тесноты связи переменных
- •6.3 Особенности корреляционного анализа для количественных переменных
- •6.4 Особенности корреляционного анализа для неколичественных характеристик
- •Тема 7 Регрессионный анализ
- •7.1 Примеры использования регрессионного анализа
- •7.2 Классическое определение регрессии
- •7.3 Оптимизационный подход в регрессионном анализе
- •7.4 Рекомендации по выбору вида регрессии
- •Тема 8 Линейный регрессионный анализ
- •8.1 Простая линейная регрессия
- •8.2 Доверительные интервалы и проверка гипотез
- •8.3 Множественная линейная регрессия
- •Тема 9 Нелинейная, непараметрическая и пошаговая регрессия
- •9.1 Итерационные методы поиска оценок наименьших квадратов для параметров регрессии
- •9.2 Поиск начального приближения для итерационных процедур
- •9.3 Непараметрический подход в регрессионном анализе
- •9.4 Пошаговая регрессия
- •Раздел 4 Статистическое исследование зависимостей Тема 9 Математический инструментарий статистического исследования зависимостей
- •9.1 Схема взаимодействия переменных при статистическом исследовании зависимостей
- •9.2 Конечные прикладные цели статистического исследования зависимостей
- •9.3 Математический инструментарий статистического исследования зависимостей
- •9.4 Краткая характеристика математического инструментария
- •Тема 10 Типовые задачи практики
- •10.1 Типовые задачи практики статистического исследования зависимостей
- •10.2 Основные типы зависимостей между количественными переменными
- •10.3 Этапы статистического исследования зависимостей
- •10.4 Анализ точности полученных уравнений связи
- •Тема 11 Корреляционный анализ
- •11.1 Корреляционный анализ
- •11.2 Оценка степени тесноты связи переменных
- •11.3 Особенности корреляционного анализа для количественных переменных
- •11.4 Особенности корреляционного анализа для неколичественных характеристик
- •Тема 12 Регрессионный анализ
- •12.1 Примеры использования регрессионного анализа
- •12.2 Классическое определение регрессии
- •12.3 Оптимизационный подход в регрессионном анализе
- •12.4 Рекомендации по выбору вида регрессии
- •Тема 13 Линейный регрессионный анализ
- •13.1 Простая линейная регрессия
- •13.2 Доверительные интервалы и проверка гипотез
- •13.3 Множественная линейная регрессия
- •Тема 14 Нелинейная, непараметрическая и пошаговая регрессия
- •14.1 Итерационные методы поиска оценок наименьших квадратов для параметров регрессии
- •14.2 Поиск начального приближения для итерационных процедур
- •14.3 Непараметрический подход в регрессионном анализе
- •14.4 Пошаговая регрессия
- •14.5 Кластерная регрессия или классификация с учетом внешней цели
- •Литература
- •246019, Г. Гомель, ул. Советская, 104.
7.4 Рекомендации по выбору вида регрессии
Удачность статистического исследования зависимостей зависит от того, насколько верно выбран класс F, в котором будет осуществлен поиск . Стандартных рекомендаций и методов для этого нет, но есть некоторые моменты, которые необходимо учитывать при выборе общего вида регрессии: максимальное использование априорной информации о содержательной (физической, экономической, социологической) сущности анализируемой зависимости; предварительный анализ геометрической структуры данных вида {(xi, yi)}, по которым конструируется зависимость; различные статистические приемы обработки данных, улучшающие выбор одного из нескольких вариантов.
Использование
априорной информации. Необходимо
продумать: будет ли f(x)
монотонна, или она должна иметь один
экстремум; следует ли ожидать, что f(x)
стремится к константе (при x
)
и какова ее содержательная интерпретация;
какова природа воздействия объясняющих
переменных на y:
аддитивная
или мультипликативная; не диктует ли
смысл зависимости прохождение через
определенные точки.
Поясним на примере, как могут использоваться профессионально-теоретические соображения при выборе вида зависимости.
Например,
в процессе изучения зависимости
тормозного пути от скорости автомобиля
x
в момент
получения сигнала об остановке можно
заметить, что для автомобиля и водителя
тормозной путь определяется: скоростью
x
, временем реакции водителя
,
а также тормозами автомобиля. Автомобиль
успеет пройти путь:
x
до момента включения тормозов и после
включения тормозов (согласно элементарным
физическим законам) - расстояние,
пропорциональное квадрату скорости,
т.е. y=
x+
x2.
Используя
выборочные данные, с помощью метода
наименьших квадратов можно получить,
что y=0.76x+0.056x2.
Анализ геометрической структуры. При предварительном анализе характера исследуемых зависимостей изучают геометрию парных корреляционных полей. Под корреляционным полем понимают графическое представление имеющихся измерений (u1,v1),..., (uN,vN) этих переменных в плоскости (u,v). Для всевозможных пар (xj,xk) из (x(1),..., x(p),у) строятся корреляционные поля. Визуально анализируется характер вытянутости (эллипсоидально-линейный, нелинейно-монотонный, с экстремумом). В результате анализа получают формулировку нескольких рабочих гипотез об общем виде искомой зависимости.
Отметим одну простую закономерность при выборе общего вида исследуемой регрессионной зависимости, Если общий параметрический вид зависимости f(x, ) угадан правильно, то результаты оценивания по различным подвыборкам мало отличаются, а при неудачном выборе - сильно отличаются.
Тема 8 Линейный регрессионный анализ
8.1 Простая линейная регрессия.
8.2 Множественная линейная регрессия.
8.3 Проверка гипотез.
8.4 Доверительные интервалы.
8.1 Простая линейная регрессия
Если предполагается линейная зависимость между и , то теоретическая модель задается уравнением
(8.1)
и
называется моделью
простой линейной регрессии
по
.
Величины
и
являются неизвестными параметрами, а
суть некоррелированные ошибки случайной
переменной со средним 0 и неизвестной
дисперсией
,
т.е.
,
Наилучшие
оценки
и
по выборке объема N для
и
получаются минимизацией соответственно
по
и
суммы квадратов
отклонений
Эти оценки называются оценками наименьших квадратов и даются формулами
(8.2)
Заметим, что S есть мера ошибки, возникающей при аппроксимации зависимости выборочных значений (x,y) с помощью прямой. Оценки и минимизируют ошибку.
Оценкой уравнения (8.1) регрессии (или прямой наименьших квадратов) будет
(8.3)
так
что оценка значения
при
есть
Разница между наблюдаемым и оцененным
значением
при
называется отклонением
(или остатком)
Рисунок 8.1- Соотношение между теоретической регрессионной прямой, прямой наименьших квадратов и точками выборки.
Прямая
наименьших квадратов доставляет минимум
сумме квадратов отклонений
Соотношение между теоретической
регрессионной прямой, прямой наименьших
квадратов и точками выборки можно
увидеть на рисунке 8.1.
Оценка обычно называется коэффициентом регрессии, а оценка -свободным членом уравнения регрессии.