
- •Содержание
- •Введение
- •Раздел 1 Введение в регрессионный анализ и планирование эксперимента Тема 1 Основы регрессионного анализа
- •1.1 Понятие корреляционного и регрессионного анализа
- •1.2. Определение параметров линейного однофакторного уравнения регрессии
- •1.3. Оценка величины погрешности линейного однофакторного уравнения
- •1.4. Проблема автокорреляции остатков. Критерий Дарбина-Уотсона
- •Тема 2 Использование линейного регрессионного анализа
- •2.1 Построение уравнения степенной регрессии
- •2.2. Двухфакторные и многофакторные уравнения регрессии
- •2.3. Применения уравнения регрессии. Эконометрика
- •2.4. Примеры линеаризации уравнения регрессии
- •Контрольные вопросы к темам 1,2:
- •Тема 3 Основные понятия и определения планирования эксперимента
- •3.1. Основные понятия и определения планирования эксперимента
- •Разложение функции отклика в степенной ряд, кодирование факторов
- •Тема 4 Преобразования при обработке результатов эксперимента
- •4.1 Матричные преобразования при обработке результатов эксперимента
- •Ортогональное планирование эксперимента
- •Контрольные вопросы к темам 3,4:
- •Раздел 2 Статистическое исследование зависимостей Тема 5 Типовые задачи практики статистического исследования зависимостей
- •5.1 Схема взаимодействия переменных при статистическом исследовании зависимостей
- •5.2 Конечные прикладные цели статистического исследования зависимостей
- •5.3 Типовые задачи практики статистического исследования зависимостей
- •5.4 Основные типы зависимостей между количественными переменными
- •Тема 6 Корреляционный анализ
- •6.1 Корреляционный анализ
- •6.2 Оценка степени тесноты связи переменных
- •6.3 Особенности корреляционного анализа для количественных переменных
- •6.4 Особенности корреляционного анализа для неколичественных характеристик
- •Тема 7 Регрессионный анализ
- •7.1 Примеры использования регрессионного анализа
- •7.2 Классическое определение регрессии
- •7.3 Оптимизационный подход в регрессионном анализе
- •7.4 Рекомендации по выбору вида регрессии
- •Тема 8 Линейный регрессионный анализ
- •8.1 Простая линейная регрессия
- •8.2 Доверительные интервалы и проверка гипотез
- •8.3 Множественная линейная регрессия
- •Тема 9 Нелинейная, непараметрическая и пошаговая регрессия
- •9.1 Итерационные методы поиска оценок наименьших квадратов для параметров регрессии
- •9.2 Поиск начального приближения для итерационных процедур
- •9.3 Непараметрический подход в регрессионном анализе
- •9.4 Пошаговая регрессия
- •Раздел 4 Статистическое исследование зависимостей Тема 9 Математический инструментарий статистического исследования зависимостей
- •9.1 Схема взаимодействия переменных при статистическом исследовании зависимостей
- •9.2 Конечные прикладные цели статистического исследования зависимостей
- •9.3 Математический инструментарий статистического исследования зависимостей
- •9.4 Краткая характеристика математического инструментария
- •Тема 10 Типовые задачи практики
- •10.1 Типовые задачи практики статистического исследования зависимостей
- •10.2 Основные типы зависимостей между количественными переменными
- •10.3 Этапы статистического исследования зависимостей
- •10.4 Анализ точности полученных уравнений связи
- •Тема 11 Корреляционный анализ
- •11.1 Корреляционный анализ
- •11.2 Оценка степени тесноты связи переменных
- •11.3 Особенности корреляционного анализа для количественных переменных
- •11.4 Особенности корреляционного анализа для неколичественных характеристик
- •Тема 12 Регрессионный анализ
- •12.1 Примеры использования регрессионного анализа
- •12.2 Классическое определение регрессии
- •12.3 Оптимизационный подход в регрессионном анализе
- •12.4 Рекомендации по выбору вида регрессии
- •Тема 13 Линейный регрессионный анализ
- •13.1 Простая линейная регрессия
- •13.2 Доверительные интервалы и проверка гипотез
- •13.3 Множественная линейная регрессия
- •Тема 14 Нелинейная, непараметрическая и пошаговая регрессия
- •14.1 Итерационные методы поиска оценок наименьших квадратов для параметров регрессии
- •14.2 Поиск начального приближения для итерационных процедур
- •14.3 Непараметрический подход в регрессионном анализе
- •14.4 Пошаговая регрессия
- •14.5 Кластерная регрессия или классификация с учетом внешней цели
- •Литература
- •246019, Г. Гомель, ул. Советская, 104.
5.4 Основные типы зависимостей между количественными переменными
Под типом зависимости мы понимаем не аналитический вид функции Yср(X) = f(X,), а природу анализируемых переменных (X,y) и, соответственно, интерпретацию функции f(X,).
Зависимость между неслучайными переменными. В этом случае y детерминировано восстанавливается по значению неслучайной переменной X. Это чисто функциональная зависимость y=f(Х)= f(x(1),...,x(p)), т.е. в формуле (4.3) = 0.
Такие примеры адекватного описания реальных зависимостей встречаются редко (например, определение возраста дерева по количеству колец на срезе). Для них не надо использовать вероятностно-статистическую теорию.
Регрессионная зависимость случайного результирующего показателя от неслучайных предсказывающих переменных X. Природа связи носит двойственный характер.
а) замеры с ошибкой, а - X без ошибки.
б) зависит не только от X, поэтому для всех X * значения ( X *) подвержены разбросу. Здесь X играют роль параметра, от которого зависит распределение . Удобной математической моделью является
( X) = f(X) + ( X) (5.2)
Yср(X) = M( X) = f(X), M( X) = 0.
Природа ( X) и ее характеристики распределения не связаны со структурой функции f(X).
Корреляционно-регрессионная зависимость между случайными векторами (результирующим показателем) и (объясняющими переменными). Компоненты векторов и зависят от множества факторов, которые исследователь по разным причинам не может проконтролировать т.е. для него эти переменные являются случайными. Удобно представление
= f() + (5.3)
- остаточное влияние неучтенных факторов, причем
M(k)
= 0, D(k)
=
<
cov (f(k)(), (k) )= 0.
Для частного случая: m=1; а f() - линейная функция имеем:
Если в (5.3) = 0, то случайные величины оказываются связанными чисто функциональной зависимостью =f(), но ее следует отличать от функциональной зависимости неслучайных переменных.
Например, если описывать процесс обжига стекла в стекольном производстве с помощью параметров - вакуум в печи и - процента брака, то случайные изменения свойств сырья приводят к случайным колебаниям и . Эллипсообразная форма облака говорит о целесообразности модели (5.3). Связь и носит название корреляционно-регрессионной. К вопросам регрессионного анализа (построение конкретного вида зависимостей между переменными, оценка точности) добавляются вопросы корреляционного анализа (исследование степени тесноты связи между переменными).
Тема 6 Корреляционный анализ
6.1 Корреляционный анализ.
6.2 Оценка степени тесноты связи переменных.
6.3 Особенности корреляционного анализа количественных переменных.
6.4 Особенности корреляционного анализа неколичественных характеристик.
6.1 Корреляционный анализ
В начале СИЗ необходимо установить сам факт наличия статистических связей и измерить степень их тесноты. Для количественных переменных с этой целью используют: индекс корреляции, корреляционное отношение, парные, частные и множественные коэффициенты корреляции, коэффициент детерминации.
Парные и частные коэффициенты корреляции оценивают тесноту линейной связи. Они могут быть положительными и отрицательными в зависимости от тенденции взаимосвязанного изменения переменных.
Парные корреляционные характеристики оценивают тесноту статистической связи между двумя переменными без учета опосредованного или совместного влияния других показателей. Для расчета используются значения только анализируемой пары показателей. Частный коэффициент корреляции позволяет оценить степень тесноты множественной связи между двумя переменными, очищенной от опосредованного влияния других факторов. Для расчета используются значения как по анализируемой паре переменных, так и тех, опосредованное влияние которых хотим исключить.
Степень
тесноты связи любой
формы
определяют: множественный коэффициент
корреляции, коэффициент детерминации
и корреляционное отношение. Множественный
коэффициент корреляции определяет
степень тесноты связи между одним
результирующим и совокупностью
объясняющих показателей. Коэффициент
детерминации определяется, как квадрат
множественного коэффициента корреляции
и показывает, какая доля дисперсии
детерминируется совокупным влиянием
(в виде функции регрессии). Оставшаяся
часть дисперсии
показывает верхнюю границу точности
при восстановлении
по заданным значениям Х.
Представим особенности корреляционных характеристик в таблице6.1.
Таблица 6.1 - Особенности корреляционных характеристик
Вид зависимости |
Показатель связи переменных |
Особенность |
Линейная |
Парный коэффициент корреляции |
Неочищенная от совместного влияния других переменных |
|
Частный коэффициент корреляции |
Очищенная от совместного влияния других переменных |
|
Множественный коэффициент корреляции |
Один результирующий и совокупность объясняющих переменных |
Произвольная |
Коэффициент детерминации |
Множественный коэффициент корреляции в квадрате |
|
Корреляционное отношение |
Используется при группировании значений х в интервалах |
|
Индекс корреляции |
Наиболее общая теоретическая оценка степени тесноты связи |