Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
46
Добавлен:
13.02.2016
Размер:
715.78 Кб
Скачать

Глава 6. Основные принципы построения регрессионных моделей

6.1 Парная корреляция и регрессия

Во многих задачах требуется установить и описать математически зависимость изучаемого параметра Y от одного (k = 1) или нескольких (k2) факторов по данным наблюдений либо пассивного эксперимента. В таких случаях говорят о необходимости построения регрессионной математической модели вида Y = F(X) или Y = F(X1 X2Xk), соответственно.

Рассмотрим зависимость изучаемого параметра Y от одного фактора Х и принципы построения регрессионной модели Y = F(X).

Две случайные величины могут быть связаны функциональной либо статистической зависимостью, либо быть независимыми.

Если каждому значению переменной Х (из области её изменения) соответствует одно и только одно значение переменной Y, то зависимость между переменными Х и Y называется функциональной.

Если изменение одной переменной Х влечёт за собой изменение распределения другой, т.е. каждому значению переменной Х соответствует не одно определённое значение переменной Y, а некоторое распределение этих значений, то зависимость называется статистической.

Одним из видов статистической зависимости между переменными является зависимость корреляционная, при которой на изменение одной из переменных другая реагирует изменением своего математического ожидания.

Для уточнения определения корреляционной зависимости введём понятие условной средней.

Предположим, что изучается связь между случайной величиной Y и случайной величиной Х. Пусть каждому значению Х соответствует несколько значений Y. Например, пусть при х = 2 величина Y приняла значения 5, 6, 10. Найдём среднее арифметическое этих чисел:

.

Число называют условным средним; чёрточка над буквой y служит обозначением среднего арифметического, а число 2 указывает, что рассматриваются те значения переменной Y, которые соответствуют х = 2.

Таким образом, условным средним называют среднее арифметическое значений переменнойY соответствующих значению Х = х.

Если каждому значению х соответствует одно значение условной средней , то, очевидно, условная средняя является функцией от X; в этом случае говорят, что случайная величина Y зависит от Х корреляционно.

Таким образом, корреляционной зависимостью Y от Х называют функциональную зависимость условной средней от x:

. (6.1)

Уравнение (6.1) называют уравнением регрессии Y на Х; функцию F(X) называют регрессией Y на Х, а её график – линией регрессии Y на Х.

Для исследования и математического описания такой зависимости применяют корреляционно-регрессионный анализ.

В основу корреляционно-регрессионного анализа положены следующие допущения:

  • при каждом значении аргумента Х ординаты функции Y распределены нормально;

  • ординаты функции Y для данных значений аргумента Х статистически независимы;

  • случайные ошибки при измерении аргумента Х значительно меньше, чем при измерении ординат функции Y;

  • схема расчёта зависит от типа дисперсий (в частности, проверяется их однородность с применением критерия Кохрена).

Первая задача теории корреляции – установить форму корреляционной связи, т.е. вид функции регрессии (линейная, квадратичная, показательная и т.д.). Часто функции регрессии оказываются линейными.

Вторая задача теории корреляции – оценить тесноту (силу) корреляционной связи. Теснота корреляционной зависимости Y от Х оценивается по величине рассеяния значений Y вокруг условного среднего (далее будем писать без чёрточки -). Большое рассеяние свидетельствует о слабой зависимости Y от Х либо отсутствии зависимости. Малое рассеяние указывает на наличие достаточно сильной зависимости. Возможно даже, что Y и Х связаны функционально, но под воздействием второстепенных случайных факторов эта связь оказалась размытой, в результате чего при одном и том же значении Х величина Y принимает различные значения.

Соседние файлы в папке основы научных исследований