2.1.3. Расчет параметров и построение регрессионных моделей

Здесь стремятся отыскать наиболее точную меру выявленной связи, для того чтобы можно было прогнозировать, предсказывать значения зависимой величины Y, если будут известны значения независимых величин Х₁, Х₂,.... Х_n

Эту меру обобщенно выражают математической моделью линейной множественной регрессионной зависимости:

Y = a₀ + b₁Х₁ + b₂Х₂ + ... +b_nX_n

ЭВМ вычисляет параметры модели: свободный член а₀ (константа, или пересечение) и коэффициенты b_п (коэффициенты регрессии). Величину у называют откликом, а Х₁, Х₂, ..., Х_п - факторами или предикторами.

2.1.4. Оценка статистической значимости модели

После получения каждого варианта уравнения обязательной процедурой является оценка его статистической значимости, поскольку главная цель - получить уравнение наивысшей значимости. Однако в связи с тем, что расчеты выполняет ЭВМ, а решение на основе оценки значимости уравнения принимает исследователь (принять или отбросить уравнение), условно можно выделить третий этап этой человеко-машинной технологии как интеллектуальный немашинный этап, для которого почти все данные по оценке значимости уравнения подготавливает ЭВМ.

Статистическую значимость, т. е. пригодность постулируемой модели для использования ее в целях предсказания значений отклика. Для оценки качества полученной модели программа вычислила также целый ряд коэффициентов, которые обязан рассмотреть исследователь, сравнивая их с известными статистическими критериями и оценивая модель с точки зрения здравого смысла.

На этом этапе исключительно важную роль играют коэффициент детерминации и F-критерий значимости регрессии.

R Squared (R²) - коэффициент детерминации - это квадрат множественного коэффициента корреляции между наблюдаемым значением Y и его теоретическим значением, вычисленным на основе модели с определенным набором факторов. Коэффициент детерминации измеряет действительность модели. Он может принимать значения от 0 до 1. Эта величина особенно полезна для сравнения ряда различных моделей и выбора наилучшей модели.

R² есть доля вариации прогнозной (теоретической) величины Y относительно наблюденных значений Y, объясненная за счет включенных в модель факторов. Очень хорошо, если R²>= 80%. Остальная доля теоретических значений У зависит от других, не участвовавших в модели факторов. Задача исследователя - находить факторы, увеличивающие R², к давать объяснение вариаций прогноза, чтобы получить идеальное уравнение. Однако, коэффициент R² самое большее может достигнуть величины 1 (или 100%), когда все значения факторов различны. А если в данных есть повторяющиеся опыты, то величина R² не может достигнуть 1, как бы хороша ни была модель. Поэтому дубликаты данных следует удалять из исходной таблицы до начала расчета регрессии. Некоторые программные пакеты автоматически удаляют дубликат, оставляя лишь уникальные данные. Повторение одинаковых данных снижает надежность оценок модели. R² = 1 лишь при полном согласии экспериментальных (наблюденных) и теоретических (расчетных) данных, т. е. когда теоретические значения точно совпадают с наблюдаемыми. Однако это считается весьма маловероятным случаем.

Средствами регрессионного анализа, в т.ч. Excel, вычисляется F-критерий значимости регрессии для уравнения в целом. Это рассчитанное по наблюденным данным значение Fp (F расчетный, наблюденный) следует сравнивать с соответствующим критическим значением Fк, (F критический, табличный) (см. приложение А). Fк исследователь выбирает из публикуемых статистических таблиц на заданном уровне вероятности (на том, на каком вычислялись параметры модели, например, 95%).

Если наблюденное значение Fp окажется меньше критического значения Fк, то уравнение нельзя считать значимым. В иной терминологии об этом же может быть сказано: не отвергнута нуль-гипотеза относительно значимости всех коэффициентов регрессии в постулируемой модели, т. е. коэффициенты практически равны нулю.

Электронная технология корреляционно-регрессионного анализа становится абсолютно бесполезной, если расчетные данные будут толковаться не вполне правильно.

Если полученная модель статистически значима, ее применяют для прогнозирования (предсказания), управления или объяснения.

Если же обнаружена незначимость, то модель отвергают, предполагая, что истинной окажется какая-то другая форма связи, которую надо поискать.

<<< < Предыдущая 12 / 112 3 4 5 6 7 8 9 10 11 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.202583.97 Кб4международное право 1 лекция.doc
#
07.03.20163.37 Mб100Международное Право. Учебник ред. Бирюков..doc
#
29.08.201993.7 Кб13МЕТ. ЗАВД. РЕФЕРАТІВ ПО ЕКОН. ЗЛ..doc
#
21.11.2018830.46 Кб22Мет.рек., прз, 2008, денна.doc
#
03.08.20191.54 Mб18метод до семінар занять крим процес.rtf
#
01.05.2025846.85 Кб4метод ИСМ_ практика.doc
#
11.11.2019527.36 Кб20метод реком до курсових.doc
#
16.08.2019692.37 Кб15метод реком сам вивч 4-5 sem.docx
#
01.04.2025302.59 Кб1МЕТОД РЕКОМЕН 2012.doc
#
12.11.2018131.58 Кб5метод-ка модульн.инд работа новая.doc
#
01.05.2025597.5 Кб0Метод.КП Огурцов.doc