Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методы статистического изучения корреляционной...doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
854.02 Кб
Скачать

Выбор формы уравнения (регрессии)

По эмпирической линии регрессии и по исходным данным трудно решить вопрос о том, какая функция наилучшим образом может описать имеемую зависимость. Для решения этой проблемы существует ряд методов:

1)Выбор функции методом нахождения минимальной среднеквадратической ошибки уравнения. На основе логического анализа выбирается ряд функций. С помощью систем нормальных уравнений определяются их параметры и находят теоретическое значение результативного признака ( ). Далее определяется среднеквадратическая ошибка для каждого уравнения (функции) по формуле:

,

где - ошибка уравнения; - эмпирическое значение результативного признака в исходной совокупности; теоретическое значение результативного признака, рассчитанное по уравнению корреляционной связи и полученное подстановкой значений факторного признака ; объем совокупности; m- число параметров в выбранном уравнении. Функция, которой соответствует минимальная ошибка уравнения, является наиболее подходящей.

Кроме того, решить вопрос об адекватности выбранного уравнения можно с помощью неравенства: .

2)Следующий метод для проверки степени близости выбранной теоретической линии регрессии к фактическим данным- это расчет индекса корреляции, который одновременно служит и показателем степени тесноты связи:

. Этот показатель изменяется в пределах от 0до 1. Если он равен 0, то это означает, что между переменными нет связи, или если она и существует, то не может быть охарактеризована избранной функцией. В случае, когда незначительно отличается от линейного коэффициента корреляции, это свидетельствует об обоснованности выбора прямой, как линии связи.

  1. Для проверки правильности выбранного уравнения связи используют также F- распределение. Рассчитывается выражение:

,

где n- общее число наблюдений; к- число групп, на которые разбит факторный признак; число наблюдений в j-той группе; m- число параметров в уравнении регрессии; - среднее значение результативного признака в j-группе; - индивидуальное значение результативного признака; - значения результативного признака, рассчитанные по уравнению регрессии, и полученные подстановкой средних значений факторного признака в j-той группе.

По таблице находим F c числом степеней свободы k-m для числителя и n-k для знаменателя. Сопоставив F и F делаем вывод: если

F < F - гипотеза о правильности выбранной формы уравнения не отвергается, если F > F гипотеза отвергается.

В приведенном выше F-распределении, первое отношение характеризует меру рассеивания групповых средних вокруг линии регрессии, а второе отношение – меру рассеивания эмпирических данных вокруг групповых средних, т.е. если в первом случае рассеивание зависит от выбранного вида линии регрессии, то во втором случае мы имеем меру независимую от выбранного вида уравнения.

Так как основное применение метода корреляционно- регрессионного анализа используется при решении задач обоснованного прогноза, то целесообразно проверить, какое среднее квадратическое отклонение больше:

или , т.е. сравнивают среднюю квадратическую ошибку уравнения и среднюю квадратическую ошибку результативного показателя, рассчитанную по эмпирическим данным.

Таким образом, за основу прогноза берут или теоретическое значение результативного показателя ( ), или эмпирическое значение

Средняя квадратическая ошибка уравнения дает возможность в каждом отдельном случае с определенной вероятностью указать, что величина результативного признака ( ) окажется в определенном интервале относительно значения, вычисленного по уравнению связи.

Зная дисперсию показателя и задаваясь уровнем доверительной вероятности, определяем доверительные границы результативного признака при значении факторного признака - (условное обозначение любого значения факторного признака). Доверительный интервал (границы) результативного признака определяются по формуле:

,

где -определяется в соответствии с уровнем значимости , по распределению Стьюдента и с степенями свободы. Величина множителя

будет вычисляться для каждого значения