
- •Автономная некоммерческая организация
- •Учебно - методическая разработка
- •1. Иванова в.М., Калинина в.Н., Нешумова л.А., Решетникова и.О. Математическая статистика. 2-е изд., перераб. И доп. – м.: Высш. Школа, 1981. – 371 с., ил. Стр 224-286. Текст лекции
- •1. Корреляционный анализ
- •1.1. О связях функциональных и статистических
- •1.2. Определение формы связи. Понятие регрессии
- •1.3. Основные положения корреляционного анализа
- •1.4. Свойства коэффициента корреляции
- •1.5. Поле корреляции. Вычисление оценок параметров двумерной модели
- •1.6. Проверка гипотезы о значимости коэффициента корреляции
- •1.7. Корреляционное отношение
- •1.8. Понятие о многомерном корреляционном анализе
- •1.9. Ранговая корреляция
- •2. Регрессионный анализ
- •2.1. Основные положения регрессионного анализа
- •2.2. Линейная регрессия
- •2.3. Нелинейная регрессия
- •2.4. Оценка значимости коэффициентов регрессии. Интервальная оценка коэффициентов регрессии
- •2.5. Интервальная оценка для условного математического ожидания
- •2.6. Проверка значимости уравнения регрессии
- •2.7. Многомерный регрессионный анализ
- •2.8. Факторный анализ
- •Приложения
- •Функция Лапласа
- •Слайды для проведения занятия
- •Задание на самостоятельную работу
2.6. Проверка значимости уравнения регрессии
Оценить значимость
уравнения регрессии — значит установить,
соответствует ли математическая, модель,
выражающая зависимость между Y
и Х,
экспериментальным данным. Для оценки
значимости в предпосылках «нормальной
регрессии» проверяют гипотезу Н0:
=0.
Если она отвергается, то считают, что
междуY и
X
нет связи (или связь нелинейная). Для
проверки нулевой гипотезы используют
основное положение дисперсионного
анализа о разбиении суммы квадратов на
слагаемые. Воспользуемся разложением
.
Общая сумма квадратов отклонений
результативного признака
разлагается
наQ1
(сумму, характеризующую влияние признака
X)
и Q2
(остаточную сумму квадратов, характеризующую
влияние неучтённых факторов). Очевидно,
чем меньше влияние неучтённых факторов,
тем лучше математическая модель
соответствует экспериментальным данным,
так как вариация Y
в основном объясняется влиянием признака
X.
Для проверки
нулевой гипотезы вычисляют статистику
которая имеет распределение Фишера-Снедекора
с
=l,
=n-2
степенями свободы (вп
- число наблюдений). По уровню значимости
α
и числу степеней свободы
и
находят по таблицамF-распределение
для уровня значимости α=0,05 (см. табл. 3
приложений) критическое значение
,
удовлетворяющее условию
.
Если
,
нулевую гипотезу отвергают, уравнение
считают значимым. Если
то нет оснований отвергать нулевую
гипотезу.
2.7. Многомерный регрессионный анализ
В случае, если
изменения результативного признака
определяются действием совокупности
других признаков, имеет место многомерный
регрессионный анализ. Пусть результативный
признак Y,
а независимые признаки
Для
многомерного случая предпосылки
регрессионного анализа можно сформулировать
следующим образом:Y
- независимые случайные величины со
средним
и постоянной дисперсией
—
линейно независимые векторы
Все положения, изложенные в п.2.1,
справедливы для многомерного случая.
Рассмотрим модель вида
(2.13)
Оценке подлежат
параметры
и остаточная дисперсия. Заменив параметры
их оценками, запишем уравнение регрессии
(2.14)
Коэффициенты в этом выражении находят методом наименьших квадратов.
Исходными данными
для вычисления коэффициентов
является выборка из многомерной
совокупности, представляемая обычно в
виде матрицыX
и вектора Y:
АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ 1
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ 1
ЦЕНТРОСОЮЗА РОССИЙСКОЙ ФЕДЕРАЦИИ 1
КАЗАНСКИЙ КООПЕРАТИВНЫЙ ИНСТИТУТ (ФИЛИАЛ) 1
Пусть
С — матрица коэффициентов при неизвестных
параметрах
;
— матрица, обратная матрицеС;
— элемент,
стоящий на пересечении i-й
строки и i-го
столбца матрицы
— выражение
.
Тогда, используя формулы линейной
алгебры, запишем окончательные выражения
для параметров:
(2.17)
Оценкой остаточной
дисперсии
является
где
— измеренное значение результативного
признака;
значение результативного признака,
вычисленное по уравнению регрессий.
Если выборка
получена из нормально распределенной
генеральной совокупности, то, аналогично
изложенному в п. 2.4, можно проверить
значимость оценок коэффициентов
регрессии, только в данном случае
статистику
вычисляют для каждогоj-го
коэффициента регрессии
(2.18)
где
—элемент обратной матрицы, стоящий на
пересеченииi-й
строки и j-го
столбца;
— диагональный элемент обратной матрицы.
При заданном уровне
значимости α
и числе степеней свободы k=n—т—1
по табл. 1 приложений находят критическое
значение
.
Если
,
то нулевую гипотезу о равенстве нулю
коэффициента регрессии отвергают.
Оценку коэффициента считают значимой.
Такую проверку производят последовательно
для каждого коэффициента регрессии.
Если
,
то нет оснований отвергать нулевую
гипотезу, оценку коэффициента регрессии
считают незначимой.
Для значимых
коэффициентов регрессии целесообразно
построить доверительные интервалы по
формуле (2.10). Для оценки значимости
уравнения регрессии следует проверить
нулевую гипотезу о том, что все коэффициенты
регрессии (кроме свободного члена) равны
нулю:
(
— вектор
коэффициентов регрессии). Нулевую
гипотезу проверяют, так же как и в п.
2.6, с помощью статистики
,
гдеQ1
— сумма квадратов, характеризующая
влияние признаков Х;
Qocт
— остаточная сумма квадратов,
характеризующая влияние неучтённых
факторов; k2=n—m—1,
k1=m.
Для уровня значимости α
и числа степеней свободы k1
и k2
по табл. 3 приложений находят критическое
значение
.
Если
,
то нулевую гипотезу об одновременном
равенстве нулю коэффициентов регрессии
отвергают. Уравнение регрессии считают
значимым. При
нет оснований отвергать нулевую гипотезу,
уравнение регрессии считают незначимым.