- •Самарский государственный университет.
- •Глава 5. Анализ временных рядов. 29
- •Глава 6. Дисперсионный анализ. 34
- •Глава 7. Метод главных компонент 47
- •Глава 8. Факторный анализ 53
- •Глава 1. Математические модели.
- •1.1. Классификация моделей.
- •1.2. Этапы построения математических моделей
- •Глава 2. Корреляционный анализ: вид связи и проверка гипотез.
- •2.1.Коэффициент парной корреляции
- •2.2. Коэффициент детерминации
- •2.3. Статистическая оценка значимости коэффициентов корреляции.
- •2.4. Интервальные оценки для значимых парных коэффициентов корреляции.
- •2.5. Коэффициент корреляции рангов.
- •Решение
- •Глава 3. Регрессионный анализ: парная линейная регрессия.
- •3.1. Общие сведения. Парная линейная регрессия.
- •3.1.1. Функция регрессии
- •3.1.2. Последовательность проведения регрессионного анализа
- •3.1.3. Предпосылки к проведению регрессионного анализа
- •3.2. Метод наименьших квадратов
- •3.2.1. Проверка адекватности модели
- •3.2.2. Проверка значимости параметров модели
- •3.3. Описание типового примера. Алгоритм построения регрессионной модели.
- •3.4. Использование оцененной модели для прогнозирования
- •Глава 4. Множественная линейная регрессия
- •4.1. Корреляционно - регрессионный анализ.
- •4.2. Некоторые нелинейные модели, сводящиеся к линейным
- •4.3. Проверка предпосылок регрессионного анализа
- •1. Проверка нормальности закона распределения ошибок
- •3. Проверка на автокорреляцию случайных ошибок
- •Замечание. Если в модели много незначимых коэффициентов - ее надо упростить, т.Е. Уменьшить число искомых величин b. Если модель неадекватна, ее надо усложнить, т.Е. Добавить новые члены.
- •4.4. Пример решения задачи моделирования с использованием метода наименьших квадратов.
- •4.5. Метод наименьших квадратов (мнк) – общий случай
- •Глава 5. Анализ временных рядов.
- •5.1. Проверка законов распределения.
- •1. Проверка подчинения эмпирического распределения нормальному закону распределения
- •2. Проверка подчинения эмпирического распределения закону распределения Пуассона.
- •5.2. Изучение динамики
- •5.2.1. Средние показатели тенденции динамики
- •5.2.2. Выявление типа тенденции динамики тренда
- •5.2.3. Определение оптимального значения тренда
- •Глава 6. Дисперсионный анализ.
- •Однофакторный дисперсионный анализ.
- •6.2. Применение однофакторного анализа.
- •6.3. Проверка гипотезы об отсутствии влияния факторов на параметр
- •Можно показать [5], что, как и в случае однофакторного анализа, разность
- •Трехфакторный дисперсионный анализ.
- •6.5. Отсеивающие эксперименты и дисперсионный анализ
- •6.6. Рандомизация эксперимента
- •6.7. Определение аналитического вида зависимости параметра от факторов.
- •6.7.1. Матрица планирования
- •Глава 7. Метод главных компонент
- •7.1. Математическая модель метода главных компонент.
- •7.2. Алгоритм метода главных компонент
- •7.3. Нахождение коэффициентов характеристического уравнения
- •Глава 8. Факторный анализ
- •8.1. Модель факторного анализа.
- •8.2. Вращение факторов.
- •8.3. Применение факторного анализа.
- •8.4. Некоторые результаты факторного анализа
- •Приложение 1. Статистические таблицы
- •При числе степеней свободы
- •Критические точки распределения критерия g
- •Значения верхнего предела n2 в зависимости от уровня значимости
2.2. Коэффициент детерминации
Коэффициент детерминации равен квадрату коэффициента корреляции и вычисляется по формуле:
(2.2.1)
Этот коэффициент используется для анализа множественной корреляции.
Если исследуется связь между несколькими признаками, то корреляцию называют множественной. В простейшем случае число признаков равно трем: X,Y,Z. В этом случае возникают задачи:
1) оценить тесноту связи между Zи обоими признаками Х и У,
2) оценить тесноту связи между Zи Х при постоянном значенииY,
3) оценить тесноту связи между ZиYпри постоянном значении Х.
Теснота признака Zс признакамиXиYоценивается выборочным коэффициентом корреляции по формуле:
, (2.2.2)
причем 0 R1.
Теснота связи между признаками Zи Х при постоянном значении признакаY, между признакамиZиYпри постоянном значении признака Х оценивается частными выборочными коэффициентами корреляции:
(2.2.3)
(2.2.4)
Эти коэффициенты имеют те же свойства и тот же смысл, что и обыкновенный выборочный коэффициент корреляции, т. е. служат для оценки линейной связи между признаками.
,
2.3. Статистическая оценка значимости коэффициентов корреляции.
Под значимостью (или надежностью) понимается вероятность того, что значение проверяемого параметра не равно нулю, не включают в себя значения противоположных знаков.
Вероятностная оценка параметров корреляции производится по общим правилам проверки статистических гипотез.
1) Выдвигается гипотеза H0: Коэффициент корреляцииrxy -не значим (илиrxy=0), а признакиXиYне коррелированны, т.е. не связаны линейной зависимостью. Выдвигается также альтернативная гипотеза Н1: Коэффициент корреляции значим (не равен 0), следовательноXиYкоррелированны, т.е. связаны линейной зависимостью .
2) В качестве критерия проверки нулевой гипотезы примем случайную величину:
(2.3.1.)
Величина Т при справедливости нулевой гипотезы имеет распределение Стьюдента с k=n-2 степенями свободы. Обозначим значение критерия , вычисленное по данным наблюдениямTнабл., тогда
(2.3.2.)
3) По таблице критических точек распределения Стьюдента Т по заданному уровню значимости и числу степеней свободыk= n - 2находим критическую точкуtкр(,k).
4) Если tкр > Тнабл., то нулевая гипотеза Н0 принимается. ) Еслиtкр < Тнабл., то нулевая гипотезаН0 отвергается.
Замечание.Для вычисления критического значения критерия Стьюдента можно воспользоваться таблицей критических значений критерия Стьюдента (см. справочник)
2.4. Интервальные оценки для значимых парных коэффициентов корреляции.
Для каждого значимого коэффициента корреляции построим интервальные оценки. Для этого воспользуемся Z- преобразованием Фишера (2.4.1):
Z=0,5ln. (2.4.1)
Из математической статистики известно, что при небольших n распределение величины Z хорошо приближается нормальному распределению с математическим ожиданием равным
(2. 4. 2)
и дисперсией , откуда следует, что стандартное отклонение равно
. (2.4.3)
Вычислим критическое значение критерия Стьюдента tдля заданного уровня значимостипо статистическим таблицам или с помощью встроенной функции электронных таблиц.
Тогда доверительный интервал для коэффициента корреляции принимает вид:
( M [r] - t; M [r] +t), или(2.4.4)