- •Самарский государственный университет.
- •Глава 5. Анализ временных рядов. 29
- •Глава 6. Дисперсионный анализ. 34
- •Глава 7. Метод главных компонент 47
- •Глава 8. Факторный анализ 53
- •Глава 1. Математические модели.
- •1.1. Классификация моделей.
- •1.2. Этапы построения математических моделей
- •Глава 2. Корреляционный анализ: вид связи и проверка гипотез.
- •2.1.Коэффициент парной корреляции
- •2.2. Коэффициент детерминации
- •2.3. Статистическая оценка значимости коэффициентов корреляции.
- •2.4. Интервальные оценки для значимых парных коэффициентов корреляции.
- •2.5. Коэффициент корреляции рангов.
- •Решение
- •Глава 3. Регрессионный анализ: парная линейная регрессия.
- •3.1. Общие сведения. Парная линейная регрессия.
- •3.1.1. Функция регрессии
- •3.1.2. Последовательность проведения регрессионного анализа
- •3.1.3. Предпосылки к проведению регрессионного анализа
- •3.2. Метод наименьших квадратов
- •3.2.1. Проверка адекватности модели
- •3.2.2. Проверка значимости параметров модели
- •3.3. Описание типового примера. Алгоритм построения регрессионной модели.
- •3.4. Использование оцененной модели для прогнозирования
- •Глава 4. Множественная линейная регрессия
- •4.1. Корреляционно - регрессионный анализ.
- •4.2. Некоторые нелинейные модели, сводящиеся к линейным
- •4.3. Проверка предпосылок регрессионного анализа
- •1. Проверка нормальности закона распределения ошибок
- •3. Проверка на автокорреляцию случайных ошибок
- •Замечание. Если в модели много незначимых коэффициентов - ее надо упростить, т.Е. Уменьшить число искомых величин b. Если модель неадекватна, ее надо усложнить, т.Е. Добавить новые члены.
- •4.4. Пример решения задачи моделирования с использованием метода наименьших квадратов.
- •4.5. Метод наименьших квадратов (мнк) – общий случай
- •Глава 5. Анализ временных рядов.
- •5.1. Проверка законов распределения.
- •1. Проверка подчинения эмпирического распределения нормальному закону распределения
- •2. Проверка подчинения эмпирического распределения закону распределения Пуассона.
- •5.2. Изучение динамики
- •5.2.1. Средние показатели тенденции динамики
- •5.2.2. Выявление типа тенденции динамики тренда
- •5.2.3. Определение оптимального значения тренда
- •Глава 6. Дисперсионный анализ.
- •Однофакторный дисперсионный анализ.
- •6.2. Применение однофакторного анализа.
- •6.3. Проверка гипотезы об отсутствии влияния факторов на параметр
- •Можно показать [5], что, как и в случае однофакторного анализа, разность
- •Трехфакторный дисперсионный анализ.
- •6.5. Отсеивающие эксперименты и дисперсионный анализ
- •6.6. Рандомизация эксперимента
- •6.7. Определение аналитического вида зависимости параметра от факторов.
- •6.7.1. Матрица планирования
- •Глава 7. Метод главных компонент
- •7.1. Математическая модель метода главных компонент.
- •7.2. Алгоритм метода главных компонент
- •7.3. Нахождение коэффициентов характеристического уравнения
- •Глава 8. Факторный анализ
- •8.1. Модель факторного анализа.
- •8.2. Вращение факторов.
- •8.3. Применение факторного анализа.
- •8.4. Некоторые результаты факторного анализа
- •Приложение 1. Статистические таблицы
- •При числе степеней свободы
- •Критические точки распределения критерия g
- •Значения верхнего предела n2 в зависимости от уровня значимости
2.5. Коэффициент корреляции рангов.
К мерам тесноты парной связи относится и предложенный английским психологом Ч.Спирменом (1863-1945) коэффициент корреляции рангов.
Ранги - это порядковые номера единиц совокупности в ранжированном ряду. Если проранжировать совокупность по двум признакам, связь между которыми изучается, то полное совпадение рангов означает максимально тесную связь, а полная противоположность рангов - максимально тесную обратную связь.
Ранжировать оба признака следует в одном и том же порядке: либо от меньших значений признака к большим, либо наоборот. Если ранги единиц совокупности по признакам х и у обозначить как Рx , Рy , то коэффициент корреляции рангов принимает вид:
rpxpy=, (2.5.1)
где РхиРу – средние значения рангов. Известно, что средние ранги вычисляются по формуле (n+1)/ 2. Также известно, что сумма квадратов отклонения чисел натурального ряда от их средней величиныиравна
(1.5.2)
Следовательно, знаменатель формулы (1.5.1.) равен . Рассмотрим далее разности ранговdi=и сумму их квадратов отклонений
=
= (1.5.3)
Откуда следует:
:2=(1.5.4)
Подставив (1.5.4.) в (1.5.1) , получим
(1.5.5)
Формула (1.5.5) представляет собой формулу Спирмена (формула корреляции рангов). Преимущество коэффициента корреляции рангов состоит в том, что ранжировать можно и по таким признакам, которые нельзя выразить численно.
Недостатком коэффициента корреляции рангов является то, что одинаковым разностям рангов могут соответствовать различные разности значений признаков (в случае количественных признаков). Поэтому для количественных признаков следует считать корреляцию рангов приближенной мерой тесноты связи, обладающей меньшей информативностью, чем коэффициент корреляции числовых значений признаков.
Если среди значений признаков х и у, имеется несколько одинаковых значений, то образуются связанные ранги, т.е. одинаковые средние номера. Например, вместо одинаковых по порядку третьего и четвертого значений признака будут записаны 2 ранга по (3+4)/2=3,5.
Пример. В таблице 1 представлены ответы респондентов, полученные в результате социологического опроса.
Таблица 1.2.
X1
X2
X3
180
115
86
192
131
99
176
176
78
199
167
85
182
106
121
184
132
99
221
161
154
192
205
155
Установите вид связи и тенденцию между всеми парами компонентов по следующей схеме:
Вычислите коэффициенты корреляции;
Установите вид (степень) корреляционной связи между парами компонентов;
Проверьте гипотезы о значимости парных коэффициентов корреляции.
По заданию сделайте вывод в терминах решаемой задачи
Решение
Связь между признаками Х1, Х2.
Выдвигаем гипотезу Н0 -
отсутствие связи( r12=0);
= 0,05 - уровень значимости,
k = n - 2 = 8 - 2 = 6 - число степеней свободы.
N
X1
X2
1
180
115
2
192
131
3
176
176
4
199
167
5
182
106
6
184
132
7
221
161
8
192
205
Средние
190,750
149,125
Ст. отклон.
14,350
33,702
Коэф.кор r12
0,300
t наблюд
0,772
t критич.
2,447
t наблюд. < t крит. Согласно критерию
Стьюдента, гипотеза H0: r13= 0
принимается, т.е. Х2 не влияет на Х2
Решим задачу для трех выбранных
признаков Х1, Х2, Х3. Тогда в нашем примере
результаты могут быть представлены
в следующей форме:
Связь между признаками Х2, Х3
Выдвигаем гипотезу Н0-
отсутствие связи ( r13=0);
a = 0,05 - уровень значимости,
k = n - 2 = 8 - 2 = 6 - число степеней свободы.
N
X1
X3
1
180
86
2
192
99
3
176
78
4
199
85
5
182
121
6
184
99
7
221
154
8
192
155
Средние
190,750
109,625
Ст. отклон.
14,350
30,584
Коэф. кор r13
0,610
t наблюд
1,888
t критич.
2,447
t наблюд. < t крит. Согласно критерию
Стьюдента, гипотеза H0: r13= 0
принимается, т.е. Х2 не влияет на Х3
Аналогично можно определить вид связи между признаками Х1 и Х3.