- •Раздел I Анализ невременных данных
- •Характеристики случайной величины
- •Математическое ожидание с.В. X.
- •Дисперсия
- •Корреляция.
- •Медиана
- •Модель парной линейной регрессии
- •Теорема Гаусса-Маркова
- •Ковариационная матрица
- •Дисперсионный анализ
- •Модель множественной регрессии
- •Спецификация модели
- •Включение в модель несущественных параметров.
- •Dummy – переменные, фиктивные переменные
- •Интерпретация коэффициентов:
- •Прогнозирование
- •Выбор параметров линейной регрессии (процедура пошагового отбора)
- •Работа с процедурными значениями
- •Общая методика построения регрессионного уравнения
- •Раздел II
- •Коэффициент взаимной сопряженности Чупрова
- •Биссериальный коэффициент корреляции
- •Ранговые коэффициенты корреляции
- •Коэффициент корреляции Спирмена
- •Общая схема проверки гипотез
- •Структура международных маркетинговых исследований
- •Временные ряды
- •Временной или динамический ряд
- •Классификация временных рядов
- •Анализ трендовой составляющей
- •Метод, основанный на медиане или медианный критерий
- •Корреляция во времени
- •Анализ сезонности во временных рядах
- •Анализ автокорреляции
- •Выбросы и структурные изменения
- •Дискретные зависимые переменные
- •Решение проблемы
Коэффициент взаимной сопряженности Чупрова
-
коэффициент взаимной сопряженности.
Чем ближе Кп к 1, тем теснее связь.
Пример.
Форма собственности |
Оценка уровня жизни |
||||
Вполне уд. |
Скорее уд. |
Скорее неуд. |
Совсем неуд. |
Итого |
|
Государственная |
31 |
35 |
35 |
35 |
136 |
Муниципальная |
17 |
13 |
14 |
9 |
53 |
Смешанная рос. |
4 |
2 |
1 |
1 |
8 |
Частная |
8 |
5 |
4 |
3 |
20 |
Итого |
60 |
55 |
54 |
48 |
27 |
Оценить взаимосвязь между уровнем жизни респондента и формой собственности предприятий, на которых они работают.
Вывод: коэффициент маленький (меньше 0,3) значимой связи между формой собственности и уровнем жизни.
Существует
модификация этого коэффициента через
Биссериальный коэффициент корреляции
Он имеет особое значение, т.к. позволяет оценить связь между качественным альтернативным и количественным варьирующим признаком.
где
и
- средние по группе
у – корень из дисперсии (для количественной переменной)
р – доля 1-ой группы
q – доля 2-ой группы
z – табличное значение в зависимости от распределения значений 1-ой группы.
Пример. Найти зависимость между возрастом и социальным положением потенциальных эмигрантов.
|
До 30 |
30-40 |
40-50 |
50 и более |
Всего, чел. |
Руковод |
5 |
30 |
39 |
26 |
100 |
Рабочие |
21 |
|
28 |
13 |
100 |
Итого |
26 |
68 |
67 |
39 |
200 |
Оценить силу связи.
- частота проявления
признаков.
Выбираем среднее в группе = [25*5+35*30+45*39+55*26]*1/100=43,6
Средний возраст эмигрантов – руководителей =43,6 лет.
(рабочие) = [25*21+35*38+45*28+55*13]*1/100=38,3
=
[25*26+35*68+45*67+55*39]*1/200=40,95
у=
Р (рук)=100/200=0,5
Q (раб)=100/200=0,5
Z=0,3977
Ранговые коэффициенты корреляции
Как определить силу линейной связи между порядковыми переменными, между которыми существует отношение упорядоченности, т.е. между ранжированными значениями?
Все дальнейшие рассуждения опираются на понятие ранг.
Ранг – номер объекта в упорядоченном ряду.
Например: эксперт сравнивает объекты и выстраивает их по порядку. Чем лучше объект, тем выше ранг ему присваивают.
Ранг
A B C D E F G – ранжированный вариационный ряд
D A B C F E G
1
2 3 4 5 6 7
ранг
Т – объем выборки.
К сожалению, бывает, что ранги не различимы. Если же какие-то объекты не различимы для объекта, то используется понятие распределенный ранг. Тогда всем 3-м объектам присваивается один и тот же номер ранга, получаемый как сумма рангов этих объектов, деленная на их количество.
B C F – не различимы
(3+4+5)/3=4
Суммарное значение всех присвоенных рангов зависит от объема выборки и может быть рассчитан следующим образом:
- номер ранга,
присвоенного i-му объекту.
В нашем случае
