
- •Тема 8. Корреляционно-регрессионный анализ и моделирование статистических связей
- •Понятие корреляционной связи и корреляционно-регрессионного анализа (кра).
- •Условия применения и ограничения кра.
- •Парная регрессия на основе метода наименьших квадратов
- •Применение парного линейного уравнения регрессии.
- •Показатели тесноты связи.
- •Множественная регрессия.
Множественная регрессия.
Изучение связи между тремя и более связанными между собой признаками называется множественной (многофакторной) регрессией.
При исследовании зависимостей методами
множественной регрессии задача
формулируется так же, как и в случае
парной регрессии: требуется определить
аналитическое выражение связи между
результативным признаком y
и факторными признаками x
,
x
,
x
,
…x
.
Построение моделей множественной регрессии включает несколько этапов:
- выбор формы связи (уравнения регрессии);
- отбор факторных признаков;
- обеспечение достаточного объема совокупности.
Наиболее приемлемым способом определения вида исходного уравнения регрессии является метод перебора различных уравнений.
Практика построения многофакторных моделей взаимосвязи показывает, что все реально существующие зависимости между социально-экономическими явлениями можно описать, используя пять типов моделей:
- линейная
- степенная
- показательная
- параболическая
- гиперболическая
Условия отбора факторных признаков в уравнение множественной регрессии:
Факторный признак должен быть связан с результативным по смыслу.
Связь факторного и результативного признаков должна быть тесная.
Факторные признаки, включаемые в уравнение, не должны быть тесно связаны между собой, иначе возникает явление мультиколлинеарности.
Проблема размерности модели связи, т.е. определение оптимального числа факторных признаков, является одной из основных проблем построения уравнения множественной регрессии. С одной стороны, чем больше факторных признаков включено в модель, тем лучше она описывает явление. Однако модель размерностью 100 и более факторных признаков сложно реализуема и требует больших затрат времени. Сокращение размерности модели за счет исключения второстепенных, экономически и статистически несущественных факторов способствует простоте и качеству ее реализации. В тоже время построение модели малой размерности может привести к тому, что такая модель будет недостаточно адекватна исследуемым явлениям и процессам.
Качество уравнения регрессии зависит от степени достоверности и надежности исходных данных и объема совокупности. Необходимо стремиться к увеличению числа наблюдений, т.к. большой объем наблюдений является одной из предпосылок построения адекватных статистических моделей.
КОНТРОЛЬНЫЕ ВОПРОСЫ:
По направлению связи бывают …
А ….умеренные;
Б. …прямые;
В. …прямолинейные.
По аналитическому выражению различают…
А. ….обратные связи;
Б. …тесные связи;
В. …криволинейные связи.
Функциональной является связь между двумя признаками…
А. …при которой определенному значению факторного признака соответствует несколько значений результативного признака;
Б. …при которой определенному значению факторного признака соответствует одно значение результативного признака.
Аналитическое выражение связи определяется с помощью методов анализа:
А. корреляционного;
Б. регрессионного;
В. группировок.
Коэффициент корреляции рангов Спирмена можно применять для оценки тесноты связи между…
А. …количественными признаками;
Б. … качественными признаками, значения которых могут быть упорядочены;
В. … любыми качественными признаками.
Является ли связь между признаками корреляционной, если известно, что с изменением значения одного признака закономерным образом изменяются показатели вариации другого признака, при этом среднее значение другого признака закономерным образом не изменяется?
Как можно оценить связь между признаками, если известно, что коэффициент корреляции равен 0,75:
А. связь тесная прямая;
Б. связь слабая прямая;
В. связь тесная обратная;
Г. связь слабая обратная.
8. Если уравнение регрессии имеет вид
=2,0
– 3,2x , то можно
утверждать, что …
А. …коэффициент корреляции r = – 1;
Б. …коэффициент корреляции r = 1;
В. …коэффициент корреляции 0
r
1;
Г. …коэффициент корреляции –1 r 0;
Д. все утверждения неверные.
9. Коэффициент детерминации позволяет определить …
Варианты ответа:
А. …только тесноту связи;
Б. …тесноту и направление связи;
В. … направление связи и вид тренда;
Г. …другой ответ.
10. Какой из перечисленных показателей позволяет оценить тесноту связи между двумя описательными признаками?
Варианты ответа:
А. коэффициент корреляции;
Б. эмпирическое корреляционное отношение;
В. коэффициент Спирмена;
Г. коэффициент вариации.
11.Каким показателем можно оценить тесноту связи между следующими описательными признаками: посещение театров (регулярное, нерегулярное) и наличие высшего образования (есть, нет)?
Варианты ответа:
А. коэффициент корреляции;
Б. эмпирическое корреляционное отношение;
В. коэффициент Спирмена;
Г. коэффициент ассоциации.
При каком условии коэффициент Спирмена позволяет оценить тесноту связи между описательными признаками?
Варианты ответа:
А. значения одного из признаков поддаются ранжированию;
Б. значения обоих признаков поддаются ранжированию;
В. число значений признаков не более 100.
КОНТРОЛЬНЫЕ ЗАДАНИЯ:
Имеются следующие данные:
Группы рабочих по стажу, годы |
Численность рабочих |
Средняя заработная плата 1 рабочего, руб. |
Коэффициент вариации заработной платы рабочих, % |
До 3 |
12 |
5700 |
20 |
3-6 |
18 |
7900 |
16 |
6-9 |
15 |
10400 |
12 |
9 и более |
5 |
12300 |
10 |
Измерьте тесноту и силу связи. Сделайте выводы.
Для установления зависимости между двумя признаками X и Y произведено статистическое наблюдение, результаты которого представлены в следующей таблице.
|
1.25 |
1,5 |
1,75 |
2,0 |
2,25 |
8 |
- |
- |
1 |
2 |
3 |
13 |
- |
- |
1 |
4 |
3 |
18 |
- |
4 |
7 |
1 |
- |
23 |
2 |
7 |
5 |
- |
- |
28 |
6 |
4 |
- |
- |
- |
Вычислить коэффициент корреляции и составить уравнение регрессии.