Глава 2. Корреляционный анализ: вид связи и проверка гипотез.

Современная наука исходит из взаимосвязи всех явлений природы и общества. Невозможно управлять явлениями, предсказывать их развитие без изучения характера, силы и других особенностей связей. Поэтому методы исследования, измерения связей составляют чрезвычайно важную часть методологии научного исследования, в том числе и статистического.

Различают два типа связей между различными явлениями и признаками: функциональную или жестко-терминированную, с одной стороны, и статистическую или стохастически детерминированную - с другой.

Функциональная связь двух величин возможна лишь при условии, что вторая из них зависит от первой и ни от чего более.

Стохастическая детерминированная связь не имеет ограничений и условий, присущих функциональной связи.

В настоящее время наука не знает более широкого определения связи. Все связи, которые могут быть измерены и выражены численно, подходят под определение «статистические связи», в том числе и функциональные. Функциональные связи представляют собой частный случай статистических связей

Корреляционной связью называют важнейший частный случай статистической связи, состоящий в том, что разным значениям одной переменной соответствуют различные средние значения другой.

Корреляционно-регрессионный анализ является одним из наиболее широко распространенных и гибких приемов обработки статистических данных. Его появление связано с именем английского ученого-исследователя Фрэнсиса Гальтона, предложившего в 1975 году теоретические основы корреляционно-регрессионного метода, а 1801 году рассчитавшего с его помощью траекторию полета планеты Церера. В разное время над теорией анализа работали известные в области теоретической статистики ученые: Карл Фридрих Гаусс, Андриан Мари Лежандр, Карл Пирсон и другие.

Корреляционная связь между признаками может возникнуть разными путями. Важнейший путь – причинная зависимость результативного признака (его вариации) от вариации факторного признака. Для измерения тесноты корреляционной связи применяется несколько показателей. Рассмотрим некоторые из них.

2.1.Коэффициент парной корреляции

Коэффициент парной корреляции определяет меру тесноты связи между двумя факторами и вычисляется по формуле:(2.1.1)

Теснота парной линейной корреляционной связи, как и любой другой, может быть измерена коэффициентом парной корреляции, который при линейной форме уравнения связи представляет собой стандартизованный коэффициент, т. е. коэффициент, выраженный не в абсолютных единицах измерения признаков, а в долях среднего квадратического отклонения результативного признака.

Коэффициент корреляции не зависит от принятых единиц измерения признаков, а стало быть, он сравним для всех признаков.

В математической статистике коэффициент корреляции характеризует следующие виды

корреляционной связи:

r= 0 - связь отсутствует;

0,01 < r 0,09 - связь слабая, (1.1.2.)

0,09 < r 0,49 - связь средняя,

0,49 < r 1,00 - связь сильная.

Многофакторная система требует уже не одного, а множества показателей тесноты связей, имеющих разный смысл и применение.

Основой измерения связей является матрица парных коэффициентов корреляции. Все элементы главной диагонали матрицы парных корреляций равны 1, остальные элементы меняются от -1 до 1.( -1< r_ij<1) Корреляционная матрица симметрична, относительно главной диагонали, т. е.rx_ix_j = rx_jx_i

Таблица 1.1.

Признаки	х₁	х₂	...	х_i	...	х_k
х₁	1	r_x₁_x₂	…	r_x₁_xi	…	r_x₁_xk
х₂	r_x₂_x₁	1	…	r_x₂_xi	…	r_x₂_xk
...	...	...	1	…	…	…
х_j	r_х_jx₁	r_xjx₂	...	1	…	r_xjxk
...	...	...	...	...	1	…
х_k	r_х_kx1	r_xkx2	...	r_xkxi	...	1

На основе этой матрицы можно судить о тесноте связи факторов с результативным признаком и между собой. Хотя все эти показатели относятся к парным связям, все же матрицу можно использовать для предварительного отбора факторов для включения их в уравнение регрессии.

<<< < Предыдущая 1 23 / 283 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>