Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
4ПМ_Б_Комп_Модел_Власова / Теоретический материал / Компютерное моделирование_Лекции.doc
Скачиваний:
93
Добавлен:
28.03.2016
Размер:
1.95 Mб
Скачать

Глава 2. Корреляционный анализ: вид связи и проверка гипотез.

Современная наука исходит из взаимосвязи всех явлений природы и общества. Невозможно управлять явлениями, предсказывать их развитие без изучения характера, силы и других особенностей связей. Поэтому методы исследования, измерения связей составляют чрезвычайно важную часть методологии научного исследования, в том числе и статистического.

Различают два типа связей между различными явлениями и признаками: функциональную или жестко-терминированную, с одной стороны, и статистическую или стохастически детерминированную - с другой.

Функциональная связь двух величин возможна лишь при условии, что вторая из них зависит от первой и ни от чего более.

Стохастическая детерминированная связь не имеет ограничений и условий, присущих функциональной связи.

В настоящее время наука не знает более широкого определения связи. Все связи, которые могут быть измерены и выражены численно, подходят под определение «статистические связи», в том числе и функциональные. Функциональные связи представляют собой частный случай статистических связей

Корреляционной связью называют важнейший частный случай статистической связи, состоящий в том, что разным значениям одной переменной соответствуют различные средние значения другой.

Корреляционно-регрессионный анализ является одним из наиболее широко распространенных и гибких приемов обработки статистических данных. Его появление связано с именем английского ученого-исследователя Фрэнсиса Гальтона, предложившего в 1975 году теоретические основы корреляционно-регрессионного метода, а 1801 году рассчитавшего с его помощью траекторию полета планеты Церера. В разное время над теорией анализа работали известные в области теоретической статистики ученые: Карл Фридрих Гаусс, Андриан Мари Лежандр, Карл Пирсон и другие.

Корреляционная связь между признаками может возникнуть разными путями. Важнейший путь – причинная зависимость результативного признака (его вариации) от вариации факторного признака. Для измерения тесноты корреляционной связи применяется несколько показателей. Рассмотрим некоторые из них.

2.1.Коэффициент парной корреляции

Коэффициент парной корреляции определяет меру тесноты связи между двумя факторами и вычисляется по формуле:(2.1.1)

Теснота парной линейной корреляционной связи, как и любой другой, может быть измерена коэффициентом парной корреляции, который при линейной форме уравнения связи представляет собой стандартизованный коэффициент, т. е. коэффициент, выраженный не в абсолютных единицах измерения признаков, а в долях среднего квадратического отклонения результативного признака.

Коэффициент корреляции не зависит от принятых единиц измерения признаков, а стало быть, он сравним для всех признаков.

В математической статистике коэффициент корреляции характеризует следующие виды

корреляционной связи:

r= 0 - связь отсутствует;

0,01 < r 0,09 - связь слабая, (1.1.2.)

0,09 < r 0,49 - связь средняя,

0,49 < r 1,00 - связь сильная.

Многофакторная система требует уже не одного, а множества показателей тесноты связей, имеющих разный смысл и применение.

Основой измерения связей является матрица парных коэффициентов корреляции. Все элементы главной диагонали матрицы парных корреляций равны 1, остальные элементы меняются от -1 до 1.( -1< rij <1) Корреляционная матрица симметрична, относительно главной диагонали, т. е.rxixj = rxjxi

Таблица 1.1.

Признаки

х1

х2

...

хi

...

хk

х1

1

rx1x2

rx1xi

rx1xk

х2

rx2x1

1

rx2xi

rx2xk

...

...

...

1

хj

rхjx1

rxjx2

...

1

rxjxk

...

...

...

...

...

1

хk

rхkx1

rxkx2

...

rxkxi

...

1

На основе этой матрицы можно судить о тесноте связи факторов с результативным признаком и между собой. Хотя все эти показатели относятся к парным связям, все же матрицу можно использовать для предварительного отбора факторов для включения их в уравнение регрессии.