Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика предприятия Часть I курс лекций.docx
Скачиваний:
342
Добавлен:
09.04.2015
Размер:
732.65 Кб
Скачать

10.5 Измерение тесноты связи между признаками

Для определения тесноты связи между факторным и результативным признаком используются:

1 индекс корреляции R, вычисляемый по формуле

где − общая дисперсия,

− дисперсия, измеряющая отклонениеy от yx .

Значение R меняется от 0 до 1. Чем ближе к 1, тем связь теснее. Применяется для любого вида связи (не показывает направления).

2 теоретическое корреляционное отношение η:

Частным случаем теоретического корреляционного отношения является линейный коэффициент корреляции (), который применяется только в случае линейной связи. Он меняется от −1 до 1, показывает не только тесноту, но и направление связи. Вычисляется по следующей формуле:

.

10.6 Проверка значимости корреляционной связи с помощью дисперсионного анализа

Можно проверить значимость корреляционной связи с помощью дисперсионного анализа. Дисперсионный анализ основывается на расчленении общей вариации признака на вариацию систематическую, обусловленную введенным в анализ фактором (одним или несколькими), и на вариацию остаточную, обусловленную всеми прочими факторами. При этом дисперсии, измеряющие эти вариации, исчисляются путем деления сумм квадратов отклонений на число степеней свободы независимого варьирования. Для общей вариации число степеней свободы равняется n – 1, где n – численность единиц совокупности. Для вариации систематической число степеней свободы равняется m – 1, где m – число групп, образованных по факторному признаку. И для остаточной вариации (она аналогична внутригрупповой дисперсии) число степеней свободы равно n – m.

В качестве критерия оценки существенности различий этих дисперсий, а следовательно, и значимости выявленной зависимости принимается отношение

.

Выдающийся английский математик-статистик Р. Фишер вычислил критическое значение F в зависимости от числа степеней свободы той и другой дисперсии, случайное превышение которого маловероятно. Значит, если фактическое значение F превышает теоретическое (табличное) значение F, то различие между дисперсиями отражает не случайные факторы, а носит закономерный характер и тем подтверждается значимость найденной зависимости.

10.7 Понятие о многофакторном корреляционно-регрессионном анализе

Для многофакторного корреляционного анализа математически задача формулируется следующим образом: требуется найти аналитическое выражение, наилучшим образом отражающее связь между факторными признаками и результативными:

у=f(x1, x2 ,. . . xn).

Наиболее сложным представляется выбор формы связи, т.к. графический метод здесь неприемлем. Можно опираться на теоретические знания, на опыт предыдущих исследований, а при отсутствии таких сведений можно определить вид связи опытным путем, т.е. путем перебора функций разных видов. Однако это сопряжено с большим количеством лишних расчетов.

Поскольку любую функцию многих переменных можно свести к линейному виду, то уравнение множественной регрессии можно искать в линейной форме:

.

В случае неадекватности линейного уравнения множественной регрессии рекомендуется повышать порядок уравнения, пока не удастся подобрать кривую, соответствующую данной статистической информации. При этом, как бы удачно не был выбран вид функции, нельзя ожидать полного соответствия расчетных ух и фактических у значений изучаемого показателя, так как уравнение множественной регрессии учитывает влияние (среднее) на результативный признак не всех, а лишь основных, существенных факторов. Действие остальных неучтенных факторов и вызывает разброс фактических значений вокруг расчетных.

С помощью многофакторного корреляционного анализа находятся различного рода характеристики тесноты связи между изучаемым показателем и факторами: парные, частные и множественные коэффициенты корреляции, множественный коэффициент детерминации.

Парные коэффициенты корреляции. Для измерения тесноты связи между двумя из рассматриваемых переменных (без учета их взаимодействия с другими переменными) применяются парные коэффициенты корреляции. Методика расчета таких коэффициентов и их интерпретация аналогичны линейному коэффициенту корреляции в случае однофакторной связи.

Частные коэффициенты корреляции. Однако в реальных условиях все переменные, как правило, взаимосвязаны. Теснота этой связи определяется частными коэффициентами корреляции, которые характеризуют степень влияния одного из аргументов на функцию при условии, что остальные независимые переменные закреплены на постоянном уровне. В зависимости от количества переменных, влияние которых исключается (элиминируется), частные коэффициенты корреляции могут быть различного порядка. При исключении влияния одной переменной получаем частный коэффициент корреляции первого порядка; при исключении влияния двух переменных – второго порядка и т. д. Парный коэффициент корреляции между функцией и аргументом обычно не равен соответствующему частному коэффициенту.

Частный коэффициент корреляции первого порядка между признаками у и х1 при исключенном влиянии признака х2 вычисляется по формуле

где r – парные коэффициенты корреляции между соответствующими признаками.

Совокупный коэффициент множественной корреляции. Показателем тесноты связи, устанавливаемой между результативным и двумя или более факторными признаками, является совокупный коэффициент множественной корреляции R. Он служит основным показателем линейной корреляционной связи. В случае линейной двухфакторной связи совокупный коэффициент множественной корреляции может быть рассчитан по формуле

где r – линейные коэффициенты корреляции (парные), а подстрочные индексы показывают, между какими признаками они исчисляются.

Совокупный коэффициент множественной корреляции измеряет одновременное влияние факторных признаков на результативный. Его значения находятся в пределах от 0 до 1. Чем меньше наблюдаемые значения изучаемого показателя отклоняются от линии множественной регрессии, тем корреляционная связь является более интенсивной, а, следовательно, величина R ближе к единице.

Совокупный коэффициент множественной детерминации. Величина R2 называется совокупным коэффициентом множественной детерминации. Она показывает, какая доля вариации изучаемого показателя объясняется влиянием факторов, включенных в уравнение множественной регрессии. Значения совокупного коэффициента множественной детерминации находятся в пределах от 0 до 1. Поэтому, чем R2 ближе к единице, тем вариация изучаемого показателя в большей мере характеризуется влиянием отобранных факторов.

Задачей многофакторного регрессионного анализа является построение уравнения множественной регрессии и нахождение неизвестных параметров а0, а1, ..., аn, выбранной функции. Параметры уравнения, как и в случае парной регрессии, находятся по способу наименьших квадратов.

Так, для расчета параметров простейшего уравнения множественной регрессии – линейной двухфакторной регрессии

где ух – расчетные значения результативного признака-функции;

x1 и x2– факторные признаки;

a0,a1,a2 – параметры уравнения,

строится следующая система нормальных уравнений:

;

;

.

Для получения данной системы нужно составить вспомогательную; таблицу значений: х1, х2, у, ух1, ух2, х1х2, х12, х22.

Каждый коэффициент этого уравнения, кроме а0, показывает степень влияния соответствующего фактора на анализируемый показатель (при фиксированном положении на среднем уровне остальных факторов), и все эти коэффициенты называются коэффициентами регрессии и показывают, как меняется результативный признак при изменении соответствующего факторного на 1.

Однако коэффициенты регрессии не могут сами по себе определить, какие из них оказываю: наибольшее влияние на исследуемый показатель (поскольку они измерены различными единицами), а также в развитии каких факторов заложены крупные резервы его улучшения (так как не учитывается вариация факторов).

Для этого должны быть вычислены частные коэффициенты эластичности (Эi) итак называемые βi (бета-коэффициенты).

Различия в единицах измерения факторов устраняются с помощью частных коэффициентов эластичности, которые рассчитываются по формуле

где ai – коэффициент регрессии при i-м факторе;

–среднее значение i-го фактора;

–среднее значение изучаемого показателя.

Частные коэффициенты эластичности показывают, на сколько процентов в среднем изменяется анализируемый показатель с измененном на 1% каждого фактора при фиксированном положении других факторов.

Для определения факторов, в развитии которых заложены наиболее крупные резервы улучшения (с точки зрения целей исследования) изучаемого показателя, необходимо учесть различия в степени варьирования вошедших в уравнение факторов. Это можно сделать с помощью βi - коэффициентов, которые вычисляются по формуле

где – среденее квадратическое отклонениеi-го фактора;

–среденее квадратическое отклонение показателя.

βi – коэффициент показывает, на какую часть среднего квадратического отклонения изменяется результативный признак с изменением соответствующего факторного признака на величину его среднего квадратического отклонения.