Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Uchebnik_po_ONI_Kozhuhar_V_M

.pdf
Скачиваний:
52
Добавлен:
11.03.2016
Размер:
1.33 Mб
Скачать

Окончание табл. 17

1

2

3

4

Табличный F-критерий, Fтабл,

4,41*1

при значимости 0,05

 

 

 

Коэффициент существенности

21,67*2

связи (k) при значимости 0,05

 

 

 

Результаты выполненного дисперсионного анализа свидетельствуют о существенности зависимости прочности кладки от типа перевязки.

Правомерно объединение вариационного и дисперсионного анализов в единый — вариационно-дисперсионный, аналогично корреляционно-регрессионному.

Вопросы для самоконтроля

1.В чем сущность дисперсионного анализа?

2.В каких сферах (областях) целесообразно использование дисперсионного анализа?

17.2.7. Ранговый корреляционный анализ

Ранговый корреляционный анализ является методом выявления наличия и оценки тесноты связи между явлениями, измеренными на любом уровне (качественном, метрическом) и

влюбой комбинации уровней. Единственное выдвигаемое при этом требование — возможность ранжирования измеренных величин. Зачастую ранговые коэффициенты связи, установленные рассматриваемыми методами, могут рассматриваться

вкачестве меры согласованности мнений экспертов. Процесс анализа покажем на примерах количественной и качественной (атрибутивной) оценки изучаемых факторов.

Пример исходной информации с количественной оценкой факторов приведен в табл. 18, а с качественной — в табл. 19.

Требуется установить, существует ли связь между балансовой прибылью и годовым объемом реализации продукции у предприятий региона и, если да, то насколько она сильна.

Требуется установить, согласованы ли предпочтения жителей смежных микрорайонов, и если да, то в какой мере.

101

Таблица 18

Данные о важнейших показателях производственнохозяйственной деятельности ряда предприятий региона

 

Значения показателей

Обозначение

независимого (х)

зависимого (у)

предприятия (i)

Годовой объем реализо-

Годовая балансовая

 

ванной продукции, млн руб.

прибыль, тыс. руб.

1

3,4

70,0

2

5,6

65,0

3

4,3

80,0

4

2,7

60,0

 

 

 

5

4,2

71,0

6

8,4

88,0

7

6,5

82,0

8

9,4

91,0

9

7,2

80,0

10

2,4

63,0

Таблица 19

Данные о предпочтениях продовольственных магазинов, расположенных на границе микрорайонов, жителей двух микрорайонов

Обозначение

Оценка привлекательности магазинов

для жителей микрорайона

магазина (i)

А

Б

 

Заря

Чрезвычайно привлекателен

Очень привлекателен

Рассвет

Не привлекателен

Неопределенный

Закат

Привлекателен

Чрезвычайно привлекателен

Улыбка

Не очень привлекателен

Привлекателен

Сумерки

Очень привлекателен

Привлекателен

Хуторянин

Неопределенный

Не очень привлекателен

Одним из показателей, характеризующих наличие и тесноту ранговой связи между изучаемыми объектами (явлениями), является коэффициент корреляции рангов Ч. Спирмена1. Его значения для случая несвязанных2 рангов определяются по формуле

1 См. [16, с. 321].

2 То есть когда значения рангов двух наблюдений в одном и том же столбце совпадают и им присваивают “половинные” ранги. Чаще всего формулу используют и для вычислений при связанных рангах.

102

(46)

где x/y — значение коэффициента Спирмена;

— квадрат разности рангов;

n — число наблюдений (пар рангов).

Процесс ранжирования наблюдений и порядок вычисления значений отмеченного коэффициента представим в табличных формах (табл. 20 и 21).

 

 

 

 

 

 

Таблица 20

 

Ранжирование факторов и обработка рангов

 

 

(по данным табл. 18)

 

 

 

 

 

 

 

 

 

 

 

Данные по показателям

 

 

 

 

независимому

зависимому

Разность

Квадраты

 

 

Ранг

 

 

Ранг

рангов

разности

 

Значение

наблюде-

Значение

 

наблюде-

(di = Rx Ry)

рангов (di2 )

 

 

ния Rx

 

 

ния Ry

 

 

 

3,4

8

70,0

 

7

1

1

 

5,6

5

65,0

 

8

–3

9

 

4,3

6

80,0

 

4,5*2

1,5

2,25

 

2,7

9

60,0

 

10

–1

1

 

4,2

7

71,0

 

6

1

1

 

8,4

2

88,0

 

2

0

0

 

6,5

4

82,0

 

3

1

1

 

9,4

1*1

91,0

 

1

0

0

 

7,2

3

80,0

 

4,5

–1,5

2,25

 

2,4

10

63,0

 

9

1

1

 

Итого

 

 

 

 

 

18,5

 

*1 Наиболее высокий (первый) ранг присваивается лучшему значению показателя.

*2 При равенстве значений показателя им обоим присваиваются одинаковые («половинные») ранги. В этом проявляется «сдвоенность» рангов.

103

 

 

 

 

 

Таблица 21

Ранжирование факторов и обработка рангов

 

 

 

(по данным табл. 19)

 

 

 

 

 

 

 

 

Данные по показателям

 

 

Квад-

А

 

 

Б

 

Разность

раты

 

 

 

 

 

рангов

 

Ранг

 

 

Ранг

рангов

Качественная

 

Качественная

разно-

 

(di = Rx Ry)

оценка

наблю-

 

оценка

наблю-

сти

 

дения

 

 

дения

 

(di2 )

Чрезвычайно

1

 

Очень

2

–1

1

привлекателен

 

 

привлекателен

 

 

 

Не привлекате-

6

 

Неопределенный

6

0

0

лен

 

 

 

 

 

 

Привлекателен

3*1

 

Чрезвычайно

1

2

4

 

 

 

привлекателен

 

 

 

Не очень

4

 

Привлекателен

3,5

0,5

0,25

привлекателен

 

 

 

 

 

 

Очень

2

 

Привлекателен

3,5

–1,5

2,25

привлекателен

 

 

 

 

 

 

Неопределенный

5

 

Не очень

5

0

0

 

 

 

привлекателен

 

 

 

Итого

 

 

 

 

 

7,5

Коэффициент Спирмена принимает любые значения в интервале [–1; 1]. Значимость коэффициента проверяется при помощи tp-критерия Стьюдента, расчетные значения которого вычисляются по формуле

(47)

где tp — расчетное значение t-критерия Стьюдента.

Значения tp считаются статистически значимыми, если tp > tтабл при заданном уровне вероятности ( ) и числе степеней свободы (V), равном n – 2 (см. прил. 2).

*1 Как видим, ранги при одинаковых качественных (да и количественных) оценках в разных столбцах могут не совпадать (3 и 3,5; 5 и 6).

104

Другим показателем, характеризующим наличие и тесноту ранговой связи между изучаемыми объектами (явлениями), является коэффициент корреляции рангов М. Кендалла1 ( ). Для вычисления значений коэффициента для случая несвязанных рангов пользуются формулой (48), а связанных — (49)

(48)

(49)

где S — сумма разностей между числом последовательностей и числом инверсий по второму признаку (S = P Q); это фактическая сумма рангов; выражение в знаменателе — максимальная сумма рангов.

Значения Vx и Vy определяются по формуле

Vx и

(50)

где tj — число повторений связанных рангов.

Расчет коэффициента выполняется в данной последовательности:

1)значения х ранжируются в порядке возрастания или убывания;

2)значения у располагаются в порядке, соответствующем значениям х;

3)для каждого ранга у определяется число следующих за ним значений рангов, превышающих его значение; суммируя таким образом числа, определяют значение Р как меру соответствия последовательностей рангов по х и у и учитывают ее со знаком (+);

1 См. [ 16, с. 325].

105

4)для каждого ранга у определяется число следующих за ним рангов, меньших его значения, суммируя таким образом числа, определяют значение Q и учитывают его со знаком (–);

5)определяется сумма баллов по всем членам ряда.

Эту последовательность (по данным табл. 20) покажем в форме табл. 22.

Таблица 22

Значения показателей, упорядоченные согласно требованиям п. 1 и 2

Упорядоченные

Число последующих рангов

значения показателей

 

 

х

у

превышающих

меньших

значение ранга (j)

значения ранга (j)

 

 

9,4

91,0

0

9

8,4

88,0

0

8

7,2

80,0

1

5

6,5

82,0

0

6

5,6

65,0

3

2

4,3

80,0

0

4

4,2

71,0

0

3

3,4

70,0

0

2

2,7

60,0

1

0

2,4

63,0

0

0

 

Итого (Q)1

5

 

 

Итого: (Р)

39

S = 39 – 5 = 34.

Vx = 0 (см. табл. 22, связанные ранги отсутствуют).

(см. табл. 22: имеется только два “свя-

занных” ранга).

1 Обозначения изменены ввиду упорядочения фактора «х» в порядке уменьшения.

106

Связь между признаками можно считать статистически значимой, если значения коэффициентов ранговой корреляции Спирмена и Кендалла больше 0,5.

Третьим из показателей, характеризующих наличие и тесноту ранговой связи между изучаемыми объектами (явлениями), рассматривают1 множественный коэффициент ранговой корреляции (коэффициент конкордации W), значения которого для случая несвязанных рангов определяются по формуле

(51)

где m — количество факторов; n — число наблюдений.

Порядок определения значения S будет показан ниже по данным табл. 23.

Значения W для случая связанных рангов определяют по формуле

(52)

При этом

(53)

где tj — число повторений связанных рангов в графе признака.

Коэффициент конкордации принимает значения в интервале [–1; 1].

Порядок вычисления значения коэффициента конкордации покажем в табл. 23, составленной по данным табл. 20.

1 См. [16, с. 327].

107

Таблица 23

Порядок вычисления коэффициента конкордации

Данные по показателям

 

Суммы рангов

Квадраты

независимому

зависимому

по строке

сумм рангов

Значение

Ранг

Значение

Ранг

(наблюдению)

 

3,4

8

70,0

7

15

225

5,6

5

65,0

8

13

169

4,3

6

80,0

4,5

10,5

110,25

2,7

9

60,0

10

19

361

4,2

7

71,0

6

13

169

8,4

2

88,0

2

4

16

6,5

4

82,0

3

7

49

9,4

1

91,0

1

2

4

7,2

3

80,0

4,5

7,5

56,25

2,4

10

63,0

9

19

361

Итого

55

55

110

1520,5

где 10 — число наблюдений (n).

Tx = 0, так как tx = 0;

Tj = 1/12 (13 – 1) = 0, так как tj = 1;

Значимость коэффициента конкордации поверяется на основе критерия Пирсона ( 2), вычисляемого для случая несвязанных рангов по формуле

(54)

а для случая связанных — по формуле

(55)

Расчетные значения 2 сравнивается с табличным ( при уровне вероятности и числе степеней свободы V = n – 1; значения принимают по прил. 3.

108

Отметим, что при возможности использования корреляци- онно-регрессионного анализа предпочтение отдают ему, а не методам ранговой корреляции.

Вопросы для самоконтроля

1.В чем сущность рангового корреляционного анализа?

2.В каких сферах (областях) целесообразно использование рангового корреляционного анализа?

3.Что понимают под корреляцией?

4.Что понимают под рангом показателя?

17.2.8. Корреляционно-регрессионный анализ

Под корреляционным анализом понимают выявление наличия вероятностной связи1 (прямой2 или обратной) между двумя количественно измеренными факторами. А под регрессионным — установление формы и существенности связи между ними. Сущность метода рассмотрим на примере парной линейной корреляции3. Исходные данные для соответствующего анализа представим в табл. 24.

В табл. 24 приведены показатели уровня квалификации рабочих на десяти охваченных выборкой предприятиях, выраженные средним разрядом рабочих, и среднемесячные значения выработки рабочих на этих же предприятиях, выраженные в тыс. руб./чел. Зависимость выработки рабочих от уровня их квалификации (гипотеза исследования) предполагается на основе наблюдений.

Факт наличия стохастической связи между парой переменных (наличия корреляции) может быть установлен графически. Для этого в двухкоординатной сетке (х; у) наносятся показатели, характеризующие каждое наблюдение, т. е. строится так называемое “корреляционное поле”. Пример корреляционного поля, соответствующего данным табл. 24, приведен на рис. 15.

1 Или стохастической, т. е. такой, которая проявляется на массовых явлениях и с определенной долей вероятнояти.

2 Причинно-следственной.

3 Под корреляцией понимают вероятностную связь, зависимость двух переменных. Различают линейную и нелинейную, парную и множественные корреляции.

109

Таблица 24

Данные о средних квалификации и выработке рабочих по предприятиям

Обозначение предприятия

1

2

3

4

5

6

7

8

9

10

(наблюдения)

 

 

 

 

 

 

 

 

 

 

Независимая переменная —

3,6

4,1

3,7

5,0

3,8

4,0

4,5

4,9

3,9

4,7

уровень квалификации (х)

 

 

 

 

 

 

 

 

 

 

Зависимая переменная —

49,0

54,0

50,0

57,0

52,0

48,0

57,0

58,0

51,0

56,0

выработка (у)

 

 

 

 

 

 

 

 

 

 

Среднемесячные

значения выработки

58,0

56,0

54,0

52,0

50,0

3

а0

1

48,0

 

8 7

4

10

2

5

Теоретическая линия

9 регрессии: у = а0 + a1x

Эмпирическая линия

регрессии 6

3,6 3,8 4,0 4,2 4,4 4,6 4,8 5,0 Значения среднего разряда рабочих

Рис. 15. Общий вид корреляционного поля: 1 — обозначение наблюдения

Из рис. 15 видна общая тенденция, отмечаемая эмпирически: с увеличением уровня квалификации рабочих их выработка возрастает; однако тенденция эта стохастическая, наряду

свозрастанием наблюдаются и снижения выработки при росте уровня квалификации. Необходимо, с одной стороны, подтвердить или опровергнуть гипотезу об увеличении выработки

сростом квалификации рабочих, а с другой — если гипотеза будет подтверждена, установить характеристики связи между рассматриваемыми переменными.

110

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]