Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

343

.pdf
Скачиваний:
5
Добавлен:
07.01.2021
Размер:
463.78 Кб
Скачать

Оба коэффициента – и Ф, и Q, – обладают теми же отмеченными выше свойствами, что и описанные ранее коэффициенты корреляции первого вида, в число которых входят и рассмотренный коэффициент корреляции Спирмена, а также лишь упомянутый здесь, но также очень важный для аналитической практики коэффициент корреляции Пирсона.

Для представленных в таблице сопряженности конкретных численных значений (табл. 4.3) получаем:

Q = (311 × 44 – 23 × 134) / (311 × 44 + 23 × 134) = (13 684 – 3082) / (13 684 + 3082) = 10 602 / 16 766 = 0,6323511.

Т. е. (округленно) Q = 0,63.

Ф =

10 602

.

 

334 ×178 × 445 × 67

 

На компьютере это выражение высчитывается просто. Однако на калькуляторе подкоренное значение может быть слишком большим для его шкалы, поэтому можно либо последовательно извлечь корень квадратный из каждого множителя под корнем, либо, что более рационально в данном случае, перемножить первые два множителя и извлечь корень из их произведения, то же проделать с парой из третьего и четвертого, а затем результат (уже относительно небольшие числа) перемножить, получив знаменатель дроби в окончательном виде.

Ф= 10 602 / 9243,8278 × 8,1853527 = 10 602 / 75 663,99 = 0,14012194.

Ф= 0,14.

Хотя и Q, и Ф обладают описанными выше свойствами коэффициента корреляции первого вида, значения их удовлетворяют соотношению нестрого неравенства: |Q| ≤ |Ф|. Фактически, Ф всегда меньше, чем Q, по абсолютной величине (или, что то же самое, по модулю). Равенство же бывает только в трех случаях: когда Ф = +1, когда Ф = – 1 и когда Ф = 0. Итак, если значение Q меньше 1 (например, 0,457), то и значение Ф будет меньше 1, причем еще меньше, чем у Q (например, 0,143), но, разумеется, того же знака.

А вот обратное не всегда верно, а именно: при |Ф| <1, |Q| вполне может и равняться единице. Как видно из формулы для Ф, его значение равно единице тогда и только тогда, когда одновременно равны нулю b и c. Если же только одно из них – причем все равно какое – равно нулю, то Ф будет обязательно меньше единицы. Аналогично, значение Ф равно – 1 тогда и только тогда, когда одновре-

71

менно равны нулю a и d. Если же только одно из них – причем все равно какое – равно нулю, то Ф будет по модулю обязательно меньше единицы. Из формулы для Q, напротив, видно, что его значение будет равно единице не при одном условии, как у Ф, а при трех:

1)одновременно равны нулю b и c;

2)b = 0, но c ≠ 0;

3)b ≠ 0, но c = 0.

Аналогично, из формулы для Q видно, что его значение будет равно –1 не при одном условии, как у Ф, а при трех:

1)одновременно равны нулю a и d;

2)a = 0, но d ≠ 0;

3)d ≠ 0, но a = 0.

Коэффициент Q является более «либеральным», а Ф – более строгим, более требовательным. Если связь между явлениями проявляется не во всем, то Ф обязательно будет меньше, в то время как Q оценивает по высшей мере, даже если идеально тесной будет одна (любая!) из сторон связи, а другая сторона – вовсе не идеальна.

Для иллюстрации рассмотрим две ситуации с нулевыми значениями.

Когда профилактика необходима (см. табл. 4.3) (т. е. без нее правонарушение неизбежно произойдет) и достаточна (т. е. одной лишь профилактики хватает для предотвращения правонарушения), Ф равно 1. Иными словами, Ф равно 1 тогда и только тогда, когда после профилактики правонарушения исключены и одновременно при отсутствии профилактики правонарушение неизбежно произойдет.

В отличие от этого, для того, чтобы Q равнялось 1, достаточно выполнения лишь одного (любого) из указанных условий (либо, разумеется, обоих условий сразу, одновременно).

Q = 1 (т. к. (311 × 44 – 23 × 0)/(311 × 44 + 23 × 0) = 1).

Идеальным (всеобщим) в анализируемой связи применительно

кпроводимой профилактике можно считать следующее:

1)несовершеннолетние, в отношении которых профилактическая работа не проводилась (44 все до единого), совершили правонарушения;

2)несовершеннолетние, которые не совершили правонарушения (их 311), характеризуются тем, что с ними (со всеми) профилактическая работа проводилась.

Соответственно, нарушение идеальности в связи, представленной в таблице, проявляется в следующем:

72

среди тех несовершеннолетних, с кем проводилась профилактическая работа, некоторые (часть) все-таки совершили правонарушения;

среди несовершеннолетних, совершивших правонарушения, имеется часть таких, с кем проводилась профилактическая работа.

1.Среди тех несовершеннолетних, с кем проводилась профилактическая работа, некоторые (часть) все-таки совершили правонарушения; таким образом, проведение профилактики не является достаточным (гарантирующим) условием соблюдения несовершеннолетними законности, ведь и при ее проведении у 23 подростков отмечено правонарушение.

2. Среди тех несовершеннолетних, с кем не проводилась профилактическая работа, нет тех, которые не совершили правонарушение; таким образом, совершение подростком правонарушения является достаточным (гарантирующим) условием того, что с ним до того не велась профилактическая работа.

Для сравнения: 0 < Ф < 1.

Несовершенно-

В отношении несовершеннолетнего

профилактическая работа

 

летний

 

 

 

 

 

 

 

 

 

правонарушение

проводилась

не проводилась

 

Всего

 

 

 

 

 

не совершил

311

134

 

445

 

 

 

 

 

совершил

0

44

 

44

 

 

 

 

 

Всего

311

178

 

489

 

 

 

 

 

Q = 1 (т. к. (311 × 44 – 0 × 134) / (311 × 44 + 0 × 134) = 1)

Идеальным в данном случае можно считать следующее:

1) если профилактическая работа проводилась, то совершивших правонарушение нет;

2) если правонарушение совершено, то с подростком, его совершившим, профилактическая работа не велась.

Для сравнения: 0 < Ф < 1.

4.3.Задачи

4.1.В таблице приводятся данные о наличии юридического образования у сотрудников подразделения ОВД и раскрываемости преступлений в подразделении:

№ подразделе-

1

2

3

4

5

6

7

8

9

10

11

ния ОВД

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Доля сотрудни-

 

 

 

 

 

 

 

 

 

 

 

ков с юридиче-

76

53

91

67

49

66

56

89

61

63

71

ским образова-

 

 

 

 

 

 

 

 

 

 

 

нием (%)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Раскрывае-

 

 

 

 

 

 

 

 

 

 

 

мость престу-

70

61

75

70

57

55

54

82

65

71

56

плений (%)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассчитайте коэффициент корреляции для представленных в таблице признаков. Что Вы можете сказать о характере связи между данными признаками?

4.2. В таблице приводятся данные относительно оснащенности компьютерной техникой подразделений УВД:

№ подразде-

1

2

3

4

5

6

7

8

9

10

11

12

ления УВД

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Количество

32

23

13

25

33

22

19

41

29

34

26

24

компьютеров

 

 

 

 

 

 

 

 

 

 

 

 

 

Результатив-

 

 

 

 

 

 

 

 

 

 

 

 

ность работы

70

61

65

45

28

55

65

75

43

58

49

37

(в баллах)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассчитайте коэффициент корреляции для представленных в таблице признаков. Что Вы можете сказать о характере связи между данными признаками?

4.3. Оцените зависимость раскрываемости квартирных краж от применения нового криминалистического метода:

Квартирная

Криминалистический метод

 

кража

применялся

не применялся

 

всего

 

 

 

 

 

Раскрыта

58

134

 

192

 

 

 

 

 

74

Не раскрыта

79

151

230

 

 

 

 

Всего

137

285

422

 

 

 

 

Что Вы можете сказать о характере связи между данными признаками?

4.4. Оцените зависимость наложения взыскания на водителя инспектором ГИБДД от фактической виновности водителя (по данным ведомственного контроля):

Водитель

Инспектором ГИБДД водитель признан

правила движения

виновным

не виновным

всего

 

 

 

 

Нарушил

31

26

57

 

 

 

 

Не нарушил

14

244

258

 

 

 

 

Всего

45

270

315

 

 

 

 

4.5. В таблице приведены данные о поле респондента и степени доверия респондента органам внутренних дел:

Пол

В целом

Скорее

Скорее

В целом

доверяю

доверяю

не доверяю

не доверяю

 

 

 

 

 

 

мужской

109

267

174

26

 

 

 

 

 

женский

156

195

24

11

 

 

 

 

 

Преобразуйте данную таблицу в таблицу сопряженности 2 × 2.

4.6. В таблице приведены данные о возрасте респондента и степени доверия респондента органам внутренних дел:

Возраст

В целом

Скорее

Скорее

В целом

доверяю

доверяю

не доверяю

не доверяю

 

 

 

 

 

 

18-25

109

267

174

26

 

 

 

 

 

25-40

156

195

24

11

 

 

 

 

 

40-50

135

202

132

44

 

 

 

 

 

Свыше 50

167

154

78

56

 

 

 

 

 

Преобразуйте данную таблицу в таблицу сопряженности 2 × 2.

75

4.7.Для данных задачи 4.5 вычислите коэффициент ассоциации, коэффициент контингенции. Сделайте вывод о зависимости степени доверия от пола респондента.

4.8.Для данных задачи 4.6 вычислите коэффициент ассоциации, коэффициент контингенции. Сделайте вывод о зависимости степени доверия от возраста респондента.

4.9.Для приведенных ниже данных вычислите коэффициент корреляции Спирмена:

Возраст

В целом

Скорее

Скорее

В целом

доверяю

доверяю

не доверяю

не доверяю

 

 

 

 

 

 

18–25

5

3

3

4

 

 

 

 

 

25–40

6

3

2

4

 

 

 

 

 

40–50

3

5

3

4

 

 

 

 

 

Свыше 50

7

3

2

3

 

 

 

 

 

Сделайте вывод о степени зависимости уровня доверия от возраста респондента.

4.10. В таблице приведены данные о поле, возрасте и уровне доверия респондента органам внутренних дел:

Возраст

В целом

Скорее

Скорее

В целом

доверяю

доверяю

не доверяю

не доверяю

 

 

 

 

 

 

 

 

мужской

 

 

 

 

 

 

 

18–25

69

26

74

16

 

 

 

 

 

25–40

56

15

24

11

 

 

 

 

 

40–50

35

22

32

24

 

 

 

 

 

Свыше 50

67

14

56

24

 

 

 

 

 

 

 

женский

 

 

 

 

 

 

 

18–25

45

67

74

26

 

 

 

 

 

25–40

37

95

24

11

 

 

 

 

 

40–50

77

42

32

48

 

 

 

 

 

Свыше 50

39

41

27

36

 

 

 

 

 

Какой признак (возраст или пол) оказывает большее влияние на формирование уровня доверия?

76

4.11. Заполните таблицу сопряженности двух номинальных признаков таким образом, чтобы связь между ними была максимально полной:

Значения

0

1

 

признаков

 

 

 

 

 

 

 

 

0

 

 

100

 

 

 

 

1

 

 

100

 

 

 

 

 

100

100

200

 

 

 

 

4.12. Заполните таблицу сопряженности двух номинальных признаков таким образом, чтобы связь между ними отсутствовала:

Значения признаков

0

1

 

 

 

 

 

0

 

 

100

 

 

 

 

1

 

 

100

 

 

 

 

 

100

100

200

 

 

 

 

4.13. Предложите метод исследования связи между состоянием преступности и уровнем безработицы.

4.14. Заполните значения второго порядкового признака таким образом, чтобы связь между признаками была максимальной:

Признак 1

11

10

9

8

7

6

5

4

3

2

1

 

 

 

 

 

 

 

 

 

 

 

 

Признак 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4.15. Заполните значения второго порядкового признака таким образом, чтобы связь между признаками отсутствовала:

Признак 1

11

10

9

8

7

6

5

4

3

2

1

 

 

 

 

 

 

 

 

 

 

 

 

Признак 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тема 5. Достоверность статистических данных и репрезентативность статистических выводов

5.1. Краткие теоретические сведения

Совокупность, которая представляет интерес для исследователя, называется генеральной совокупностью (если эта совокупность не слишком велика – до тысячи единиц, то может использоваться и термин полная совокупность). Вспомогательная совокупность, полученная из генеральной путем отбора по определенному правилу части единиц (по причине того, что исследование генеральной совокупности невозможно или затруднительно), называется выборочной совокупностью (или просто выборкой). Еще раз подчеркнем, что эти отобранные данные и полученные на их основе результаты (параметры и свойства) представляют интерес для исследователя лишь постольку, поскольку дают основание для суждений о параметрах и свойствах уже генеральной совокупности.

Трактовка данных как выборочных является основой подразделения статистики (как метода) на описательную и выводную статистики. Описательная (дискриптивная) статистика – та, что непосредственно относится к генеральной (полной) совокупности. Выводная статистика – та, что непосредственно относится к данным выборки, но потом, уже опосредованно (через обоснование репрезентативности) относится к генеральной совокупности.

В выводной статистике принято различать, во-первых, параметры и свойства генеральной совокупности (которые интересуют исследователя, но которых он, к своему глубокому сожалению, не знает). Во-вторых, количественные оценки этих параметров, сделанные по данным выборки. Оценки – это те же параметры, что интересуют в отношении генеральной совокупности. Сами по себе оценки, которые исследователь уже может рассчитать, не были бы ему интересны, но он ранее обосновал репрезентативность (представительность) выборки по отношению к генеральной совокупности, а потому с разумными оговорками объявляет оценку значением истинного параметра.

Во избежание путаницы параметров генеральной совокупности с их выборочными оценками в статистике принята следующая система обозначений: генеральные параметры обозначаются греческими буквами, выборочные показатели, которые рассматриваются как оценки генеральных параметров, обозначаются латинскими буквами.

78

Объем (т. е. число единиц) генеральной совокупности обозначают обычно N, объем выборочной совокупности – k.

Например:

Наименование статистического

Генеральная сово-

Выборка

показателя

купность

 

 

 

 

Средняя арифметическая

µ

X

величина

 

 

 

 

 

Относительная величина

π

Р

 

 

 

Дисперсия

σ2

S2

Коэффициент корреляции

ρ

R

 

 

 

Выборочные оценки отличаются от генеральных параметров за счет ошибки наблюдения и ошибки выборки:

Выборочная

=

Генеральный

±

Ошибка

±

Ошибка

оценка

 

параметр

 

наблюдения

 

выборки

Поводя итоги, можно утверждать, что описательная статистика является инструментом описания совокупности, по которой полностью имеются исходные данные. Метод статистического вывода позволяет по ограниченным данным выборок сделать заключение о гораздо большей совокупности, по которой не имеется исчерпывающих наблюдений.

Возможны три способа отбора единиц из генеральной совокупности (сам способ, процесс тоже именуется выборкой):

1)случайный отбор;

2)отбор единиц по определенной схеме;

3)сочетание первого и второго способов.

Все ошибки выборочного наблюдения подразделяются на ошибки выборки (случайные); ошибки, вызванные отклонением от схемы отбора (неслучайные); ошибки наблюдения (среди них есть и случайные, и неслучайные).

Репрезентативность (представительность) означает свойство выборки представлять параметры генеральной совокупности в целом в виде выборочных относительных параметров, включая и средние величины. Наличие такого свойства (доказываемого в математической статистике) служит обоснованием справедливости переноса выводов, полученных в отношении выборочной совокупности, на совокупность генеральную (с дополнительным учетом рассчитываемой и количественно контролируемой статистической ошибки,

79

детально описанной в руководствах по статистике. Но, как уже указывалось ранее, это в полной мере возможно только для случайной выборки.

Для расчета объема такой выборки должны быть в наличии следующие данные:

размер доверительной вероятности (Р);

коэффициент t, зависящий от принятой вероятности (определяется по статистической таблице «Значение интеграла вероятностей»);

величина дисперсии (σ2) в генеральной совокупности (на практике заменяется величиной выборочной дисперсии – S2);

– величина минимально допустимой ошибки р;

– объем генеральной совокупности (N).

Объем выборочной совокупности (n) определяется (по упрощенной формуле для повторной случайной выборки) следующим образом:

n = t2 S2 / р2.

Если допустимая ошибка равна 5 % (т. е. вывод исследователя будет верен не менее чем в 95 случаях из 100), то для практических нужд определять репрезентативный (представительный) объем выборки можно по следующей «5 % таблице»:

Таблица 5.1

Репрезентативный объем выборки

Вид совокуп-

 

 

Объем (количество единиц)

 

 

ности

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Генеральная

500

1000

2000

3000

4000

5000

10000

100000

совокупность

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выборочная

 

 

 

 

 

 

 

 

совокупность

222

286

333

350

360

370

385

398

(выборка)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]