Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Vezhnovets_Chistka_massiva.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
203.37 Кб
Скачать

Вежновец Елизавета, 0705

Задание по чистке массива

Данный отчет посвящен отслеживанию ошибок в массиве, допущенных на этапе сбора и ввода данных, а также, возможно, на этапе визуального контроля. Он включает в себя две части: первая связана непосредственно с выявлением допущенных ошибок (логических, ввод несуществующих кодов, необоснованный пропуск значения переменной). Вторая часть отчета посвящена контролю над качеством работы интервьюера, которые подразумевает выявление слишком однообразных ответов, контроль за соблюдением интервьюером инструкции (правильность выполнения переходов), выявление анкет тех интервьюеров, в которых содержится слишком большое количество пропусков или затруднившихся ответить. Предполагается, что этот контроля позволит выявить наиболее «подозрительные анкеты», часть вопросов в которых могла быть заполнена неверно.

  1. Чистка массива

Выявление ошибок в макете осуществлялось с помощью комбинирования нескольких процедур. Так, выявление несуществующих кодов в переменных осуществлялось с помощью процедуры Select cases и построение логических условий по типу «COMPUTE filter_$=(v21s1 > 21 & v21s1 ~= 97 & v21s1 ~= 99)». С помощью этой же процедуры массив проверялся на наличие очевидных логических ошибок, которые могли быть исправлены на этапе визуального контроля. В некоторых случаях применялась процедура Recode into Different Variable, с помощью которой сокращалась длина и упрощалось логического уравнение, с целью снижения вероятности допущения ошибки в условии (применялось в тех случаях, когда длина логического уравнения содержало больше знаков, чем это допускает программа). Кроме перечисленных процедур использовался так же визуальный контроль, с помощью которого отслеживались смещения значений в массиве, а также дополнительно проверялась правильность работы условия, указанного в меню Select Cases.

За исключением Recode into Different Variable, все указанные выше процедуры применялись ко всем переменным массива, кроме излишне продолжительных блоков (например вопросы серии 35), где, с целью повышения эффективности проверки, в большей степени проверялся визуальный контроль.

Ниже представлена таблица, в которой содержатся ошибки ввода и контроля, допущенные в данном массиве. Стоит отдельно отметить, что единичные пропуски ответов не рассматривались в данном отчете как ошибки в силу того, что отследить, чья именно это ошибка (оператора или интервьюера) не представляется возможным. В первой части отчета пропуски расценивались в качестве ошибок только в самых очевидных случаях (например, пункты 9 – 22 таблицы 1). Во второй части отчета внимание обращалось, в первую очередь, на количество пропущенных ответов на одного интервьюера.

Таблица 1. Список ошибок в массиве

НОМЕР ПЕРЕМЕННОЙ

НОМЕР АНКЕТЫ

СОДЕРЖАНИЕ ОШИБКИ

ПРИМЕЧАНИЕ

1

v2 и v3

42

Логическое несоответствие: при возрасте респондента 17 лет указано «высшее или неоконченное высшее образование»

Логическая ошибка

2

v2 и v3

62

Логическое несоответствие: при возрасте респондента 18 лет указано «высшее или неоконченное высшее образование»

Логическая ошибка

3

v3

163

Код "22"

Несуществующий код

4

v4

290

Код «0»

Несуществующий код

5

v9

51

Код «11»

Несуществующий код

6

v9

207

Код «11»

Несуществующий код

7

v10

123

Код «196»

Несуществующий код

8

v11 и v11_1

33

Значение 59 (лет Академгородку) в переменной 11 оценивается как правильное в 11_1

Логическая ошибка

9

v11

41

Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка)

Логическая ошибка

10

v11

42

Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка)

Логическая ошибка

11

v11

49

Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка)

Логическая ошибка

12

v11

118

Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка)

Логическая ошибка

13

v11

119

Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка)

Логическая ошибка

14

v11

120

Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка)

Логическая ошибка

15

v11

181

Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка)

Логическая ошибка

16

v11

182

Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка)

Логическая ошибка

17

v11

183

Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка)

Логическая ошибка

18

v11

184

Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка)

Логическая ошибка

19

v11

185

Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка)

Логическая ошибка

20

v11

186

Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка)

Логическая ошибка

21

v11

244

Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка)

Логическая ошибка

22

v11

245

Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка)

Логическая ошибка

23

v11_1

118

Код «52»

Несуществующий код (ответ явно съехал с переменной v11)

24

v11_1

181

Код «53»

Несуществующий код (ответ явно съехал с переменной v11)

25

v11_1

254

Код «1»

Несуществующий код

26

v11 и v11_1

63

Значение 56 (лет Академгородку) в переменной 11 оценивается как верное в 11_1

Логическая ошибка

27

v11 и v11_1

216

Значение 60 (лет Академгородку) в переменной 11 оценивается как верное в 11_1

Логическая ошибка

28

v11 и v11_1

246

Значение 60 (лет Академгородку) в переменной 11 оценивается как верное в 11_1

Логическая ошибка

29

v12_2 – v12_8

190

Дублируются значения переменных

Логическая ошибка, значения, вероятно, дублируют v13

30

v 13_6

198

Код «55»

Несуществующий код

31

v 13_8

138

Код«55»

Несуществующий код

32

v 13_8

163

Код «45»

Несуществующий код

33

v 13_8

168

Код «55»

Несуществующий код

34

v 13_12

204

Код «55»

Несуществующий код

35

v16_6

202

Код «116»

Несуществующий код

36

V19_4

204

Код «33»

Несуществующий код

37

v19_11

140

Код «11»

Несуществующий код

38

v22

27

Код «3»

Несуществующий код

39

V26_2

254

Код «7»

Несуществующий код

40

V26_3

254

Код «6»

Несуществующий код

41

V26_5

16

Код «12»

Несуществующий код

42

V26_9

287

Код «15»

Несуществующий код

43

V26_12

81

Код «32»

Несуществующий код

44

V26_12

141

Код «32»

Несуществующий код

45

V26_12

216

Код «32»

Несуществующий код

46

V29_3

102

Код «11»

Несуществующий код

47

V29_6

201

Код «22»

Несуществующий код

48

V29_6

248

Код «11»

Несуществующий код

49

V30_1

138

Код «22»

Несуществующий код

50

V33

52

Указан только код 1, в то время как в переменной 35 заполнено 8 столбцов

Логическая ошибка

51

V35_3

93

Указано, в то время как в вопросе 33 не указан код «3»

Логическая ошибка

52

V35_3

131

Значение указано, хотя в вопросе 33 не указано значение 3

Логическая ошибка

53

V35_6

22

Значение переменной указано, хотя в переменной 33 значение «6» не указано

Логическая ошибка

54

V35_9

49

Указано, хотя в вопросе 33 не указан код «9»

Логическая ошибка

55

V35_1 – v35_9

1

Указаны значения всех 9 переменных, в то время как в вопросе 33 указаны только значения 1, 2, 7, 8

Логическая ошибка

56

V35_1 – v35_9

5

Указаны значения всех 9 переменных, в то время как 33 указаны только значения 1 и 2

Логическая ошибка

57

V35_1 – v35_9

6

Указаны значения всех 9 переменных, в то время как в вопросе 33 указаны только значение 4, 8, 9

Логическая ошибка

58

V35_1 – v35_9

50

Указаны значения всех 9 переменных, в то время как в вопросе 33 не указаны значения 4, 5, 6, 9

Логическая ошибка

59

V35_1 – v35_9

84

Указаны значения всех 9 переменных, в то время как в вопросе 33 указаны только значения 1, 4, 8

Логическая ошибка

60

V35_4 – v35_9

41

Указаны значения переменных, в то время как в вопросе 33 не указаны значения 4-9

Логическая ошибка

61

V44_1

154

Код «11»

Несуществующий код

62

V44_3

201

Код «99»

Несуществующий код

63

V45_4

300

Код «22»

Несуществующий код

64

V45_5

235

Код «99»

Несуществующий код

65

V_46

48

Код«33»

Несуществующий код

66

V56

256

В переменной указано значение «1», но не выполнено условие перехода – указано значение для переменной 57

Логическая ошибка

67

v56 ­– v57s1

161

В переменной v56 указан код «5» (купили родственники, родители), но в следующем вопросе указан код 96 (никакую, купил за счет собственных средств)

Логическая ошибка

68

V57s1

186

Дублируются значения «96» для v57s1 и v57s2

Логическая ошибка

69

v56 ­– v57s1

243

В переменной v56 указан код «5» (купили родственники, родители), но в следующем вопросе указан код 96 (никакую, купил за счет собственных средств)

Логическая ошибка

70

V69s21

200

Код «5»

Несуществующий код

71

V69s2

201

Код «6»

Несуществующий код

72

V69s2

203

Код «7»

Несуществующий код

73

V69s2

206

Код «5»

Несуществующий код

74

V69s2

299

Код «10»

Несуществующий код

75

V74

261

Код«98»

Несуществующий код

76

V76

209

Код«6»

Несуществующий код

77

v79as1

129

Смещение

78

v79cs1

89

Код «44»

Несуществующий код

79

v83

48

Код «99»

Несуществующий код

80

V91_r

136

Код«11»

Несуществующий код

81

V91_r_5

168

Код«99»

Несуществующий код

82

v113

60

Код«99»

Несуществующий код

83

v114_2

203

Код «44»

Несуществующий код

84

v117_2s_1

240

Код «44»

Несуществующий код

85

V127

248

Код «22»

Несуществующий код

86

134s1

163

Код «66»

Несуществующий код

87

134s2

197

Код «11»

Несуществующий код

88

V142

136

Значение «11»

Несуществующий код

89

V142

137

Код «33»

Несуществующий код

90

V147_4

248

Код «33»

Несуществующий код

91

V147_6

299

Код «33»

Несуществующий код

92

153_1

93

Код «22»

Несуществующий код

93

155_2

49

Код «22»

Несуществующий код

94

155_3

208

Код «22»

Несуществующий код

95

194s1

42

Код «8»

Несуществующий код

96

194_s31

77

Код «24»

Несуществующий код

Из представленной таблицы видно, что в массиве обнаружено три основных вида ошибок: несуществующие коды, логические ошибки и смещения значений (в меньшей степени). Первый тип ошибок связан, в основном с опечатками, большинство из которых легко исправить. Указанные логические ошибки (которые также в большинстве своем поддаются исправлению при повторной проверке анкет) связаны с невнимательностью на этапе контроля, а смещения – с невнимательностью на этапе ввода. Стоит отметить, что наибольшее количество смещений встречалось в табличных вопросах, которые требуют наибольшего автоматизма заполнения.

В целом можно заключить, что большинство ошибок поддаются исправлению и допущены, в основном, по невнимательности.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]