
- •Задание по чистке массива
- •Чистка массива
- •Оценка качества работы интервьюера
- •2.1. Соблюдение перехода v4-v7-v8 (работа/учеба и место работы/учёбы )
- •Соблюдение соответствия заполнения анкеты по переменной v4 и блоку данных о работе
- •Проверка переменной v4 на тенденциозность (чрезмерное количество безработных по анкетам одного интервьюера)
- •2.4. Проверка тенденциозности ответов на вопросы о доходе (v73, и v86_r).
Вежновец Елизавета, 0705
Задание по чистке массива
Данный отчет посвящен отслеживанию ошибок в массиве, допущенных на этапе сбора и ввода данных, а также, возможно, на этапе визуального контроля. Он включает в себя две части: первая связана непосредственно с выявлением допущенных ошибок (логических, ввод несуществующих кодов, необоснованный пропуск значения переменной). Вторая часть отчета посвящена контролю над качеством работы интервьюера, которые подразумевает выявление слишком однообразных ответов, контроль за соблюдением интервьюером инструкции (правильность выполнения переходов), выявление анкет тех интервьюеров, в которых содержится слишком большое количество пропусков или затруднившихся ответить. Предполагается, что этот контроля позволит выявить наиболее «подозрительные анкеты», часть вопросов в которых могла быть заполнена неверно.
Чистка массива
Выявление ошибок в макете осуществлялось с помощью комбинирования нескольких процедур. Так, выявление несуществующих кодов в переменных осуществлялось с помощью процедуры Select cases и построение логических условий по типу «COMPUTE filter_$=(v21s1 > 21 & v21s1 ~= 97 & v21s1 ~= 99)». С помощью этой же процедуры массив проверялся на наличие очевидных логических ошибок, которые могли быть исправлены на этапе визуального контроля. В некоторых случаях применялась процедура Recode into Different Variable, с помощью которой сокращалась длина и упрощалось логического уравнение, с целью снижения вероятности допущения ошибки в условии (применялось в тех случаях, когда длина логического уравнения содержало больше знаков, чем это допускает программа). Кроме перечисленных процедур использовался так же визуальный контроль, с помощью которого отслеживались смещения значений в массиве, а также дополнительно проверялась правильность работы условия, указанного в меню Select Cases.
За исключением Recode into Different Variable, все указанные выше процедуры применялись ко всем переменным массива, кроме излишне продолжительных блоков (например вопросы серии 35), где, с целью повышения эффективности проверки, в большей степени проверялся визуальный контроль.
Ниже представлена таблица, в которой содержатся ошибки ввода и контроля, допущенные в данном массиве. Стоит отдельно отметить, что единичные пропуски ответов не рассматривались в данном отчете как ошибки в силу того, что отследить, чья именно это ошибка (оператора или интервьюера) не представляется возможным. В первой части отчета пропуски расценивались в качестве ошибок только в самых очевидных случаях (например, пункты 9 – 22 таблицы 1). Во второй части отчета внимание обращалось, в первую очередь, на количество пропущенных ответов на одного интервьюера.
Таблица 1. Список ошибок в массиве
№ |
НОМЕР ПЕРЕМЕННОЙ |
НОМЕР АНКЕТЫ |
СОДЕРЖАНИЕ ОШИБКИ |
ПРИМЕЧАНИЕ |
1 |
v2 и v3 |
42 |
Логическое несоответствие: при возрасте респондента 17 лет указано «высшее или неоконченное высшее образование» |
Логическая ошибка |
2 |
v2 и v3 |
62 |
Логическое несоответствие: при возрасте респондента 18 лет указано «высшее или неоконченное высшее образование» |
Логическая ошибка |
3 |
v3 |
163 |
Код "22"
|
Несуществующий код
|
4 |
v4 |
290 |
Код «0» |
Несуществующий код |
5 |
v9 |
51 |
Код «11» |
Несуществующий код |
6 |
v9 |
207 |
Код «11» |
Несуществующий код |
7 |
v10 |
123 |
Код «196» |
Несуществующий код |
8 |
v11 и v11_1 |
33 |
Значение 59 (лет Академгородку) в переменной 11 оценивается как правильное в 11_1 |
Логическая ошибка |
9 |
v11 |
41 |
Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка) |
Логическая ошибка |
10 |
v11 |
42 |
Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка) |
Логическая ошибка |
11 |
v11 |
49 |
Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка) |
Логическая ошибка |
12 |
v11 |
118 |
Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка) |
Логическая ошибка |
13 |
v11 |
119 |
Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка) |
Логическая ошибка |
14 |
v11 |
120 |
Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка) |
Логическая ошибка |
15 |
v11 |
181 |
Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка) |
Логическая ошибка |
16 |
v11 |
182 |
Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка) |
Логическая ошибка |
17 |
v11 |
183 |
Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка) |
Логическая ошибка |
18 |
v11 |
184 |
Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка) |
Логическая ошибка |
19 |
v11 |
185 |
Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка) |
Логическая ошибка |
20 |
v11 |
186 |
Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка) |
Логическая ошибка |
21 |
v11 |
244 |
Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка) |
Логическая ошибка |
22 |
v11 |
245 |
Не указано значение переменной, хотя в переменной 11_1 оценивается ответа респондента (правильно/неправильно назвал возраст Академгородка) |
Логическая ошибка |
23 |
v11_1 |
118 |
Код «52» |
Несуществующий код (ответ явно съехал с переменной v11) |
24 |
v11_1 |
181 |
Код «53» |
Несуществующий код (ответ явно съехал с переменной v11) |
25 |
v11_1 |
254 |
Код «1» |
Несуществующий код |
26 |
v11 и v11_1 |
63 |
Значение 56 (лет Академгородку) в переменной 11 оценивается как верное в 11_1 |
Логическая ошибка |
27 |
v11 и v11_1 |
216 |
Значение 60 (лет Академгородку) в переменной 11 оценивается как верное в 11_1 |
Логическая ошибка |
28 |
v11 и v11_1 |
246 |
Значение 60 (лет Академгородку) в переменной 11 оценивается как верное в 11_1 |
Логическая ошибка |
29 |
v12_2 – v12_8 |
190 |
Дублируются значения переменных |
Логическая ошибка, значения, вероятно, дублируют v13 |
30 |
v 13_6 |
198 |
Код «55» |
Несуществующий код |
31 |
v 13_8 |
138 |
Код«55» |
Несуществующий код |
32 |
v 13_8 |
163 |
Код «45» |
Несуществующий код |
33 |
v 13_8 |
168 |
Код «55» |
Несуществующий код |
34 |
v 13_12 |
204 |
Код «55» |
Несуществующий код |
35 |
v16_6 |
202 |
Код «116» |
Несуществующий код |
36 |
V19_4 |
204 |
Код «33» |
Несуществующий код |
37 |
v19_11 |
140 |
Код «11» |
Несуществующий код |
38 |
v22 |
27 |
Код «3» |
Несуществующий код |
39 |
V26_2 |
254 |
Код «7» |
Несуществующий код |
40 |
V26_3 |
254 |
Код «6» |
Несуществующий код |
41 |
V26_5 |
16 |
Код «12» |
Несуществующий код |
42 |
V26_9 |
287 |
Код «15» |
Несуществующий код |
43 |
V26_12 |
81 |
Код «32» |
Несуществующий код |
44 |
V26_12 |
141 |
Код «32» |
Несуществующий код |
45 |
V26_12 |
216 |
Код «32» |
Несуществующий код |
46 |
V29_3 |
102 |
Код «11» |
Несуществующий код |
47 |
V29_6 |
201 |
Код «22» |
Несуществующий код |
48 |
V29_6 |
248 |
Код «11» |
Несуществующий код |
49 |
V30_1 |
138 |
Код «22» |
Несуществующий код |
50 |
V33 |
52 |
Указан только код 1, в то время как в переменной 35 заполнено 8 столбцов |
Логическая ошибка |
51 |
V35_3 |
93 |
Указано, в то время как в вопросе 33 не указан код «3» |
Логическая ошибка |
52 |
V35_3 |
131 |
Значение указано, хотя в вопросе 33 не указано значение 3 |
Логическая ошибка |
53 |
V35_6 |
22 |
Значение переменной указано, хотя в переменной 33 значение «6» не указано |
Логическая ошибка |
54 |
V35_9 |
49 |
Указано, хотя в вопросе 33 не указан код «9» |
Логическая ошибка |
55 |
V35_1 – v35_9 |
1 |
Указаны значения всех 9 переменных, в то время как в вопросе 33 указаны только значения 1, 2, 7, 8 |
Логическая ошибка |
56 |
V35_1 – v35_9 |
5 |
Указаны значения всех 9 переменных, в то время как 33 указаны только значения 1 и 2 |
Логическая ошибка |
57 |
V35_1 – v35_9 |
6 |
Указаны значения всех 9 переменных, в то время как в вопросе 33 указаны только значение 4, 8, 9 |
Логическая ошибка |
58 |
V35_1 – v35_9 |
50 |
Указаны значения всех 9 переменных, в то время как в вопросе 33 не указаны значения 4, 5, 6, 9 |
Логическая ошибка |
59 |
V35_1 – v35_9 |
84 |
Указаны значения всех 9 переменных, в то время как в вопросе 33 указаны только значения 1, 4, 8 |
Логическая ошибка |
60 |
V35_4 – v35_9 |
41 |
Указаны значения переменных, в то время как в вопросе 33 не указаны значения 4-9 |
Логическая ошибка |
61 |
V44_1 |
154 |
Код «11» |
Несуществующий код |
62 |
V44_3 |
201 |
Код «99» |
Несуществующий код |
63 |
V45_4 |
300 |
Код «22» |
Несуществующий код |
64 |
V45_5 |
235 |
Код «99» |
Несуществующий код |
65 |
V_46 |
48 |
Код«33» |
Несуществующий код |
66 |
V56 |
256 |
В переменной указано значение «1», но не выполнено условие перехода – указано значение для переменной 57 |
Логическая ошибка |
67 |
v56 – v57s1 |
161 |
В переменной v56 указан код «5» (купили родственники, родители), но в следующем вопросе указан код 96 (никакую, купил за счет собственных средств) |
Логическая ошибка |
68 |
V57s1 |
186 |
Дублируются значения «96» для v57s1 и v57s2 |
Логическая ошибка |
69 |
v56 – v57s1 |
243 |
В переменной v56 указан код «5» (купили родственники, родители), но в следующем вопросе указан код 96 (никакую, купил за счет собственных средств) |
Логическая ошибка |
70 |
V69s21 |
200 |
Код «5» |
Несуществующий код |
71 |
V69s2 |
201 |
Код «6» |
Несуществующий код |
72 |
V69s2 |
203 |
Код «7» |
Несуществующий код |
73 |
V69s2 |
206 |
Код «5» |
Несуществующий код |
74 |
V69s2 |
299 |
Код «10» |
Несуществующий код |
75 |
V74 |
261 |
Код«98» |
Несуществующий код |
76 |
V76 |
209 |
Код«6» |
Несуществующий код |
77 |
v79as1
|
129
|
Смещение |
– |
78 |
v79cs1
|
89
|
Код «44» |
Несуществующий код |
79 |
v83 |
48 |
Код «99» |
Несуществующий код |
80 |
V91_r |
136 |
Код«11» |
Несуществующий код |
81 |
V91_r_5 |
168 |
Код«99» |
Несуществующий код |
82 |
v113 |
60 |
Код«99» |
Несуществующий код |
83 |
v114_2
|
203 |
Код «44» |
Несуществующий код |
84 |
v117_2s_1
|
240 |
Код «44» |
Несуществующий код |
85 |
V127 |
248 |
Код «22» |
Несуществующий код |
86 |
134s1
|
163
|
Код «66» |
Несуществующий код |
87 |
134s2
|
197
|
Код «11» |
Несуществующий код |
88 |
V142 |
136 |
Значение «11» |
Несуществующий код |
89 |
V142 |
137 |
Код «33» |
Несуществующий код |
90 |
V147_4 |
248 |
Код «33» |
Несуществующий код |
91 |
V147_6 |
299 |
Код «33» |
Несуществующий код |
92 |
153_1
|
93
|
Код «22» |
Несуществующий код |
93 |
155_2
|
49
|
Код «22» |
Несуществующий код |
94 |
155_3
|
208
|
Код «22» |
Несуществующий код |
95 |
194s1
|
42
|
Код «8» |
Несуществующий код |
96 |
194_s31
|
77
|
Код «24» |
Несуществующий код |
Из представленной таблицы видно, что в массиве обнаружено три основных вида ошибок: несуществующие коды, логические ошибки и смещения значений (в меньшей степени). Первый тип ошибок связан, в основном с опечатками, большинство из которых легко исправить. Указанные логические ошибки (которые также в большинстве своем поддаются исправлению при повторной проверке анкет) связаны с невнимательностью на этапе контроля, а смещения – с невнимательностью на этапе ввода. Стоит отметить, что наибольшее количество смещений встречалось в табличных вопросах, которые требуют наибольшего автоматизма заполнения.
В целом можно заключить, что большинство ошибок поддаются исправлению и допущены, в основном, по невнимательности.