Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
3_Подготовка данных.doc
Скачиваний:
24
Добавлен:
01.02.2015
Размер:
2.69 Mб
Скачать
  1. Подготовка данных к анализу

3.1 Этапы подготовки данных к анализу

Определив проблему cтатистического исследования и разработав наиболее подходящий подход к ее решению, нужно составить соответствующий план проведения исследования. Затем следует этап сбора даннях. Собранные данные нужно Качество статистических результатов напрямую зависит от того, насколько тщательно и аккуратно данные готовились к анализу. Недостаточное внимание к этой деятельности может серьезно исказить статистические выводы, что, в свою очередь, ведет к неправильной интерпретации результатов всего исследования.

Наглядное отображение процесса подготовки данных к анализу представлено на рис. 3.1.

Рис.3.1 Подготовка данных к анализу

Процесс подготовки данных начинается с проверки полноты заполнения анкет. Затем необходимо отредактировать данные и определиться с нечитабельными, неполными, непоследовательными, неоднозначными и прочими ответами неудовлетворительного качества. После этого осуществляются процедуры кодирования и "очистки" данных. Иногда нужно провести статистическую корректировку информации для того, чтобы сделать ее репрезентативной для генеральной совокупности и пригодной для дальнейшего анализа, провести работу спропущенными данными и грубыми выбросами. Если это предусмотрено в плане анализа, производится преобразование переменных (перекодирование, перешкалирование, стандартизация, пр.) и вычисление новых (производных) переменных.

3.2 Проверка анкет

Если в ходе статистического исследования проводится анкетирование, то необходимо осуществить проверку анкет на полноту заполнения и качество интервьюирования.

Необходимо обратить внимание на следующие особенности, которые могут свидетельствовать о низком качестве результатов анкетирования:

  • представленные ответы свидетельствует о том, что респондент не понял вопросов либо не точно следовал инструкциям по заполнению анкеты. Например, не был соблюден шаблон пропусков ответов.

  • ответы варьируются очень незначительно или не варьируются вовсе, например, респондент пометил одни четверки в серии семибалльных рейтинговых шкал.

  • возвращенная анкета является неполной — отсутствует одна или несколько страниц.

  • анкета получена по истечении заранее определенного срока сдачи.

  • ответы в анкете даны респондентом, не входящим в группу, выделенную для участия в исследовании.

Если были определены конкретные квоты респондентов либо назначены размеры групп респондентов, все принятые анкеты необходимо соответствующим образом классифицировать и подсчитать. Любые проблемы, связанные с выполнением требований, предъявляемых к выборкам, должны выявляться своевременно, и необходимые корректировочные мероприятия, например, дополнительные интервью в группах, представленных по результатам опроса недостаточно полно, следует провести перед тем, как приступать к редактированию данных.

3.3 Редактирование данных

Процесс редактирования (editing) заключается в обработке собранных анкет для повышения точности и аккуратности представленных в них данных. Он заключается в просмотре анкет, в ходе которого выявляются нечитабельные, неполные, логически непоследовательные или неоднозначные ответы.

Если ответы неаккуратно и небрежно записаны, они могут быть неразборчивыми. Такая ситуация более типична для анкет, содержащих много неструктурированных вопросов. Чтобы правильно закодировать данные, они должны быть читабельными. Кроме того, анкеты могут быть не до конца заполнены, содержать несколько или множество вопросов без ответов.

На этапе редактирования исследователь проводит предварительную проверку анкет на предмет логической непоследовательности представленных в них ответов. Существует ряд явных несоответствий, выявить которые не составляет большого труда. Так, возможна ситуация, когда респондент сообщает, что он имеет высшее образование, но при этом указывает, что он родился в 2010 году.

Ответы на неструктурированные вопросы могут быть неоднозначными, в результате их сложно точно интерпретировать. Бывает, что ответ респондента записан сокращенно либо при его записи использованы слова, имеющие несколько смысловых значений. Даже если вопросы структурированы, нередки ситуации, когда респондент помечает больше одного варианта ответа на вопрос, по которому необходимо дать однозначный ответ. Предположим, респондент помечает пункты 2 и 3 по пятизначной рейтинговой шкале. Как следует расценивать такой ответ: имеется в виду значение 2,5? В таком случае дело осложняется еще тем, что в процедуре кодирования такой переменной используются только целые числа.

При получении анкет, содержащих ответы неудовлетворительного качества, возможны следующие действия:

  • анкеты отправляют обратно на места сбора данных для уточнения;

  • назначаются пропущенные значения;

  • анкеты отбраковываются и не включаются в анализ.

Если анкеты, содержащие неудовлетворительные результаты опроса, возвращаются на места сбора данных, то интервьюеров обязуют провести повторное интервью. Такой вариант обычно применяется при проведении промышленных маркетинговых исследований, для которых характерны выборки небольших размеров, при этом идентифицировать респондентов, предоставивших ответы низкого качества, не составляет большого труда. Однако данные, полученные в результате повторного опроса, могут сильно отличаться от первоначальных. Эта разница обуславливается, например, тем, что между опросами прошло определенное время, а также тем, что опросы проводились с использованием разных режимов (например, первый раз по телефону, а второй — в ходе личного контакта).

Если возвращение анкеты на место сбора данных признано экономически нецелесообразным, редактор может самостоятельно присвоить неудовлетворительным откликам пропущенные значения. Рекомендуется применять этот метод в следующих случаях: если количество респондентов, ответы которых признаны неудовлетворительными, невелико; доля ответов неудовлетворительного качества в ответах каждого респондента незначительна; переменные по неудовлетворительным ответам не основные.

Отсеивание анкет респондентов, содержащих ответы неудовлетворительного качества, при котором респонденты, предоставившие ответы неудовлетворительного качества, просто отбраковываются и их анкеты не включаются в анализ, эффективно в следующих случаях: если доля "неудовлетворительных" респондентов невелика (меньше 10%); если размер выборки велик; если "неудовлетворительные" респонденты явно не отличаются от "удовлетворительных" (например, по демографическому признаку или основным характеристикам использования товара); если доля неудовлетворительных откликов на каждого респондента велика; если пропущены ответы по основным переменным. Однако бывают ситуации, когда "неудовлетворительные" респонденты отличаются от "удовлетворительных" либо решение признать респондента "неудовлетворительным" предельно субъективно. В этих случаях использование данного метода повлечет за собой искажение данных. Если исследователь принимает решение отбраковать неудовлетворительные ответы того или иного респондента, он должен отчитаться, на основе какой именно процедуры он идентифицировал данного респондента.