Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
госы 2013.docx
Скачиваний:
0
Добавлен:
13.01.2020
Размер:
4.38 Mб
Скачать

Ошибки выборки

А) Статистическая погрешность - колебания выборочных оценок, вызванные обследованием не всей совокупности, а ее части. Уменьшается с увеличением размера выборки.

Б) Смещения, вызванные неправильным применением выборочной техники: игнорированием неравной вероятности отбора респондентов, использованием приближенных или смещенных оценок.

Ошибки наблюдений (измерений)

Смещения, вызванные некорректным инструментарием (вопросник, инструкции интервьюеру и т.п.), ошибками интервьюеров, ошибками при вводе и обработке данных.

Ошибки отсутствия наблюдений

А) Невключение в совокупность

Отдельные домохозяйства или группы домохозяйств, а иногда и целые территории, не попадают в выборочный фрейм.

Б) Отсутствие ответов

Отсутствие ответов из-за недостижимости респондентов или их отказов от участия в исследовании. Отсутствие ответов на отдельные вопросы (пропущенные данные).

Способы уменьшения ошибок:

  • повышение уровня достижимости (выбор времени проведения интервью, повторные посещения, предварительная договоренность об интервью, мотивация респондентов для участия в исследовании, исключение сложных и нежелательных вопросов);

  • специальные исследования недостижимых респондентов для внесения поправок в выборочные оценки;

  • взвешивание, приписывание ответов.

  1. Анализ данных. Состав работ на этапе анализа данных. Кодирование открытых и закрытых вопросов.

Анализ данных начинается с перевода «сырых» данных в осмысленную информацию и включает их введение в компьютер, проверку на предмет ошибок, кодирование, представление в матричной форме (табулирование). Все это называется преобразованием исходных данных.

Далее проводится статистический анализ. Выделяют пять основных видов статистического анализа, используемых при проведении маркетинговых исследований: 1. Дескриптивный анализ, в основе которого лежит использование таких статистических мер, как средняя величина, мода, среднее квадратическое отклонение, размах или амплитуда вариации. 2. Выводной анализ, заключающийся в использовании статистических процедур (например, проверка гипотез) с целью обобщения полученных результатов на всю исследуемую совокупность. 3. Анализ различий, используемый для сравнения результатов исследования нескольких групп (объектов) для определения степени реального отличия в их поведении, реакции на одни и те же воздействия и т.п. 4. Анализ связей, направленный на определение систематических связей переменных, их направленности, силы и т.п. 5. Предсказательный анализ, используемый в целях прогнозирования развития событий в будущем, например путем анализа временных рядов.

Кодирование — это «технический прием, с помощью которого данные распределяются по категориям. Посредством кодирования сырые данные превращаются в символы — обычно цифровые, которые можно табулировать и подсчитывать. Однако это преобразование не должно осуществляться автоматически; оно требует здравого суждения кодировщика». Первый этап кодирования заключается в специфицировании категорий или классов, к которым будут относиться ответы. Кодирование закрытых вопросов и большинства средств балльной оценки не представляет трудностей, потому что оно устанавливается при конструировании носителя собираемых данных. Кодирование открытых вопросов может оказаться весьма затруднительным и зачастую много более дорогим, чем кодирование закрытых вопросов. Кодировщику приходится определять подходящие категории на базе ответов, которые не всегда предсказуемы. Если анкет так много, что необходимо использовать нескольких кодировщиков, дополнительной проблемой может стать возникновение несоответствия в самом кодировании. Чтобы удостовериться в логической последовательности обработки данных, эту работу необходимо разделять по задачам, а не в равных долях делить анкеты между кодировщиками. Второй этап кодирования касается назначения кодовых номеров классов. Например, мужской пол может обозначаться буквой М, а женский — буквой F. Как альтернативный вариант, эти классы могут обозначаться 1 — мужчина и 2 — женщина. Вообще говоря, для обозначения классов лучше использовать цифры, а не буквы. На этой стадии также лучше использовать цифры в том виде, как они зафиксировались в форме сбора данных, а не раскладывать их на более мелкие категории. Когда для анализа данных предполагается использовать компьютер, кодирование необходимо выполнять таким образом, чтобы данные оказывались готовыми для ввода в машину. Кроме того, рекомендуется следовать установившимся традициям кодирования данных: 1. Располагать только один символ в каждой колонке. 2. Использовать только числовые коды, а не буквы алфавита или специальные символы вроде @ или пробел, 3. Использовать ровно столько колонок поля, назначаемого для переменной, сколько необходимо для полного охвата всех ее возможных значений. 4. Использовать стандартные коды для «отсутствия информации». Так, все ответы «не знаю» должны кодироваться цифрой 8, «нет ответов» — цифрой 9, а «не применялось» обозначаться как 0. 5. Кодировать в каждой записи идентификационный номер респондента. Как правило, нет и не будет необходимости идентифицировать в этом номере имя респондента. Этот код просто связывает анкету с кодируемыми данными. Завершающий этап процесса кодирования состоит в подготовке книги кодов, которая содержит общие инструкции, указывающие, каким образом была закодирована каждая позиция данных. В ней перечисляются коды каждой переменной и категории, включенные в каждый код. Далее в ней указывается, где в компьютерной записи располагается переменная и каким образом эта переменная читается — например, с десятичной точкой или как целое число.