Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информатика / Информатика шпоры к экзамену. II семестр.doc
Скачиваний:
29
Добавлен:
16.12.2013
Размер:
364.54 Кб
Скачать

49.Анализ множеств.Ответов.

Если на некоторый вопрос может быть некоторое число возможных ответов (многоальтернативные вопросы), то возможно два варианта преобразования:

  • дихотомизация (multiple dichotomy) - создается n дихотомических переменных по числу вариантов ответа, недостаток – большая перегруженность переменными;

  • (multiple response) – создается несколько переменных по числу максимально возможного числа ответов, значения переменных – номера соответствующих ответов, данных респондентами.

50.Отбор данных

Генеральная совокупность – N, выборочная совокупность – n. Часть единиц генеральной совокупности, подлежащая непосредственному наблюдению, называется выборочной совокупностью. Система правил отбора единиц и способов характеристики изучаемой совокупности исследуемых единиц составляет содержание выборочного метода.

Выбор (Select)

Отбор части массива данных.

Методы отбора:

  • по логическому условию (IF);

  • последовательно сколько-то анкет; нужно, если создавали анкеты по принципу 1-100 – такие-то, 101-200 – другие и т.д. (RANGE);

  • случайным образом какой-то процент анкет

    • проверка результатов на устойчивость;

    • если большой массив: откатать его на формирование синтакс-файла для небольшого числа анкет, а потом для всех по синтакс-файлу.

  • Простая случайная выборка. Ее часто нельзя построить (все элементы генеральной совокупности имеют равную вероятность попасть в выборку) в принципе. При простой случайной выборке отбор производится из всей массы единиц генерал ной совокупности без предварительного расчленения ее на какие-либо группы, и единица отбора совпадает с единицей наблюдения. В зависимости от способа отбора единиц различают:

    • повторную выборку – отбор по схеме возвращенного шара

    • бесповторную выборку - отбор по схеме невозвращенного шара

  • Многоступенчатые выборки. Отражают реальный факт неравномерности распределения населения.

  • Стратифицированные выборки. Дисперсия изучаемого показателя разная в разных фрагментах генеральной совокупности. Любой элемент генеральной совокупности имеет вероятность попасть в выборку обратную дисперсии. Плюс – сильно выигрываем по объему выборки. Минус – как узнать дисперсию. Путь: берем показатели, которые по нашему предположению влияют на исходный показатель, группируем по этим показателям. Россия – 4-6 ступеней.

  • Маршрутная выборка.

    • начальные точки маршрута

      • рекомендуется выбирать так, чтобы на каждом маршруте опрашивалось приблизительно 30 человек;

      • на первой улице – первый перекресток по возрастанию номеров домов ...

      • использовать: улицы Москвы с общественным транспортом, но тоже плохо, потому что интенсивность движения транспорта все равно различна;

    • составление маршрута

      • рекомендуется: первый – по возрастанию номеров домов, второй – по убыванию...; первый по четной стороне...; выбирает каждый n-ый дом (выстраиваем дома по порядку);

      • в отобранном доме – m-ый подъезд по общему списку подъездов;

      • этажи;

      • квартира на этаже;

      • респондент в квартире:

        • схема Киша – список, доля, устойчива к разным типам семей;

        • датчик случайных чисел;

        • ближайший день рождения.

Приватность, а не анонимность.

Организационные проблемы, приближение к случайности.

Расхождение между характеристиками выборочной совокупности и искомыми характеристиками (параметрами) генеральной совокупности называется ошибкой.