Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
088111_MI_Kornienko_(k_razmescheniyu).doc
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
991.74 Кб
Скачать

Тема 15 Вариационный ряд, таблицы сопряженности признаков и проверка гипотез

После изучения материала этой темы вы должны уметь...

1. Описывать значимость предварительного анализа данных, понимать, что можно получить из такого анализа.

2. Обсуждать анализ данных, опирающийся на распределение частот значений переменной, включающий анализ центра распределения, изменчивости и формы кривой.

3. Объяснять анализ данных, связанный с кросс-табуляцией и имеющими к нему отношение статистиками: хи-квадратом, фи-коэффициентом, коэффициентом сопряженности, V-коэффициентом Крамера и коэффициентом "лямбда".

4. Описывать анализ данных, связанный с параметрической проверкой гипотез для одной выборки, двух независимых выборок и парных выборок.

5. Объяснять анализ данных, связанный с непараметрической проверкой гипотез для одной выборки, двух независимых выборок и парных выборок.

Краткий обзор

Эта Тема посвящена базовому анализу данных, включающему изучение распределения час­тот значений переменной (вариационных рядов), кросс-табуляцию (построение таблиц сопря­женности) и проверку гипотез. Сначала мы рассмотрим распределение частот и объясним, как с его помощью определить количество выбросов, пропущенных и экстремальных значений данных, а также выявим центральную тенденцию в значениях изучаемых данных, их вариа­цию и форму кривой распределения. Затем введем понятие проверки гипотез и опишем общую процедуру проверки. Процедуры проверки гипотез делятся на проверку связей и проверку раз­личий. Мы также рассмотрим использование кросс-табуляции для установления связи между двумя или тремя переменными. Хотя природу связи можно увидеть из таблиц, статистики по­зволяют определить значимость и силу связи. И наконец, мы познакомим вас с методами статистической проверки гипотез, связанных с различиями в одной или двух выборках.

Многие маркетинговые исследовательские проекты не выходят за рамки базового анализа данных. Полученные по итогам исследования результаты часто отображают с помощью таблиц и графиков, как будет показано в теме 22.

Резюме

Базовый анализ данных позволяет глубже проникнуть в суть явления и является основой как для выполнения последующего анализа, так и для интерпретации данных. Для каждой переменной не­обходимо получить распределение частот признаков (вариационный ряд). Результаты анализа отражены в таблицах частот, частостей и накопленных частот для всех значений переменной. Они по­казывают наличие выбросов, пропущенных или экстремальных значений. Показатели центра рас­пределения— среднее арифметическое, медиана и мода. Вариация распределения признаков описывается размахом, дисперсией, стандартным отклонением, коэффициентом вариации и межквартильным размахом. Форму кривой распределения определяют асимметрия и эксцесс.

Кросс-табуляция представляет собой процедуру создания таблиц сопряженности призна­ков, которые отражают совместное распределение значений двух или больше переменных. В кросс-табуляции проценты вычисляем по колонкам (к итоговой колонке) или по рядам (к итоговому ряду). Общее правило — вычисление процентов в направлении независимой пе­ременной через зависимую переменную.

Часто, чтобы лучше уяснить суть связи переменных, вводят третью переменную. Статистика хи-квадрат позволяет проверить статистическую значимость наблюдаемой связи в таблице со­пряженности. С помощью фи-коэффициента, коэффициента сопряженности, V-коэффициент Крамера и коэффициента "лямбда" определяют силу связи между переменными.

Для проверки гипотез о различиях используют параметрические и непараметрические ме­тоды. Из параметрических методов для проверки гипотезы относительно среднего совокупно­сти используют t-критерий. Его различные типы подходят для проверки гипотезы, в основе ко­торой лежит одна выборка, две независимые выборки или парные выборки. Из непараметри­ческих методов популярны одновыборочные критерии, включающие критерий согласия Колмогорова—Смирнова, критерий хи-квадрат, критерий серий и биномиальный критерий. Для двух независимых непараметрических выборок можно использовать U-критерий Манна— Уитни, медианный критерий и критерий Колмогорова—Смирнова. В случае парных выборок для проверки гипотезы о показателе центра распределения полезны критерий попарных срав­нений Уилкоксона и критерий знаков.