Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

статистика_лекция_3 (1)

.pdf
Скачиваний:
9
Добавлен:
15.04.2015
Размер:
3.01 Mб
Скачать

Алгоритм проведения анализа сопряженных признаков

0.Формулировка целей и задач исследования

1.Построение таблицы наблюдаемых частот

2.Построение таблицы ожидаемых частот

3.Построение таблицы разности частот

4.Проверка статистической гипотезы о значимости разности частот

5.Формулировка вывода о наличии связи между признаками

1. Построение таблицы наблюдаемых частот

Пусть имеется два качественных признака: А (пол) и В (курение). Признак А имеет а уровней градаций (значений) /2: муж, жен/, а признак В в уровней /3: курит, бросил, не курил/. Общее количество наблюдений составляет n.

Каждый объект выборки обладает двумя признаками: и А, и В, причем эти признаки могут принимать любые из допустимых значений. (одна единица наблюдения: пол = мужчина, курение = курит, другая единица: пол = женщина, курение = бросила, и т.д.).

Таким образом, после сбора первичного материала можно построить таблицу наблюдаемых частот:

 

 

Таблица наблюдаемых частот

 

Пол

Кур.

Курит

Бросил(а)

Не курил(а)

Всего

Мужской

 

 

 

 

 

Женский

 

 

 

 

 

2. Построение таблицы ожидаемых частот

Ожидаемые частоты вычисляются по формуле, полученной из предположения, что признаки не связаны между собой. (см. учебник!)

II следствие теоремы умножения вероятностей: Вероятность произведения двух независимых событий равна произведению вероятностей этих событий. P(AB) = P(A) P(B). Из этой формулы путем ряда преобразований получают формулу для вычисления ожидаемых частот.

Таким образом, ожидаемые частоты есть теоретические частоты, вычисленные из предположения, что признаки не связаны между собой.

(«Какими должны были бы быть наблюдаемые частоты, не будь признаки связаны»)

3.Построение таблицы разности частот

Вячейки таблицы разности выносят значения разности между соответствующими ячейками таблиц наблюдаемых и ожидаемых частот.

Цель создания таблицы разности - оценить, насколько различаются значения частот в первых двух таблицах.

Если частоты будут отличаться «слишком» сильно, то следовательно предположение, исходя из которого была построена таблица ожидаемых частот, неверно.

Таким образом необходимо статистически проверить, насколько сильно различаются таблицы.

4. Проверка статистической гипотезы о значимости разности частот

1. Формулировка гипотез

H0: Признаки не сопряжены . «СЛИШКОМ» - получилось случайно H1: Признаки сопряжены. «СЛИШКОМ» -получилось не случайно

2.Определение уровня значимости ( =0,05)

3.Работа с критерием:

3.1Критерий Пирсона-Фишера (Вручную или в ППП)

3.2Критерий Йейтса (Четырехпольная таблица 2 2)

4.Сравнение результатов, формулировка выводов

Если p > , то нет оснований отвергать H0, “признаки не сопряжены”

Если p< , то следует отвергнуть H0, принять H1, “признаки сопряжены”

Что запомнить об анализе сопряженных признаков

1.Проверяет наличие связи между двумя качественными признаками.

2.Основная гипотеза предполагает, что связи между признаками нет.

3.Строятся три таблицы: наблюдаемых, ожидаемых и разности частот.

4.Вычисляется значение критерия Фишера-Пирсона или Пирсона с поправкой Йейтса (в случае четырехпольной таблицы).

5.Формулировка вывода о наличии связи между признаками.