- •Радчикова н.П.
- •Справочный материал. Выбор метода статистического анализа
- •Тема 1.
- •Http://www.Statsoft.Ru
- •2. Введите данные студентов по эмпатии (три различные теста):
- •3. Добавьте в список еще одного студента:
- •4. Переведите все сырые баллы в стенайны:
- •6. Создайте переменную sum 'сумма баллов':
- •Тема 2
- •Описание одной выборки
- •Справочный материал.
- •Описательная статистика
- •3. Теперь посчитайте описательную статистику отдельно для группы мужчин и для группы женщин.
- • Распределение можно считать нормальным, если критерий не значимый!
- •Тема 3.
- •Исследование взаимосвязи между переменными
- •СправочнЫй материал
- •Корреляционные исследования
- •Лабораторная работа 3 Корреляция и простая линейная регрессия
- •2. Подсчет коэффициента корреляции Пирсона.
- •Лабораторная работа 5. Проверка гипотез. Статистические критерии для простЫх экспериментальнЫх схем
- •1. Загрузите файл данных.
- •2. Подсчет t-критерия Стьюдента
- •2. Подсчет t-критерия Стьюдента
- •3. Подсчет критерия Вилкоксона
- •Таблицы сопряженности
- •Справочный материал.
- •Статистика для таблиц сопряженности
- •Коэффициент . Употребляется в основном с таблицами 2*2, изменяется от 0 (когда переменные независимы) до 1 (когда переменные абсолютно зависимы).
- •V Крамера можно употреблять для любых таблиц – и квадратных, и прямоугольных. Изменяется от 0 (когда переменные независимы) до 1 (когда переменные абсолютно зависимы).
- •Лабораторная работа 5. Статистический анализ таблиц сопряженности
- •1. Загрузите файл данных.
- •2. Статистика для таблиц сопряженности в модуле Basic Statistics
- •3. Статистика для таблиц сопряженности в модуле
- •Тема 6.
- •Лабораторная работа 6.
- •Проверка гипотез.
- •Однофакторный Дисперсионный анализ
- •И его непараметрические аналоги.
- •Тема 7.
- •Лабораторная работа 7.
- •Проверка гипотез.
- •Многофакторный Дисперсионный анализ
- •(Межгрупповая схема)
- •Лабораторная работа 8. Проверка гипотез. Дисперсионный анализ (Интра-индивидуальная схема)
Таблицы сопряженности
Справочный материал.
Статистика для таблиц сопряженности
Таблицы сопряженности это совместное распределение двух переменных. Строки таблицы образуются значениями одной переменной. Столбцы таблицы образуются значениями второй переменной. В клетке таблицы (на пересечении строки и столбца) указывается частота совместного появления соответствующих значений. Суммы частот по строке или по столбцу называются маргинальными частотами. Распределения маргинальных частот представляют собой одномерное распределение переменных.
Таблицы сопряженности можно составлять для дискретных переменных, а также для непрерывных переменных, сгруппированных в интервалы. Обычно таблицы сопряженности строятся для шкал наименований и для шкал порядка. В зависимости от типа шкалы можно применять различные статистические процедуры:
Для шкал наименований |
Для шкал порядка |
для таблиц 2*2:
|
Все, что можно для шкал наименований +
|
Статистические критерии для таблиц сопряженности проверяют, есть ли зависимость в распределении по одной переменной от распределения по другой переменной. Наиболее употребительными являются 2 Пирсона (для межгрупповой схемы) и 2 МакНемара (для интра-индивидуальной схемы) .
Подсчет критерия 2 Пирсона осуществляется по формуле
, где
–эмпирическая частота, – теоретическая частота
k=r*c (r– число строк в таблице, c –число столбцов в таблице).
Следует помнить, что этот критерий имеет следующие ограничения:
Наблюдения должны быть независимы, поэтому нельзя использовать одного и того же испытуемого более одного раза.
2 пропорционален размеру выборки. Если увеличить размер выборки в 2 раза при соблюдении всех пропорций, то и 2 возрастет в 2 раза. Поэтому не рекомендуется использовать этот критерий для больших выборок (более 500 испытуемых).
Если теоретическая частота клеток маленькая, то вычисления могут быть не точны. Общепринятым является правило, что когда df>1 теоретическая частота должна быть равна или больше 5 по крайней мере в 80% клеток.
Критерий 2 МакНемара употребляется только для таблиц 2*2 и обычно служит для определения, произошли ли какие-либо изменения после какого-либо условия (события). Данные, как правило, представляют в виде таблицы:
|
|
после | |
|
|
ii |
i |
до |
I |
a |
b |
ii |
c |
d |
и критерий вычисляется по формуле: . Критерий 2 МакНемара обладает только одним ограничением: A+D должно быть не меньше 10.
В программе STATISTICA можно посчитать три меры зависимости для шкал наименований:
Коэффициент . Употребляется в основном с таблицами 2*2, изменяется от 0 (когда переменные независимы) до 1 (когда переменные абсолютно зависимы).
Коэффициент сопряженности (С или Ф). Разработан для использования с квадратными таблицами размером больше, чем 2*2. Меняется от 0 (когда переменные независимы до , гдеk – число строк (столбцов в таблице).