Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
исследования.docx
Скачиваний:
109
Добавлен:
20.02.2016
Размер:
140.2 Кб
Скачать

34.Этапы проверки гипотез о связях между переменными. Нулевая и альтернативная гипотезы. Статистический критерий. Уровень значимости. Критическая область.

Этапы: 1) Формулировка нулевой и альтерн. гипотез. Н0 – предположение о том, что между опред. стат. параметрами не сущ-ет связи или различия. Альтернативная – связь или различия сущ-ют. Исследователь всегда проверяет нулевую гипотезу.

2) Выбор метода стат. проверки гипотезы и статистики критерия. Чаще всего – норм. распределение, Стъюдента (t-распределение), - распределение.

3) Выбор уровня значимости. Ошибка 1 рода - отвергнута верная Н0. Ошибка 2 рода – ошибочная Н0 не отклоняется. Вероятность совершить ошибку 1 рода - α - уровень значимости (обычно 0,05) Вероятность не совершить ошибку 2 рода (1 - β) - мощность критерия. Слишком низкое значение α → к недопустимо большому β.

4) Определение размера выборки и значения выборочной ста­тистики

5) 1 вариант: Определение вероятности, которую примет статистика критерия при выполнении Н0, используя соотв. выборочное распределение (по таблице) 2 вариант: определение критич. значения статистики, ко­торое делит интервал на область принятия и непринятия Н0. После выбора опред. критерия множество всех его возможных значений разбивают на 2 непересек. подмножества: критич. область (сов-ть значений критерия, при кот. Н0 отклоняют) и область принятия гипотезы (принимают). Точки, разделяющие критич. область и обл. принятия гипотезы, - критические.

6) 1 вариант: Сравнение полученной вероятности для тест-статистики с заданным уровнем значимости. 2 вариант: определение того, попадает ли выборочное значение тест-статистики в обл. принятия или отклонения Н0.

7) Принятие или опровержение Н0.

8) Вывод о проблеме МИ.

35.Построение таблиц сопряженности признаков. Введение третьей переменной.

Построение таблиц сопряженности признаков (кросс-табуляция) – стат. метод, кот. одновременно хар-ет 2 или больше переменных и заключается в создании таблиц, отражающих совместное распределение 2 или больше переменных.

Метод позволяет объяснить, как одна переменная связана с другой. С пом. данных таблиц можно рассматривать качественные и категориальные данные, которые можно измерить с пом. номинальной шкалы.

Общее правило – суммарное значение категорий зависимой переменной применительно к каждой категории независимой должна составлять 100%.

Проверяется H0: переменная в строке не зависит от переменной в столбце.

Для проверки такой гипотезы чаще всего используют стат. критерий χ2

Введение третьей переменной позволяет: 1. уточнить исходную связь между 2 переменными; 2. доказать сущ-ет ли она; 3. выявить проигнорированную исходную связь между 2 переменными.

36. Показатели оценки статистической значимости и тесноты связи переменных, включенных в состав таблицы сопряженности.

Стат критерий χ2 исп. для проверки стат значимости наблюдаемых связей в таблицах сопряженности признаков и позволяет определить наличие или отсутствие значимой связи между 2 переменными. где fe = foij – наблюдаемое, feij – ожидаемое кол-во случаев в (ij)-й клетке, nr – итоговое число в строке, nc – в колонке, n – полный размер выборки, r – кол-во строк, с – столбцов. Найденное расчетное χ2 сравнивается с таблицей критич. значений для опред. числа степеней свободы: (r-1) (c-1). Если расчетное значение χ2 > χ кр, то Н0 отклоняется.

Коэф. Фишера исп. для измерения тесноты связи при анализе таблиц с 2 строками и 2 столбцами: Ф = гдеn – размер выборки. Если Ф=0, то связь отсутствует, а при сильной связи Ф→1 (Ф>0,5 – связь сильная). Коэф. сопряженности признаков Пирсона – мера тесноты связи для таблиц любого размера. С = Чем ближе к 1, тем теснее связь. V-коэф. Крамера – мера тесноты связи, исп. в таблицах больших по размеру, чем 2х2. V = илиV= Чем ближе к 1, тем теснее связь.

Коэф. «лямбда» исп. в случае измерения переменных с пом. номин. шкалы. Ассимметр. коэф. «лямбда» - мера выраженного в % улучшения прогнозирования значения зависимой переменной при данном значении независимой. Если =1, то прогноз мб сделан без ошибок. Рассчитывается для каждой из зависимых. Симметричный – мера выраженного в % общего улучшения прогнозирования, когда прогноз сделан в обоих направлениях.

37. Проверка гипотез о различиях между значениями переменных: параметрические методы.

Параметрические методы применяются в случае, если данные представлены интервальной шкалой.

В случае если исследуется 1 выборка, для определения различий между значениями переменных используется t-критерий и z-критерий.

При исследовании 2-х независимых выборок используется двухгрупповой t-критерий или F-критерий для среднего и z-критерий для доли.

При исследовании 2-х парных выборок используется парный t-критерий.

38. Проверка гипотез о различиях между значениями переменных: непараметрические методы.

Непараметрические методы применяются в случае, если данные представлены номинальной или порядковой шкалой.

В случае если исследуется 1 выборка, для определения различий между значениями переменных используется критерий χ2 и критерий Колмогорова-Смирнова.

При исследовании 2-х независимых выборок используется критерий χ2 двухвыборочный критерий Колмогорова-Смирнова, медианный U-критерий.

При исследовании 2-х парных выборок используется критерий χ2 критерий знаков, критерий Вилкоксона.

39. Однофакторный дисперсионный анализ (ОДА).

ДА – статистический метод изучения различий между выборочными средними для 2 и более совокупностей.

Процедура выполнения ОДА:

1) определение зависимой и независимой переменной;

Для каждой группы наблюдений Х существует n наблюдений Y, соответственно размер выборки в каждой группе X=n.

Размер общей выборки: N=n*c, где n – кол-во наблюдений; с – кол-во категорий.

Обязательные условия:  зависимая переменная д.б. измерена с помощью интервальной или относительной шкалы;  наличие категориальной независимой переменной (1 или больше), называемой фактором.

Однофакторная дисперсионная модель: Xij = μ+Fiij, где

Xij – значение исследуемой переменной, полученное на i-ом уровне фактора с j-ым №.

μ – общая средняя.

Fi – эффект, обусловленный влиянием i-ым уровнем фактора.

εij – остаточный член, значения которого определяются влиянием неконтролируемых факторов.

2) разложение полной дисперсии – разделение дисперсии зависимой переменной на дисперсию, обусловленную внутригрупповой изменчивостью:

SSY = SSмежгрупповая+SSвнутригрупповая = SSх+SSошибки

SSY – полная дисперсия переменной Y.

SSмежгрупповая – вариация переменных Y, обусловленная различием средних между группами.

SSвнутригрупповая – вариация переменных Y, обусловленная вариацией внитри каждой группы категорий.

SSY = ; SSмежгрупповая = ; SSошибки = , где

Yi – отдельное наблюдение; Yij – i-ое наблюдение в j-ой группе; - средняя для всей выборки; - средняя дляj-ой группы.