- •1. Шкалы интервалов (можно измерить моду, медиану, среднюю арифметическую и характеристики рассеивания)
- •1. Шкалы интервалов (можно измерить моду, медиану, среднюю арифметическую и характеристики рассеивания)
- •7. Дихотомические переменные. Мнп-оценки вероятностей таблиц сопряженности (частный случай: таблицы 2х2).
- •10. Асимптотический критерий независимости - информационный критерий (частный случай: таблицы 2х2). Асимптотическая эквивалентность критерия согласия и информационного критерия.
- •11. Методы отбора объектов в выборку, свойства получаемых таблиц сопряженности.
- •12. Точный критерий Фишера (частный случай: таблицы 2х2, обе маргинальные частоты фиксированы).
- •13. Точный критерий Фишера (частный случай: таблицы 2х2, одна маргинальная частота фиксирована). Асимптотическая формула.
- •14. Поправка на непрерывность в асимптотическом χ2-критерии.
- •21. Коэффициент сопряженности Пирсона, его свойства, интервальные оценки (таблицы rХs).
- •22. Коэффициент Чупрова, его свойства, интервальные оценки (таблицы rХs).
- •23. Коэффициент Крамера, его свойства, интервальные оценки (таблицы rХs).
- •24. Отношение преобладаний (частный случай: таблицы 2х2).
- •25. Принцип инвариантности Юла
- •26. Коэффициент ассоциации Юла, его свойства
- •27. Коэффициент ассоциации Юла, его вероятностная интерпретация
- •28. Коэффициент коллигации, его свойства.
- •29. Коэффициент коллигации, его вероятностная интерпретация.
- •30. Коэффициент контингенции, его свойства.
- •31. Коэффициент Гудмена-Краскала λa, его свойства, вероятностная интерпретация и интервальные оценки (таблицы rХs).
- •32. Коэффициент Гудмена-Краскала λb, его свойства, вероятностная интерпретация и интервальные оценки (таблицы rХs).
- •33. Коэффициент Гудмена-Краскала λ, его свойства, вероятностная интерпретация и границы определения (таблицы rХs).
- •40. Одновременная независимость, условная независимость и взаимная независимость трех признаков. Проверяемые гипотезы.
- •41. Анализ частных взаимосвязей между тремя признаками. Возникновение кажущихся связей при объединении совокупностей по одному из признаков
- •42. Анализ частных взаимосвязей между тремя признаками. Сокрытие истинных связей при объединении совокупностей по одному из признаков.
- •43. Парадокс Симпсона (приведите пример).
- •44. Логарифмически-линейный анализ: его цель и математическая задача. Определение и математическая формулировка логарифмически-линейной модели. Адекватные и оптимальные модели.
- •45. Логарифмически-линейный анализ взаимосвязи двух признаков. Типы моделей. Ограничения на параметры модели.
- •46. План проведения логарифмически-линейного анализа. Поиск оптимальной логлинейной модели взаимосвязи двух признаков.
- •48. Определение параметров моделей логарифмически-линейного анализа (для общего двумерного случая и для дихотомических переменных). Интерпретация параметров.
- •49. Оценка модели независимости (для таблицы сопряженности 2х2).
- •50. Оценка моделей с отсутствием влияния одного из факторов (для таблицы сопряженности 2х2).
- •51. Оценка равновероятной модели (для таблицы сопряженности 2х2).
- •52. Критерий проверки значимости отдельных параметров логлинейной модели.
- •53. Модель логарифмически-линейного анализа взаимосвязи трех признаков. Ограничения на параметры модели.
- •54. Определение параметров моделей логарифмически-линейного анализа взаимосвязи трех признаков (для общего трехмерного случая). Интерпретация параметров.
- •55. Определение параметров моделей логарифмически-линейного анализа взаимосвязи трех признаков (для дихотомических переменных). Интерпретация параметров.
- •56. Модель условной независимости для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •57. Модели с отсутствием взаимодействия двух факторов для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •58. Модели независимости двух факторов от третьего для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •59. Модель главных эффектов трех факторов для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •60. Модели с отсутствием влияния главного эффекта одного из факторов для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •62. Модели с отсутствием влияния главного эффекта двух факторов для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •63. Равновероятная модель для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •64. Иерархические логарифмически-линейные модели и принципы их построения (приведите примеры).
- •65. Соотношения между параметрами ненасыщенных моделей и маргинальными суммами таблиц сопряженности. Обобщение Берча и его следствие
- •66. Принципы отбора оцениваемых логарифмически-линейных моделей в многомерном случае. Общие принципы оценки параметров моделей и определение их стандартизированных значений.
7. Дихотомические переменные. Мнп-оценки вероятностей таблиц сопряженности (частный случай: таблицы 2х2).
Дихотомическая переменная - принимающая
2 значения (r=2, s=2).
Х: (A;
)
Y: (B;
).
Получим оценки вероятностей методом
наибольшего правдоподобия. Мультиномиальное
(полиномиальное) распределение –
элементы генеральной совокупности
разбиты на k классов.
Составим функцию правдоподобия:
.
Параметры распределения подчиняются
Оценка несмещенная.
8. Закон распределения вероятностей таблиц сопряженности (частный случай: таблицы 2Х2). При больших объёмах выборки и отсутствии малых частот по центральной предельной теореме совместное распределение nij стремится к многомерному нормальному распределению с параметрами:
;
;
;
=>
независимость признаков.
9. МНП-оценки вероятностей таблиц сопряженности при истинности гипотезы независимости. Критерий независимости - критерий согласия χ2 (частный случай: таблицы 2Х2).
Параметры распределения подчиняются
и
истинна гипотеза H0:
.
независимы =>
;
.
Оценки максимального правдоподобия соответствуют гипотезе H0.
;
Критерий согласия:
Критическая область:
,
H0 отвергается с вероятностью
ошибки α.
Область принятия решения:
H0 не отвергается на уровне
значимости α.
10. Асимптотический критерий независимости - информационный критерий (частный случай: таблицы 2х2). Асимптотическая эквивалентность критерия согласия и информационного критерия.
Критерий правдоподобия (информационный критерий):
Критическая область:
,
H0 отвергается с вероятностью
ошибки α.
Область принятия решения:
H0 не отвергается на уровне
значимости α.
Асимптотическая эквивалентность:
Подставим МНП-оценки в функцию правдоподобия.
Статистика критерия отношений правдоподобия:
,
где
- теоретические частота
11. Методы отбора объектов в выборку, свойства получаемых таблиц сопряженности.
1) Оба набора маргинальных частот фиксированы. (существует набор проб масла и маргарина, есть данные по количеству масла и маргарина, случайному человеку дают пробовать). Свойство: одна независимая частота n11 распределена по гипергеометрическому закону.
2) Один набор маргинальных частот фиксирован. Целевой отбор.
1. В зависимости от числа категорий r одномерных генеральных совокупностей.
2. Объём выборки совокупности
,
общий объём выборки
3. Отбор
объектов из генеральной совокупности
4. Для каждого объекта проверяется принадлежность к категории признака У, в зависимости от Вj объект помещается в соответствующую клетку таблицы (Такой способ отбора часто используют в медицине, когда 1 группе больных дают 1 лекарство, 2 группе – 2е, а потом смотрят результат). n1* и n2* фиксированы. Тогда n11 и n21 – независимые частоты – случайные величины, имеющие биномиальное распределение.
3) Оба набора маргинальных частот не фиксированы.
Перекрестный (cross sectional) отбор
1. Рассматривается 2мерная генеральная совокупность
2. Задается объём выборки n
3. Отбор n объектов
4. Для каждого проверяется принадлежность Х и У. В зависимости от категории объект помещают в клетку.
Случайный перекрестный отбор – отличается от перекрестного том, что объем выборки случаен (Например, количество аварий на участке дороги).
