
- •1. Шкалы интервалов (можно измерить моду, медиану, среднюю арифметическую и характеристики рассеивания)
- •1. Шкалы интервалов (можно измерить моду, медиану, среднюю арифметическую и характеристики рассеивания)
- •7. Дихотомические переменные. Мнп-оценки вероятностей таблиц сопряженности (частный случай: таблицы 2х2).
- •10. Асимптотический критерий независимости - информационный критерий (частный случай: таблицы 2х2). Асимптотическая эквивалентность критерия согласия и информационного критерия.
- •11. Методы отбора объектов в выборку, свойства получаемых таблиц сопряженности.
- •12. Точный критерий Фишера (частный случай: таблицы 2х2, обе маргинальные частоты фиксированы).
- •13. Точный критерий Фишера (частный случай: таблицы 2х2, одна маргинальная частота фиксирована). Асимптотическая формула.
- •14. Поправка на непрерывность в асимптотическом χ2-критерии.
- •21. Коэффициент сопряженности Пирсона, его свойства, интервальные оценки (таблицы rХs).
- •22. Коэффициент Чупрова, его свойства, интервальные оценки (таблицы rХs).
- •23. Коэффициент Крамера, его свойства, интервальные оценки (таблицы rХs).
- •24. Отношение преобладаний (частный случай: таблицы 2х2).
- •25. Принцип инвариантности Юла
- •26. Коэффициент ассоциации Юла, его свойства
- •27. Коэффициент ассоциации Юла, его вероятностная интерпретация
- •28. Коэффициент коллигации, его свойства.
- •29. Коэффициент коллигации, его вероятностная интерпретация.
- •30. Коэффициент контингенции, его свойства.
- •31. Коэффициент Гудмена-Краскала λa, его свойства, вероятностная интерпретация и интервальные оценки (таблицы rХs).
- •32. Коэффициент Гудмена-Краскала λb, его свойства, вероятностная интерпретация и интервальные оценки (таблицы rХs).
- •33. Коэффициент Гудмена-Краскала λ, его свойства, вероятностная интерпретация и границы определения (таблицы rХs).
- •40. Одновременная независимость, условная независимость и взаимная независимость трех признаков. Проверяемые гипотезы.
- •41. Анализ частных взаимосвязей между тремя признаками. Возникновение кажущихся связей при объединении совокупностей по одному из признаков
- •42. Анализ частных взаимосвязей между тремя признаками. Сокрытие истинных связей при объединении совокупностей по одному из признаков.
- •43. Парадокс Симпсона (приведите пример).
- •44. Логарифмически-линейный анализ: его цель и математическая задача. Определение и математическая формулировка логарифмически-линейной модели. Адекватные и оптимальные модели.
- •45. Логарифмически-линейный анализ взаимосвязи двух признаков. Типы моделей. Ограничения на параметры модели.
- •46. План проведения логарифмически-линейного анализа. Поиск оптимальной логлинейной модели взаимосвязи двух признаков.
- •48. Определение параметров моделей логарифмически-линейного анализа (для общего двумерного случая и для дихотомических переменных). Интерпретация параметров.
- •49. Оценка модели независимости (для таблицы сопряженности 2х2).
- •50. Оценка моделей с отсутствием влияния одного из факторов (для таблицы сопряженности 2х2).
- •51. Оценка равновероятной модели (для таблицы сопряженности 2х2).
- •52. Критерий проверки значимости отдельных параметров логлинейной модели.
- •53. Модель логарифмически-линейного анализа взаимосвязи трех признаков. Ограничения на параметры модели.
- •54. Определение параметров моделей логарифмически-линейного анализа взаимосвязи трех признаков (для общего трехмерного случая). Интерпретация параметров.
- •55. Определение параметров моделей логарифмически-линейного анализа взаимосвязи трех признаков (для дихотомических переменных). Интерпретация параметров.
- •56. Модель условной независимости для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •57. Модели с отсутствием взаимодействия двух факторов для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •58. Модели независимости двух факторов от третьего для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •59. Модель главных эффектов трех факторов для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •60. Модели с отсутствием влияния главного эффекта одного из факторов для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •62. Модели с отсутствием влияния главного эффекта двух факторов для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •63. Равновероятная модель для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •64. Иерархические логарифмически-линейные модели и принципы их построения (приведите примеры).
- •65. Соотношения между параметрами ненасыщенных моделей и маргинальными суммами таблиц сопряженности. Обобщение Берча и его следствие
- •66. Принципы отбора оцениваемых логарифмически-линейных моделей в многомерном случае. Общие принципы оценки параметров моделей и определение их стандартизированных значений.
27. Коэффициент ассоциации Юла, его вероятностная интерпретация
Вероятность того, что 2 случайных объекта относятся к гомогенным категориям признаков (Х1 и У1 или Х2 и У2) на Q больше, чем к гетерогенным.
28. Коэффициент коллигации, его свойства.
Для всех ячеек рассчитывается так же.
Свойства:
Y=0, если признаки независимы, т.е. D=0
Принимает значение +1, когда =0, то есть в случае полной связанности; принимает значение -1, когда =0, то есть в случае полной отрицательной связанности.
Удовлетворяют принципу инвариантности Юла.
Связь между X и Y полная, если все Х1 являются одновременно Y1, несмотря на то, что не все Y1 являются одновременно Х1. Если все Х1 являются одновременно Y1 и все Y1 являются одновременно Х1, то связь абсолютная. Коэффициент коллигации характеризует полную связь.
Границы доверительного интервала:
- точечная оценка коэффициента коллигации
- оценка стандартной ошибки коэффициента.
29. Коэффициент коллигации, его вероятностная интерпретация.
- вероятность предсказать принадлежность
к категории 2-го признака, если знаем
принадлежность к категории 1-го признака
-
вероятность предсказать принадлежность
к категории 1-го признака, если знаем
принадлежность к категории 2-го признака
-
вероятность ошибки классификации одного
из признаков при известной категории
другого.
Если знаем категорию Y и надо предсказать категорию Х:
Если принадлежит к B,тогда
вероятность предсказать
Если принадлежит к
,
тогда вероятность предсказать
По формуле Байеса:
Если знаем категорию X и надо предсказать Y:
-
вероятность ошибки неправильной
классификации по одному из признаков
при неизвестной категории другого.
λ показывает, насколько снизится ошибка предсказания одного из признаков у случайно отобранного объекта при наличии информации о том, к какой категории другого признака он принадлежит, в сравнении с ситуацией, когда эта информация отсутствует.
а)
По принципу инвариантности Юла:
а)
Точно так же
=Y.
В общем случае =|Y|. Таким образом, у У такая же вероятностная интерпретация, как и у .
30. Коэффициент контингенции, его свойства.
Для всех ячеек рассчитывается так же.
Свойства:
V=0, если признаки независимы, т.е. D=0
V растёт, если D растёт
V=-1, если одна обе гомогенные частоты нулевые и V=1, если обе гетерогенные частоты нулевые.
Связь между X и Y полная, если все Х1 являются одновременно Y1, несмотря на то, что не все Y1 являются одновременно Х1. Если все Х1 являются одновременно Y1 и все Y1 являются одновременно Х1, то связь абсолютная. Коэффициент контингенции характеризует абсолютную связь.
Границы доверительного интервала:
- точечная оценка коэффициента коллигации
- оценка стандартной ошибки коэффициента.
31. Коэффициент Гудмена-Краскала λa, его свойства, вероятностная интерпретация и интервальные оценки (таблицы rХs).
где
;
Если
,
то существует однозначная или
взаимооднозначная зависимость Х от У.,
т.е. Х жестко связан с У или связан по
вероятности.
Если
,
то Х не зависит от У, т.е. информация об
У не улучшит прогноза Х, а также когда
все максимальные значения наблюдаемых
частот по столбцам находятся в одной
строке, соответствующей максимальной
маргинальной частоте, что является
главным недостатком коэффициента.
Вероятностный смысл – показывает снижение вероятности ошибки предсказания признака Х при известной информации о принадлежности наблюдения к некоторому классу признака У по сравнению с ситуацией, когда информация отсутствует.
Интервальная оценка:
где
-
сумма только таких максимальных элементов
столбцов, для которых значение j
обеспечивает попадание в строку с
наибольшим итогом