- •1. Шкалы интервалов (можно измерить моду, медиану, среднюю арифметическую и характеристики рассеивания)
- •1. Шкалы интервалов (можно измерить моду, медиану, среднюю арифметическую и характеристики рассеивания)
- •7. Дихотомические переменные. Мнп-оценки вероятностей таблиц сопряженности (частный случай: таблицы 2х2).
- •10. Асимптотический критерий независимости - информационный критерий (частный случай: таблицы 2х2). Асимптотическая эквивалентность критерия согласия и информационного критерия.
- •11. Методы отбора объектов в выборку, свойства получаемых таблиц сопряженности.
- •12. Точный критерий Фишера (частный случай: таблицы 2х2, обе маргинальные частоты фиксированы).
- •13. Точный критерий Фишера (частный случай: таблицы 2х2, одна маргинальная частота фиксирована). Асимптотическая формула.
- •14. Поправка на непрерывность в асимптотическом χ2-критерии.
- •21. Коэффициент сопряженности Пирсона, его свойства, интервальные оценки (таблицы rХs).
- •22. Коэффициент Чупрова, его свойства, интервальные оценки (таблицы rХs).
- •23. Коэффициент Крамера, его свойства, интервальные оценки (таблицы rХs).
- •24. Отношение преобладаний (частный случай: таблицы 2х2).
- •25. Принцип инвариантности Юла
- •26. Коэффициент ассоциации Юла, его свойства
- •27. Коэффициент ассоциации Юла, его вероятностная интерпретация
- •28. Коэффициент коллигации, его свойства.
- •29. Коэффициент коллигации, его вероятностная интерпретация.
- •30. Коэффициент контингенции, его свойства.
- •31. Коэффициент Гудмена-Краскала λa, его свойства, вероятностная интерпретация и интервальные оценки (таблицы rХs).
- •32. Коэффициент Гудмена-Краскала λb, его свойства, вероятностная интерпретация и интервальные оценки (таблицы rХs).
- •33. Коэффициент Гудмена-Краскала λ, его свойства, вероятностная интерпретация и границы определения (таблицы rХs).
- •40. Одновременная независимость, условная независимость и взаимная независимость трех признаков. Проверяемые гипотезы.
- •41. Анализ частных взаимосвязей между тремя признаками. Возникновение кажущихся связей при объединении совокупностей по одному из признаков
- •42. Анализ частных взаимосвязей между тремя признаками. Сокрытие истинных связей при объединении совокупностей по одному из признаков.
- •43. Парадокс Симпсона (приведите пример).
- •44. Логарифмически-линейный анализ: его цель и математическая задача. Определение и математическая формулировка логарифмически-линейной модели. Адекватные и оптимальные модели.
- •45. Логарифмически-линейный анализ взаимосвязи двух признаков. Типы моделей. Ограничения на параметры модели.
- •46. План проведения логарифмически-линейного анализа. Поиск оптимальной логлинейной модели взаимосвязи двух признаков.
- •48. Определение параметров моделей логарифмически-линейного анализа (для общего двумерного случая и для дихотомических переменных). Интерпретация параметров.
- •49. Оценка модели независимости (для таблицы сопряженности 2х2).
- •50. Оценка моделей с отсутствием влияния одного из факторов (для таблицы сопряженности 2х2).
- •51. Оценка равновероятной модели (для таблицы сопряженности 2х2).
- •52. Критерий проверки значимости отдельных параметров логлинейной модели.
- •53. Модель логарифмически-линейного анализа взаимосвязи трех признаков. Ограничения на параметры модели.
- •54. Определение параметров моделей логарифмически-линейного анализа взаимосвязи трех признаков (для общего трехмерного случая). Интерпретация параметров.
- •55. Определение параметров моделей логарифмически-линейного анализа взаимосвязи трех признаков (для дихотомических переменных). Интерпретация параметров.
- •56. Модель условной независимости для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •57. Модели с отсутствием взаимодействия двух факторов для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •58. Модели независимости двух факторов от третьего для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •59. Модель главных эффектов трех факторов для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •60. Модели с отсутствием влияния главного эффекта одного из факторов для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •62. Модели с отсутствием влияния главного эффекта двух факторов для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •63. Равновероятная модель для таблицы сопряженности 2х2х2 (формулировка, проверяемая гипотеза, теоретические частоты, проверка адекватности).
- •64. Иерархические логарифмически-линейные модели и принципы их построения (приведите примеры).
- •65. Соотношения между параметрами ненасыщенных моделей и маргинальными суммами таблиц сопряженности. Обобщение Берча и его следствие
- •66. Принципы отбора оцениваемых логарифмически-линейных моделей в многомерном случае. Общие принципы оценки параметров моделей и определение их стандартизированных значений.
32. Коэффициент Гудмена-Краскала λb, его свойства, вероятностная интерпретация и интервальные оценки (таблицы rХs).
где
;
Если
,
то существует однозначная или
взаимооднозначная зависимость Y
от X, т.е. Y
жестко связан с X или
связан по вероятности.
Если
,
то Y не зависит от X,
т.е. информация об X не
улучшит прогноза Y, а также
когда все максимальные значения
наблюдаемых частот по строкам находятся
в одном столбце, соответствующей
максимальной маргинальной частоте, что
является главным недостатком коэффициента.
Вероятностный смысл – показывает снижение вероятности ошибки предсказания признака Y при известной информации о принадлежности наблюдения к некоторому классу признака X по сравнению с ситуацией, когда информация отсутствует.
Интервальная оценка:
где
-
сумма только таких максимальных элементов
строк, для которых значение i
обеспечивает попадание в столбец с
наибольшим итогом.
33. Коэффициент Гудмена-Краскала λ, его свойства, вероятностная интерпретация и границы определения (таблицы rХs).
где ; ; ;
В числителе λ сумма числителей λa и λb, а в знаменателе сумма знаменателей λa и λb.
Вероятностный смысл – показывает снижение вероятности ошибки предсказания признака при известной информации о принадлежности наблюдения к некоторому классу другого признака по сравнению с ситуацией, когда эта информация отсутствует.
Для λ выполнено
.
Но это не интервальная оценка.
34. τ-меры Гудмена-Краскала. Их отличие от коэффициентов λ Гудмена-Краскала.
Коэффициенты основаны на сравнении ситуаций, когда есть информация о принадлежности наблюдений к тому или иному классу и когда этой информации нет. Отличие τ-мер от коэффициентов λ Гудмена-Краскала состоит в методе предсказания. τ-мера предсказывает не наиболее вероятную категорию, а различные категории в пропорции, которая имеет место для их наблюдаемых итогов.
Асимметричные τ-меры показывают на сколько процентов уменьшится неправильный прогноз категории одного признака для случайно взятого объекта при условном пропорциональном прогнозировании по сравнению с безусловным.
Симметричная τ-мера показывает на сколько процентов уменьшится неправильный прогноз категории для случайно взятого объекта при условном пропорциональном прогнозировании по сравнению с безусловным.
Но это не интервальная оценка.
35. Простейшая мера связи между упорядоченными признаками, ее недостатки.
Рассматривается пара наблюдений, одно из которых имеет категорию i переменной X и j переменной Y, а второе i` переменной X и j` переменной Y.
S – общее число пар наблюдений, для которых либо одновременно i>i` и j>j`, либо одновременно i<i` и j<j` (юго-восточнее или северо-западнее элемента)
D – общее число пар наблюдений, для которых либо одновременно i>i` и j<j`, либо i<i` и j>j` (северо-восточнее или юго-западнее элемента)
Ta – общее число пар наблюдений, для которых i=i` (в этой строке)
Tb – общее число пар наблюдений, для которых j=j` (в этом столбце)
S – число положительных
слагаемых в сумме
D – число отрицательных слагаемых в сумме
Ta + Tb – число нулевых слагаемых в этой сумме
Простейшая t-мера ta
В данных нет совпадений ->
и
≠0
изменяется
от –n(n-1) до
n(n-1) ->
Недостатки:
не достигает
Ее истинные границы определяются числом нулей в данных
36. t-меры Кендэла для упорядоченных признаков и их свойства
Рассматривается пара наблюдений, одно из которых имеет категорию i переменной X и j переменной Y, а второе i` переменной X и j` переменной Y.
S – общее число пар наблюдений, для которых либо одновременно i>i` и j>j`, либо одновременно i<i` и j<j` (юго-восточнее или северо-западнее элемента)
D – общее число пар наблюдений, для которых либо одновременно i>i` и j<j`, либо i<i` и j>j` (северо-восточнее или юго-западнее элемента)
Ta – общее число пар наблюдений, для которых i=i` (в этой строке)
Tb – общее число пар наблюдений, для которых j=j` (в этом столбце)
S – число положительных слагаемых в сумме
D – число отрицательных слагаемых в сумме
Ta + Tb – число нулевых слагаемых в этой сумме
tb –
мера Кэндела: Если нет совпадений ->
и
≠0
= tb, если нет нулевых клеток
Если в данных есть совпадения, то > tb,
tb может достигать , но только в случае квадратной таблице сопряженности, когда все наблюдения сосредоточены на положительной или отрицательной главной диагонали.
В случае прямоугольных таблиц rxs мера
достигает максимума, когда все наблюдения
лежат в клетках самой длинной диагонали
таблицы (т.е. диагонали, содержащей
m=min(v,s)
клеток) и насколько возможно поровну
распределены между этими клетками. В
этом случае
При больших объёмах (n>100)
Когда все наблюдения лежат в клетках самой длинной диагонали таблицы и насколько возможно поровну распределены между клетками, при дополнительном условии n кратно m
Может достигать приблизительно для любых таблиц rxs
При больших объёмах выборки
Если равны все частоты в маргинальной
строке и все частоты в маргинальном
столбце, тогда для квадратной таблицы
.
Если таблица прямоугольная, то
37. d-меры Сомерса, их вероятностная интерпретация.
Рассматривается пара наблюдений, одно из которых имеет категорию i переменной X и j переменной Y, а второе i` переменной X и j` переменной Y.
S – общее число пар наблюдений, для которых либо одновременно i>i` и j>j`, либо одновременно i<i` и j<j` (юго-восточнее или северо-западнее элемента)
D – общее число пар наблюдений, для которых либо одновременно i>i` и j<j`, либо i<i` и j>j` (северо-восточнее или юго-западнее элемента)
Ta – общее число пар наблюдений, для которых i=i` (в этой строке)
Tb – общее число пар наблюдений, для которых j=j` (в этом столбце)
S – число положительных слагаемых в сумме
D – число отрицательных слагаемых в сумме
Ta + Tb – число нулевых слагаемых в этой сумме
У полагают зависимой от Х
Представляет собой разность между вероятностями получить правильный и неправильный порядок при случайном извлечении из совокупности 2 наблюдений, когда переменная Х не имеет совпадающих рангов.
Х полагают зависимой от У
Представляет собой разность между вероятностями получить правильный и неправильный порядок при случайном извлечении из совокупности 2 наблюдений, когда переменная Y не имеет совпадающих рангов.
38. Мера Гудмена-Краскала для упорядоченных признаков и ее свойства.
Рассматривается пара наблюдений, одно из которых имеет категорию i переменной X и j переменной Y, а второе i` переменной X и j` переменной Y.
S – общее число пар наблюдений, для которых либо одновременно i>i` и j>j`, либо одновременно i<i` и j<j` (юго-восточнее или северо-западнее элемента)
D – общее число пар наблюдений, для которых либо одновременно i>i` и j<j`, либо i<i` и j>j` (северо-восточнее или юго-западнее элемента)
Ta – общее число пар наблюдений, для которых i=i` (в этой строке)
Tb – общее число пар наблюдений, для которых j=j` (в этом столбце)
S – число положительных слагаемых в сумме
D – число отрицательных слагаемых в сумме
Ta + Tb – число нулевых слагаемых в этой сумме
Представляет собой разность между вероятностями правильного и неправильного порядка для 2 наблюдений, случайно извлеченных из совокупности, при условии, что совпадающих рангов нет.
Свойства:
γ может достигать своих пределов , если все наблюдения лежат на самой длинной диагонали таблицы.
Если Х и У независимы, то γ=0. Обратное верно не всегда. Если γ≠0, то они точно зависимы
Выборочное распределение γ приблизительно нормально
39. Определение и свойства трехмерных таблиц сопряженности. Маргинальные частоты и частные распределения признаков. См фото 2 и 3
