
- •Основные понятия теории вероятностей и математической статистики, необходимые для анализа и интерпретации результатов диагностических исследований
- •Необходимые сведения из теории вероятностей и математической статистики1
- •Вероятность
- •Вероятность противоположного события
- •Шансы за и против («одды»)
- •Пример из генетики
- •Независимые события
- •Отношение шансов («оддов»)
- •Условные вероятности
- •«Заблуждение обвинителя»
- •Формула Бейза: вероятность причин, гипотез, или обратные или предсказательные вероятности
- •Формула Бейза в терминах шансов за и против («оддов») и правдоподобий
- •Элементы математической статистики Статистика – слуга всех наук
- •Популяция и выборка
- •Важнейшее требование к популяции и к выборке - однородность2
- •Закон Больших Чисел – збч. Основа основ статистики
- •Збч обеспечивает связь теории с практикой
- •Статистика с доверием
- •Репрезентативность выборки
- •Основные схемы формирования выборок в диагностических исследованиях
- •Упрощающие предположения:
- •Общепопуляционное (поперечно-срезовое) формирование выборки
- •Формирование выборок по схеме «случаи – контроли»
- •Статистическое оценивание
- •Два основных типа статистических оценок
- •Основная логика статистического оценивания: точечные оценки
- •Основная логика статистического оценивания: интервальные оценки
- •Точность и надежность статистических оценок
- •Надежность доверительных интервалов (ди)
- •Логика использования доверительных интервалов для оценки статистической значимости полученных результатов
«Заблуждение обвинителя»
Принципиально важно знать и осознавать, что условные вероятности необращаемы. А именно: вероятность события A при условии, что осуществилось событие B, не есть вероятность события B при условии, что произошло событие A:
Например,
чувствительность клинико-лабораторного
диагностического теста, т.е. вероятность
получить положительный результат
у субъекта с данной болезнью
не равна предсказательной (апостериорной)
вероятности наличия болезни у субъекта
с положительным результатом теста:
При проверке статистических гипотез важно помнить, что вероятность получить наблюдаемые данные D при условии, что верна нулевая гипотеза H0, не есть апостериорная вероятность гипотезы H0 после получения экспериментальных данных:
В судебной генетике подобные заблуждения называют «заблуждением обвинителя (прокурора)». Вероятность наблюдать у заподозренного субъекта ДНК-профиль (генотип) G, идентичный генотипу ДНК-улики при условии, что заподозренный невиновен (I – innocent), не есть вероятность того, что заподозренный невиновен, если у него обнаружен данный генотип:
Связь между подобными условными вероятностями устанавливает теорема Бейза.
Формула Бейза: вероятность причин, гипотез, или обратные или предсказательные вероятности
Формула
Бейза устанавливает связь между условными
вероятностями
и
для двух случайных событий A
и
B:
Другая интерпретация. Вероятность можно назвать априорной вероятностью события A, т.е. вероятностью этого события до осуществления события B. Условную вероятность можно назвать апостериорной вероятностью события A, т.е. вероятностью этого события после осуществления события B. При такой интерпретации формула Бейза устанавливает связь между априорной и апостериорной вероятностями события A (относительно осуществления или неосуществления события B).
Формула Бейза в терминах шансов за и против («оддов») и правдоподобий
Условные
вероятности
и
принято называть правдоподобиями,
а их отношение – отношением
правдоподобий
(LR
–
от англ. Likelihood
Ratio):
Тогда в обозначениях для отношения правдоподобий и априорных и апостериорных шансов за и против («оддов») формула Бейза имеет вид:
Это означает, что апостериорные (т.е. после того как произошло событие B) одды (шансы за и против) события A равны его априорным оддам, умноженным на отношение правдоподобий LR:
Апостериорные одды = Априорные одды × Отношение правдоподобий
В
теории проверки статистических гипотез
событие A
несет смысл проверяемой гипотезы, обычно
называемой нулевой гипотезой H0,
а противоположное событие
несет смысл альтернативной гипотезы
H1.
Тогда соответствующее отношение
правдоподобий принято называть бейзовым
фактором
BF01.
Подстрочный индекс 01 (читается как
«ноль-один») означает, что сравнивается
нулевая гипотеза с альтернативной.
Обратная величина для сравнения
альтернативной гипотезы с нулевой будет
иметь подстрочный индекс 10:
(читается
как «один-ноль»).
Элементы математической статистики Статистика – слуга всех наук
Статистику можно определить как науку об изучении статистических данных и как науку об изменчивости результатов подсчетов и измерений в разных областях научной и практической деятельности человека.
Данные
Данные – это такие сведения, факты, информация, которые мы собираем и изучаем (анализируем) с какой-либо целью: придти к какому-либо выводу, заключению или принять решение.
Решения часто бывают жизненно важными:
Лечит ли предлагаемое средство или метод или нет, или - напротив – наносит ли изучаемый агент вред, правильно ли врач ставит диагноз, есть ли связь (корреляция) между фактором риска и болезнью и т.п.
Два основных типа Статистических Данных и моделей их порождения
Счетные Данные
Счетные Данные получают путем подсчета объектов, предметов. Моделью для них являются Дискретные Случайные Величины и, соответственно, Дискретные Распределения
Мерные Данные
Мерные Данные получаются путем измерения признаков. Моделью для них являются Непрерывные Случайные Величины и, соответственно, Непрерывные Распределения.
Кратко: Счетные данные подсчитываются. Мерные данные измеряются.
Пример: каковы признаки этой собаки? |
|
|
Качественные:
Количественные:
|