Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лек_биостат_КДС_рус.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
898.05 Кб
Скачать

5. Литература:

  1. Васильева Л.А. Статистические методы в биологии, медицине и сельском хозяйстве: Учеб. пособие для вузов. - Новосибирск, Новосибирский Государственный университет, 2007. - 128 с

  2. Герасимов А.Н. Медицинская статистика: Учеб. Пособие. – М.: МИА, 2007. - 480 с.

  3. Гмурман В.Е. Теория вероятностей и математическая статистика: Учеб. пособие для вузов.- 9-е изд., стер. - М.: Высш. шк., 2003. - 479 с.

  4. Зайцев В.М., Лифляндский В.Г., Маринкин В.И. Прикладная медицинская статистика. Учебное пособие. – СПб:, Фолиант, 2006. – 432 с.

  5. Жижин К.С. медицинская статистика: Учебное пособие. - Ростов н/Д: Феникс, 2007. - 160 с.

  6. Кендалл М., Стюарт А. Статистические выводы и связи. - М.: Наука, 1973. - 470 с.

  7. Медик В.А., Токмачев М.С., Фишман Б.Б. Статистика в медицине и биологии: Руководство. В 2-х томах/ Под ред. Ю.М. Комарова. Т. 1. Теоретическая статистика. - М.: Медицина, 2000. - 412 с.

  8. Основы высшей математики и математической статистики: Учебник / И.В. Павлушкин и соавт. - М.: ГЭОТАР-МЕД, 2004. - 424 с.

  9. Петри А., Сэбин К. Наглядная медицинская статистика / А. Петри, К. Сэбин; пер. с англ. под ред. В.П. Леонова. 2-е изд., перераб. и доп. - М.: ГЭОТАР-Медиа, 2009. - 168 с.

  10. Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. - М.: МедиаСфера, 2002. - 312 с.

  11. http://matstats.ru/

6. Контрольные вопросы:

  1. Что называется ошибкой первого рода?

  2. Что называется ошибкой второго рода?

  3. Что называется доверительной вероятностью?

  4. Что называется уровнем значимости?

  5. Что называется мощностью критерия?

Лекция №3

Тема: Дисперсионный анализ в медицине и здравоохранении.

Цель: Ознакомить студентов с основами дисперсионного анализа.

План лекции:

  1. Основные понятия и методика дисперсионного анализа.

  2. Общая, факторная и остаточная дисперсии.

  3. Однофакторный дисперсионный анализ.

  4. Двухфакторный дисперсионный анализ

3. Тезисы лекции.

Дисперсионным анализом называют группу статистических методов, разработанных английским математиком и генетиком Р. Фишером в 20-х годах ХХ-го столетия для ряда экспериментальных задач биологии и сельского хозяйства.

Однако математическая постановка задачи указывает на универсальность этих методов, которые в настоящее время с успехом применяются и в медицинских исследованиях, и в экономике, и в других самых разных областях, где исследуются экспериментальные наборы данных.

Постановка задачи. Пусть даны генеральные совокупности X1, X2,…, Xk., где:

  • все «k» генеральных совокупностей распределены нормально;

  • дисперсии всех генеральных совокупностей одинаковы.

При этих условиях и заданном уровне значимости «р» требуется проверить нулевую гипотезу равенства средних, т.е. H0: .

Извлекая из каждой генеральной совокупности по выборке, требуется определить значимость или незначимость различия полученных «k» выборочных средних.

Можно предполагать, что все «k» генеральных совокупностей в нормальном виде идентичны, т.е. имеют не только равные дисперсии, но и одинаковые средние значения.

Однако каждая из генеральных совокупностей подвержена влиянию одного или нескольких качественных факторов, входящих в эксперимент, которые могут изменять их средние значения.

Фактором называется показатель, который оказывает влияние на конечный результат. Фактор может быть один или несколько. Конкретную реализацию фактора называют уровнем фактора.

Значение измеряемого признака называют откликом на фактор.

Например, некоторое количество больных гипертонией разбиты случайным образом на «k» групп, каждой из которых назначен прием определенного лекарства. В результате контролируется среднее значение показателя изменения артериального давления.

В данном примере:

  • значения показателя в «i»-ой группе, состоящей из «ni» больных – это «i»-я выборка из объема «ni»;

  • лекарство - это фактор, влияющий на величину контролируемого показателя;

  • показатель изменения артериального давления - это отклик на воздействие фактора.

Предполагается, что по группам принимаемые лекарства различаются либо видом, либо дозой, либо еще каким-либо образом. Тогда воздействующий фактор подразделяется на некоторые составляющие, называемые уровнями фактора.

Для сравнения влияния факторов на результат необходим определенный статистический материал. Для этого каждый из «k» способов обработки применяют несколько раз к исследуемому объекту и регистрируют результаты. Итогом этих испытаний являются «k» выборк разных объемов.

В зависимости от количества изучаемых факторов дисперсионный анализ делится на однофакторный и многофакторный.

В примере с изменением артериального давления можно исследовать:

  • фактор времени года (уровни: зима, весна, лето, осень);

  • фактор места эксперимента (уровни: лечение в стационаре или дома);

  • фактор режима (уровни: постельный, обычный или регулярные пешие прогулки на свежем воздухе) и т.п.

Выборочные данные оформляют в виде таблицы.

Данные для однофакторного дисперсионного анализа

Номер испытания

Уровень фактора А

A1

A2

Ak

1

x11

x12

x1k

2

x21

x22

x2k

...

nj

Групповое среднее

Основная цель дисперсионного анализа состоит в разбиении выборочной дисперсии на две компоненты:

  • перваяэто факторная дисперсия, она соответствует влиянию фактора на изменчивость средних значений;

  • вторая – это остаточная дисперсия, она обусловлена случайными причинами и не влияет на изменчивость средних значений).

Для численной оценки влияния исследуемого фактора используют сравнение этих компонент с помощью критерия Фишера.

Факторная дисперсия ( ) – это дисперсия, которая соответствует влиянию фактора на изменение средних значений выборки:

,

где - факторная сумма квадратов отклонений, k - количество уровней фактора, r -количество значений в каждой группе, - общая средняя, - групповая средняя.

Остаточная дисперсия ( ) – это дисперсия, возникающая по случайными причинами и не влияющая на изменение средних значений выборки:

,

где - остаточная сумма квадратов отклонений.

Общая дисперсия – это сумма факторной и остаточной дисперсий:

,

где

Однофакторный дисперссионный анализ – система статистических методов исследования действия на признак только одного фактора.

Метод однофакторного дисперсионного анализа применяется в тех случаях, когда исследуются изменения результативного признака под влиянием изменяющихся условий или градаций какого-либо фактора.

Порядок проведения однофакторного дисперсионного анализа.

1) Формулируем нулевую и альтернативную гипотезы:

  • Н0: групповые генеральные средние равны . Различие выборочных средних получилось случайно, фактор влияния не оказывает.

  • H1: различие между выборочными средними не случайно и обусловлено влиянием фактора.

2) Задается уровень значимости «р» (в фармации, медицине и биологии р=0,05).

3) Вычисляются и

  • Если , то принимается нулевая гипотеза.

  • Если , то вычисляется критерий, который имеет распределение Фишера-Снедекора: .

4) По таблицам критических значений распределения Фишера-Снедекора, соответственно числам степеней свободы f1=k-1 и f2=k(r-1), находится .

5) Сравниваются и :

  • Если < , то при заданном уровне значимости нулевая гипотеза Н0 принимается и делают вывод, что фактор не влияет существенно на средние значения.

  • Если > , то нулевая гипотеза отвергается и влияние фактора признается существенным.

Поведение критерия «F» напрямую связано с принятием или отвержением нулевой гипотезы о равенстве средних, расчитанных по выборкам.

Критерий «F» называют дисперсионным отношением. Результат дисперсионного анализа сводят в таблицу:

Источник вариации, дисперсии

Сумма квадратов

отклонений

Число степеней свободы

Средний квадрат MS

Межгрупповая (фактор А)

k-1

Внутригрупповая (остаточная)

k(r-1)

Общая

n-1

Пример. Влияние курения на заболеваемость дыхательных путей.

Среди взрослого населения определенной возрастной категории фиксировалось число заболеваний дыхательных путей за два года. Цель исследования – статистическое доказательство влияния курения на заболеваемость дыхательных путей.

Случайным образом были отобраны 3 группы по 4 человека каждая, из них: 1 группа - некурящие, 2 группа - стаж курильщика - до 5 лет, 3 группа - стаж курильщика более 5 лет.

Таким образом, исследуемый фактор «А» - курение, уровни фактора, А1, А2, А3 - стаж курильщика. Отклик на фактор курения - число заболеваний дыхательных путей.

Были получены 12 значений числа заболеваний – , где j - номер уровня фактора (j=1, 2, 3), i - номер элемента в соответствующей выборке (группе), i =1, 2, 3, 4:

Предполагаем, что - выборка из нормальной генеральной совокупности.

Все данные необходимо занести в таблицу:

Номер испытания

Уровень фактора «А»

A1

A2

А3

1

1

3

3

2

0

2

4

3

1

2

5

4

2

1

3

Групповое среднее

4/4=1

8/4=2

15/4=3,75

Алгоритм решения:

1. Вычисляются:

  • Общая средняя:

  • Факторная сумма квадратов отклонений:

  • Остаточная сумма квадратов отклонений:

  • Общая сумма квадратов отклонений:

  • Факторная дисперсия:

  • Остаточная дисперсия:

2. Полученные данные заносятся в таблицу:

Источник вариации, дисперсии

Сумма квадратов

отклонений

Число степеней свободы

Средний квадрат S2

Межгрупповая (фактор А)

=15,5

k-1=3-1=2

=

=7,75

=

7,75/0,75=10,3

(0,05;2;9)=4,26

Внутригрупповая (оста-точная)

=6,75

k(r-1) =

=3(4-1)=9

=

=0,75

Общая

=22,25

n-1=

=12-1=11

3. Сравниваются и :

> – значит нулевая гипотеза отвергается и влияние фактора признается существенным, т.е. фактор курения значимо влияет на заболеваемость дыхательных путей.

Двухфакторный дисперсионный анализ – система статистических методов исследования действия на признак двух организованных факторов.

Двухфакторный дисперсионный анализ позволяет оценить не только влияние каждого из факторов в отдельности, но и их взаимодействие.

4. Иллюстративный материал: презентация, слайды.