
- •Введение
- •Структура медико-биологического эксперимента
- •Требования к модели:
- •Показатели описательной статистики можно разбить на несколько групп:
- •Вариационный размах
- •Оценка достоверности результатов измерений
- •Задание № 1.
- •Задание № 2.
- •Задание № 3.
- •Результаты выполнения задания оформить на отдельном листе. Лист назовите «Задание 3».
- •Регрессионный анализ
- •Задание №4.
- •Результаты выполнения задания оформить на отдельном листе. Лист назовите «Задание 4».
Задание №4.
Имеются данные измерений роста X (см) и веса Y (кг) новорождённых:
Xi |
50 |
49 |
51 |
48 |
51 |
52 |
50 |
52 |
53 |
50 |
54 |
51 |
55 |
53 |
52 |
Yi |
3,2 |
2,9 |
3,3 |
2,6 |
3,1 |
3,5 |
3,0 |
3,7 |
3,8 |
3,4 |
4,1 |
3,5 |
4,0 |
3,7 |
3,6 |
Проведите регрессионный анализ при помощи программы Excel.
Рассчитайте коэффициенты регрессии по формулам (21).
Постройте корреляционное поле.
На диаграмме корреляционного поля, с помощью контекстного меню точки построения, добавьте линию тренда (соответствующую типу регрессии) и укажите параметры: «показывать уравнение на диаграмме».
сравните коэффициенты регрессии, рассчитанные по формулам (21) и показанные в уравнении на линии тренда.
Результаты выполнения задания оформить на отдельном листе. Лист назовите «Задание 4».
Простая линейная регрессия может быть построена и в программе Excel для Windows («Сервис\Анализ данных\Регрессия»).
Можно использовать полиномиальную регрессию, в которой предполагается, что зависимая переменная является полиномом некоторой степени от независимой переменной (напомним, что линейная зависимость является полиномом первой степени). Например, полиномом второй степени будет зависимость вида
y = a x2 + b x + c и задачей регрессии будет нахождение коэффициентов a, b и c.
При этом следует помнить, что построенная модель «локальна», то есть, получена для некоторых вполне конкретных значений переменных. Экстраполяция результатов модели на более широкие области значений переменных может привести к ошибочным выводам. Например, если моделировать эндотоксикоз путем повреждения ткани поджелудочной железы, то к токсическому компоненту присоединится банальный протеолитический компонент от ферментов разрушающейся железы. Соответствующие крайне высокие значения прогнозироваться данной моделью на основе регрессионного анализа, естественно, не будут. При хроническом токсическом процессе необратимые изменения в печени и почках по-иному будут воздействовать на формирование пула, занижая значения показателя, предсказанные формулой регрессии.
Таблица 1 Граничные значения t - критерия Стьюдента
Число степеней свободы |
Доверительная вероятность |
||
|
P=0,95 |
P=0,99 |
P=0,999 |
1 |
12,706 |
63,657 |
636,619 |
2 |
4,303 |
9,925 |
31,598 |
3 |
3,182 |
5,841 |
12,941 |
4 |
2,776 |
4,604 |
8,610 |
5 |
2,571 |
4,032 |
6,859 |
6 |
2,447 |
3,707 |
5,959 |
7 |
2,365 |
3,499 |
5,405 |
8 |
2,306 |
3,355 |
5,041 |
9 |
2,262 |
3,250 |
4,781 |
10 |
2,228 |
3,169 |
4,587 |
11 |
2,201 |
3,106 |
4,487 |
12 |
2,179 |
3,055 |
4,318 |
13 |
2,160 |
3,012 |
4,221 |
14 |
2,145 |
2,977 |
4,140 |
15 |
2,131 |
2,947 |
4,073 |
16 |
2,120 |
2,921 |
4,015 |
17 |
2,110 |
2,898 |
3,965 |
18 |
2,101 |
2,878 |
3,922 |
19 |
2,093 |
2,861 |
3,883 |
20 |
2,086 |
2,845 |
3,850 |
21 |
2,080 |
2,831 |
3,819 |
22 |
2,074 |
2,819 |
3,792 |
23 |
2,069 |
2,807 |
3,767 |
24 |
2,064 |
2,797 |
3,745 |
25 |
2,060 |
2,787 |
3,725 |
26 |
2,056 |
2,779 |
3,707 |
27 |
2,052 |
2,771 |
3,690 |
28 |
2,048 |
2,763 |
3,674 |
29 |
2,045 |
2,756 |
3,659 |
30 |
2,042 |
2,750 |
3,646 |
31-34 |
2,0 |
2,7 |
3,6 |
35-42 |
2,0 |
2,7 |
3,6 |
43-62 |
2,0 |
2,7 |
3,5 |
63-175 |
2,0 |
2,6 |
3,4 |
более 175 |
2,0 |
2,6 |
3,3 |
|
=0,05 |
=0,01 |
=0,001 |
|
Уровень значимости |
Таблица даёт значения введённой Стьюдентом величины t для уровней значимости , наиболее часто применяющихся при нахождении критериев значимости и границ доверительного интервала.
Доверительная вероятность P=1- .
Вопросы для самоконтроля
Что понимается под термином «эксперимент»?
Какие функции выполняет научный эксперимент?
В зависимости от продолжительности, какие виды эксперимента различают?
Что в себя включают этапы постановки и проведения эксперимента?
Что такое моделирование?
Какие требования предъявляются к модели?
Для чего используется «контрольная группа» в эксперименте?
Какие этапы включает в себя анализ экспериментальных данных? Дайте их краткое описание.
Дайте определение совокупности. Из чего состоит совокупность?
Что такое объем совокупности и как его обозначают?
Дайте определение генеральной совокупности.
Что такое выборка?
Перечислите известные Вам признаки оценки состояния членов совокупности.
Дайте определение варианты.
Что такое «частота»?
Какой ряд называется ранжированным?
Что такое относительная частота?
Дайте определение термину «вариационный ряд».
Дайте определение термину «вариационная кривая».
Что такое мода?
Что такое медиана?
Каков статистический смысл основных характеристик выборки и по каким формулам они вычисляются?
Какие оценки называются точечными?
Какие вы знаете методы статистической обработки данных и каково их назначение?
Опишите алгоритмы известных вам статистических методов.
Какая зависимость называется корреляционной?
Что нужно сделать для качественной оценки связи между признаками, а что для количественной?
Откуда можно сделать вывод: “связь прямая” ?
Какой можно сделать вывод из того, что коэффициент корреляции rxy=0,28?
Как определить тип и глубину корреляционной связи?
О чём говорит теснота расположения точек корреляционного поля?
С какой целью определяют достоверность коэффициента корреляции?
Что собой представляет линейная регрессионная модель?
Что отображает линия регрессии, и для чего её можно использовать?
Для чего используют критерий Стьюдента?