МИНОБРНАУКИ РОССИИ
Санкт-Петербургский государственный
электротехнический университет
«ЛЭТИ» им. В.И. Ульянова (Ленина)
Кафедра БТС
лАБОРАТОРНАЯ РАБОТА №4
по дисциплине «Планирование медико-биологического эксперимента»
Вариант № 1
Студент гр. 7501 |
|
Исаков А.О. |
Преподаватель |
|
Сидорова М. А. |
Санкт-Петербург
2019 г.
Лабораторная работа 4: «Мощность критерия Стьюдента. Размер выборки.»
Цель работы: определение объема выборки и мощности критерия значимости различий
параметров ЭКГ.
Задание к лабораторной работе:
Требуется найти мощность критерия Стьюдента, используемого в лабораторной работе 2 для проверки гипотезы об отсутствии различий значения признака ApEn (1) в двух классах (пусть дисперсии в исследуемых совокупностях равны!). Рассчитать минимальное количество измерений для решения поставленной задачи.
Для выполнения задания необходимо:
1) Загрузить данные в R:
- создать таблицу в Excel, состоящую из двух столбцов данных: в соответствии с заданием, столбец 1 должен включать значения признака ApEn (1) для 25 объектов из группы 1, а столбец 2 – значения признака ApEn (1) для 25 объектов из группы 2;
- создать файл формата *.txt, в который скопировать таблицу с данными из Excel, при этом необходимо проконтролировать, что в созданном текстовом файле нет никаких имён, только числа, разделителем десятичной части которых является точка;
- загрузить таблицу с данными в R, используя функцию read.table(“name.txt”), где name – имя созданного текстового файла, помещённого в рабочую папку программы.
2) Создать в R две переменные, соответствующие столбцам загруженной таблицы данных. Таблица данных является матрицей!
Примечание: пусть имена загружаемых в R файлов и создаваемых переменных содержат только латинские буквы и цифры, причём имя должно начинаться с буквы.
3) С помощью R рассчитать значения величины эффекта (δ), обобщенного стандартного отклонения (s), размера каждой выборки данных (n) и квантиля Стьюдента (а=5 %), найти значение мощности критерия.
Примечание: величину эффекта δ нужно принять равной разнице средних значений для двух выборок данных.
4) Рассчитать, используя R, минимально необходимое количество измерений для решения задачи сравнения значений признака ApEn(1) в двух классах. При этом принять достаточный уровень мощности критерия Стьюдента равным 80 %. Вычисления выполняются итеративно, поскольку требуется указать число степеней свободы для определения квантилей Стьюдента (пусть для первой итерации n=10).
5) Используя функцию power.t.test(), получить значение мощности критерия Стьюдента (power), указав такие аргументы функции как n = n, delta = δ, sd = s, sig.level = 0.05, аргументам type и alternative задать значения в соответствии с задачей, поставленной в лабораторной работе 2.
6) Используя функцию power.t.test(), получить минимально необходимый размер каждой выборки данных (n) для достижения значения мощности критерия равного 80 %. Для этого нужно указать такие аргументы функции как delta = δ, sd = s, sig.level = 0.05, power = 0.8, аргументам type и alternative задать значения в соответствии с задачей, поставленной в лабораторной работе 2.
Загружаемые в R данные:
№ |
ApEn(1) МА |
ApEn(1) ЧЭ |
1 |
1.434 |
0.553 |
2 |
1.480 |
0.670 |
3 |
1.307 |
0.697 |
4 |
1.235 |
0.702 |
5 |
1.345 |
0.729 |
6 |
1.265 |
0.708 |
7 |
1.201 |
0.696 |
8 |
1.228 |
0.777 |
9 |
1.840 |
0.279 |
10 |
1.806 |
0.189 |
11 |
1.040 |
0.680 |
12 |
1.875 |
0.218 |
13 |
1.078 |
0.697 |
14 |
1.058 |
0.716 |
15 |
1.140 |
0.683 |
16 |
1.975 |
0.158 |
17 |
1.232 |
0.579 |
18 |
1.339 |
0.452 |
19 |
1.295 |
0.577 |
20 |
1.465 |
0.472 |
21 |
0.808 |
0.497 |
22 |
1.449 |
0.678 |
23 |
1.315 |
0.460 |
24 |
1.444 |
0.612 |
25 |
1.245 |
0.663 |
Код программы в R:
a1 = read.table("B:\\Документы\\R\\Лаба 4\\DataFile4.txt");
m=matrix(nrow=2 , ncol=1)
d=matrix(nrow=2 , ncol=1)
n=matrix(nrow=2 , ncol=1)
data=matrix(nrow=25 , ncol=2)
data[,1]=a1[,1]; #МА
data[,2] = a1[,2]; #ЧЭ
m[1,1] = mean(data[,1]);
m[2,1] = mean(data[,2]);
d[1,1] = var(data[,1]);
d[2,1] = var(data[,2]);
n[1,1] = length(data[,1]);
n[2,1] = length(data[,2]);
delta = abs(m[1,1]-m[2,1]);
D = (d[1,1]+d[2,1])/(n[1,1]+n[2,1]-2);
SKO = sqrt(D);
#квантиль стьюдента для a=0.05/2, n=2*(n1-1))
t = qt(0.975, 2*(n[1,1]-1));
tpow = delta/sqrt(2*D/n[1,1])-abs(t);
#определение минимального объема выборки
nmin=2*((abs(qt(0.975, 2*(n[1,1]-1)))+abs(qt(0.8, 2*(n[1,1]-1))))^2)*D/(delta^2);
# определение уровня мощности критерия
power.t.test(n=n[1,1], delta = delta, sd = sqrt(D), sig.level = 0.05);
#определение минимального числа элементов
power.t.test(delta = delta, sd = sqrt(D), sig.level = 0.05, power = 0.8);
Полученные значения:
> delta # значение величины эффекта
[1] 0.79028
> SKO # обобщенное стандартное отклонение
[1] 0.04793
> n[1,1] # размер выборок данных
[1] 25
power.t.test(n=n[1,1], delta = delta, sd = sqrt(D), sig.level = 0.05);
Two-sample t test power calculation
n = 25
delta = 0.79028
sd = 0.04793071
sig.level = 0.05
power = 1
alternative = two.sided
NOTE: n is number in *each* group
> #определение минимального числа элементов
> power.t.test(delta = delta, sd = sqrt(D), sig.level = 0.05, power = 0.8);
Two-sample t test power calculation
n = 1.528613
delta = 0.79028
sd = 0.04793071
sig.level = 0.05
power = 0.8
alternative = two.sided
NOTE: n is number in *each* group
Так как две выборки данных имеют довольно сильное расхождение в значениях (различия между двумя группами данных значительны), получили большое значение квантиля и использовании формулы
Значение квантиля: > tpow
[1] 56.283136
Следовательно можем представить что значение сильно больше максимально возможного, -> значение мощности = 1.
Действительно, при использовании функции
power.t.test(n=n[1,1], delta = delta, sd = sqrt(D), sig.level = 0.05)
Получили значение мощности критерия, равное 1, следовательно, расчеты
верны, что в свою очередь объясняет столь малое значение минимального
размера выборки n = 1.528613.Утверждение следует из формулы:
Выводы: Если разница между значениями регистрируемого параметра в
исследуемых группах мала, а внутригрупповой разброс значений достаточно велик, то мощности критерия может быть недостаточно, чтобы обнаружить
реально существующие различия. В таком случае требуемого уровня
мощности можно добиться, увеличив размер выборки. Так как в нашем
случае две выборки данных имеют довольно сильное расхождение в значениях (различия между двумя группами данных значительны), адекватное применение мощности критерия не предоставляется возможным.