Скачиваний:
57
Добавлен:
25.12.2019
Размер:
460.08 Кб
Скачать

МИНОБРНАУКИ РОССИИ

Санкт-Петербургский государственный

электротехнический университет

«ЛЭТИ» им. В.И. Ульянова (Ленина)

Кафедра БТС

лАБОРАТОРНАЯ РАБОТА №4

по дисциплине «Планирование медико-биологического эксперимента»

Вариант № 1

Студент гр. 7501

Исаков А.О.

Преподаватель

Сидорова М. А.

Санкт-Петербург

2019 г.

Лабораторная работа 4: «Мощность критерия Стьюдента. Размер выборки.»

Цель работы: определение объема выборки и мощности критерия значимости различий

параметров ЭКГ.

Задание к лабораторной работе:

Требуется найти мощность критерия Стьюдента, используемого в лабораторной работе 2 для проверки гипотезы об отсутствии различий значения признака ApEn (1) в двух классах (пусть дисперсии в исследуемых совокупностях равны!). Рассчитать минимальное количество измерений для решения поставленной задачи.

Для выполнения задания необходимо:

1) Загрузить данные в R:

- создать таблицу в Excel, состоящую из двух столбцов данных: в соответствии с заданием, столбец 1 должен включать значения признака ApEn (1) для 25 объектов из группы 1, а столбец 2 – значения признака ApEn (1) для 25 объектов из группы 2;

- создать файл формата *.txt, в который скопировать таблицу с данными из Excel, при этом необходимо проконтролировать, что в созданном текстовом файле нет никаких имён, только числа, разделителем десятичной части которых является точка;

- загрузить таблицу с данными в R, используя функцию read.table(“name.txt”), где name – имя созданного текстового файла, помещённого в рабочую папку программы.

2) Создать в R две переменные, соответствующие столбцам загруженной таблицы данных. Таблица данных является матрицей!

Примечание: пусть имена загружаемых в R файлов и создаваемых переменных содержат только латинские буквы и цифры, причём имя должно начинаться с буквы.

3) С помощью R рассчитать значения величины эффекта (δ), обобщенного стандартного отклонения (s), размера каждой выборки данных (n) и квантиля Стьюдента (а=5 %), найти значение мощности критерия.

Примечание: величину эффекта δ нужно принять равной разнице средних значений для двух выборок данных.

4) Рассчитать, используя R, минимально необходимое количество измерений для решения задачи сравнения значений признака ApEn(1) в двух классах. При этом принять достаточный уровень мощности критерия Стьюдента равным 80 %. Вычисления выполняются итеративно, поскольку требуется указать число степеней свободы для определения квантилей Стьюдента (пусть для первой итерации n=10).

5) Используя функцию power.t.test(), получить значение мощности критерия Стьюдента (power), указав такие аргументы функции как n = n, delta = δ, sd = s, sig.level = 0.05, аргументам type и alternative задать значения в соответствии с задачей, поставленной в лабораторной работе 2.

6) Используя функцию power.t.test(), получить минимально необходимый размер каждой выборки данных (n) для достижения значения мощности критерия равного 80 %. Для этого нужно указать такие аргументы функции как delta = δ, sd = s, sig.level = 0.05, power = 0.8, аргументам type и alternative задать значения в соответствии с задачей, поставленной в лабораторной работе 2.

Загружаемые в R данные:

ApEn(1) МА

ApEn(1) ЧЭ

1

1.434

0.553

2

1.480

0.670

3

1.307

0.697

4

1.235

0.702

5

1.345

0.729

6

1.265

0.708

7

1.201

0.696

8

1.228

0.777

9

1.840

0.279

10

1.806

0.189

11

1.040

0.680

12

1.875

0.218

13

1.078

0.697

14

1.058

0.716

15

1.140

0.683

16

1.975

0.158

17

1.232

0.579

18

1.339

0.452

19

1.295

0.577

20

1.465

0.472

21

0.808

0.497

22

1.449

0.678

23

1.315

0.460

24

1.444

0.612

25

1.245

0.663

Код программы в R:

a1 = read.table("B:\\Документы\\R\\Лаба 4\\DataFile4.txt");

m=matrix(nrow=2 , ncol=1)

d=matrix(nrow=2 , ncol=1)

n=matrix(nrow=2 , ncol=1)

data=matrix(nrow=25 , ncol=2)

data[,1]=a1[,1]; #МА

data[,2] = a1[,2]; #ЧЭ

m[1,1] = mean(data[,1]);

m[2,1] = mean(data[,2]);

d[1,1] = var(data[,1]);

d[2,1] = var(data[,2]);

n[1,1] = length(data[,1]);

n[2,1] = length(data[,2]);

delta = abs(m[1,1]-m[2,1]);

D = (d[1,1]+d[2,1])/(n[1,1]+n[2,1]-2);

SKO = sqrt(D);

#квантиль стьюдента для a=0.05/2, n=2*(n1-1))

t = qt(0.975, 2*(n[1,1]-1));

tpow = delta/sqrt(2*D/n[1,1])-abs(t);

#определение минимального объема выборки

nmin=2*((abs(qt(0.975, 2*(n[1,1]-1)))+abs(qt(0.8, 2*(n[1,1]-1))))^2)*D/(delta^2);

# определение уровня мощности критерия

power.t.test(n=n[1,1], delta = delta, sd = sqrt(D), sig.level = 0.05);

#определение минимального числа элементов

power.t.test(delta = delta, sd = sqrt(D), sig.level = 0.05, power = 0.8);

Полученные значения:

> delta # значение величины эффекта

[1] 0.79028

> SKO # обобщенное стандартное отклонение

[1] 0.04793

> n[1,1] # размер выборок данных

[1] 25

power.t.test(n=n[1,1], delta = delta, sd = sqrt(D), sig.level = 0.05);

Two-sample t test power calculation

n = 25

delta = 0.79028

sd = 0.04793071

sig.level = 0.05

power = 1

alternative = two.sided

NOTE: n is number in *each* group

> #определение минимального числа элементов

> power.t.test(delta = delta, sd = sqrt(D), sig.level = 0.05, power = 0.8);

Two-sample t test power calculation

n = 1.528613

delta = 0.79028

sd = 0.04793071

sig.level = 0.05

power = 0.8

alternative = two.sided

NOTE: n is number in *each* group

Так как две выборки данных имеют довольно сильное расхождение в значениях (различия между двумя группами данных значительны), получили большое значение квантиля и использовании формулы

Значение квантиля: > tpow

[1] 56.283136

Следовательно можем представить что значение сильно больше максимально возможного, -> значение мощности = 1.

Действительно, при использовании функции

power.t.test(n=n[1,1], delta = delta, sd = sqrt(D), sig.level = 0.05)

Получили значение мощности критерия, равное 1, следовательно, расчеты

верны, что в свою очередь объясняет столь малое значение минимального

размера выборки n = 1.528613.Утверждение следует из формулы:

Выводы: Если разница между значениями регистрируемого параметра в

исследуемых группах мала, а внутригрупповой разброс значений достаточно велик, то мощности критерия может быть недостаточно, чтобы обнаружить

реально существующие различия. В таком случае требуемого уровня

мощности можно добиться, увеличив размер выборки. Так как в нашем

случае две выборки данных имеют довольно сильное расхождение в значениях (различия между двумя группами данных значительны), адекватное применение мощности критерия не предоставляется возможным.

Соседние файлы в папке Лаба 4