Скачиваний:
0
Добавлен:
06.02.2025
Размер:
236.27 Кб
Скачать

МИНОБРНАУКИ РОССИИ САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ ЭЛЕКТРОТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ «ЛЭТИ» ИМ. В.И. УЛЬЯНОВА (ЛЕНИНА) Кафедра биотехнических систем

ОТЧЕТ по лабораторной работе №4

по дисциплине «Планирование эксперимента» Тема: Мощность критерия Стьюдента. Размер выборки

Вариант 19

Студентка гр. 0501

 

Слободина Ю.А.

Преподаватель

 

 

Шевченко Д.С.

Санкт-Петербург

2023

Задание: Требуется найти мощность критерия Стьюдента,

используемого в лабораторной работе 2 для проверки гипотезы об отсутствии различий значения признака ApEn (1) в двух классах (пусть дисперсии в исследуемых совокупностях равны!). Рассчитать минимальное количество измерений для решения поставленной задачи.

Для выполнения задания необходимо: 1) Загрузить данные в R:

- создать таблицу в Excel, состоящую из двух столбцов данных: в

соответствии с заданием, столбец 1 должен включать значения признака

ApEn (1) для 25 объектов из группы 1, а столбец 2 – значения признака ApEn

(1)для 25 объектов из группы 2;

-создать файл формата *.txt, в который скопировать таблицу с данными из Excel, при этом необходимо проконтролировать, что в созданном текстовом файле нет никаких имён, только числа, разделителем десятичной части которых является точка;

-загрузить таблицу с данными в R, используя функцию

read.table(“name.txt”), где name – имя созданного текстового файла,

помещённого в рабочую папку программы.

2) Создать в R две переменные, соответствующие столбцам загруженной таблицы данных. Таблица данных является матрицей!

Примечание: пусть имена загружаемых в R файлов и создаваемых переменных содержат только латинские буквы и цифры, причём имя должно начинаться с буквы.

3) С помощью R рассчитать значения величины эффекта (δ),

обобщенного стандартного отклонения (s), размера каждой выборки данных

(n) и квантиля Стьюдента (а=5 %), найти значение мощности критерия.

Примечание: величину эффекта δ нужно принять равной разнице средних значений для двух выборок данных.

4)Рассчитать, используя R, минимально необходимое количество измерений для решения задачи сравнения значений признака ApEn(1) в двух классах. При этом принять достаточный уровень мощности критерия Стьюдента равным 80 %. Вычисления выполняются итеративно, поскольку требуется указать число степеней свободы для определения квантилей Стьюдента (пусть для первой итерации n=10).

5)Используя функцию power.t.test(), получить значение мощности критерия Стьюдента (power), указав такие аргументы функции как n = n, delta

=δ, sd = s, sig.level = 0.05, аргументам type и alternative задать значения в соответствии с задачей, поставленной в лабораторной работе 2.

6)Используя функцию power.t.test(), получить минимально необходимый размер каждой выборки данных (n) для достижения значения мощности критерия равного 80 %. Для этого нужно указать такие аргументы функции как delta = δ, sd = s, sig.level = 0.05, power = 0.8, аргументам type и

alternative задать значения в соответствии с задачей, поставленной в лабораторной работе 2.

Ход работы:

1) Загрузка данных в R

a=read.table("C:/Users/Пользователь/Desktop/4 курс/ПМБЭ/lr1 пмбэ/19.txt") > read.table("C:/Users/Пользователь/Desktop/4 курс/ПМБЭ/lr1 пмбэ/19.txt")

V1 V2

11.013 0.705

20.890 0.597

30.473 0.419

41.164 0.552

51.135 0.587

61.024 0.513

70.991 0.446

80.957 0.665

90.984 0.419

101.133 0.590

111.017 0.524

120.974 0.449

130.959 0.680

140.982 0.416

150.981 0.477

160.914 0.677

170.957 0.574

181.099 0.640

191.164 0.512

201.071 0.604

211.087 0.539

221.172 0.575

231.151 0.636

240.975 0.581

250.997 0.711

m=matrix(nrow=2 , ncol=1) d=matrix(nrow=2 , ncol=1) n=matrix(nrow=2 , ncol=1) data=matrix(nrow=25 , ncol=2) data[,1]=a[,1]

data[,2] = a[,2]

m[1,1] = mean(data[,1]) #среднее значение выборки

[1] 1.01056

m[2,1] = mean(data[,2]) [1] 0.56352

d[1,1] = var(data[,1]) # дисперсия выборки

0.01948684

d[2,1] = var(data[,2]) [1] 0.00831751

n[1,1] = length(data[,1]) # размер выборок данных

[1] 25

n[2,1] = length(data[,2] [1] 25

delta = abs(m[1,1]-m[2,1]) #значение величины эффекта

[1] 0.44704

D = (d[1,1]+d[2,1])/(n[1,1]+n[2,1]-2) [1] 0.0005792573

SKO = sqrt(D) # обобщенное стандартное отклонение

[1] 0.02406776

t = qt(0.975, 2*(n[1,1]-1)) #квантиль стьюдента для a=0.05/2, n=2*(n1-1)) [1] 2.010635

tpow = delta/sqrt(2*D/n[1,1])-abs(t) #Значение квантиля

[1] 63.65916

nmin=2*((abs(qt(0.975, 2*(n[1,1]-1)))+abs(qt(0.8, 2*(n[1,1]-1))))^2)*D/(delta^2)

#определение минимального объема выборки

[1] 0.04741139

power.t.test(n=n[1,1], delta = delta, sd = sqrt(D), sig.level = 0.05) # определение уровня мощности критерия

Two-sample t test power calculation

n = 25

delta = 0.44704 sd = 0.02406776

sig.level = 0.05

power = 1 alternative = two.sided

NOTE: n is number in *each* group

power.t.test(delta = delta, sd = sqrt(D), sig.level = 0.05, power = 0.8)

#определение минимального числа элементов

Two-sample t test power calculation

n = 1.503091 delta = 0.44704

sd = 0.02406776 sig.level = 0.05

power = 0.8 alternative = two.sided

NOTE: n is number in *each* group

Вывод: Если разница между значениями регистрируемого параметра в исследуемых группах мала, а внутригрупповой разброс значений достаточно велик, то мощности критеря может быть недостаточно, чтобы обнаружить реально существующие различия. В таком случае требуемого уровня мощности можно добиться, увеличив размер выборки. Так как в нашем случае две выборки данных имеют довольно сильное расхождение в значениях (различия между двумя группами данных значительны),

адекватное применение мощности критерия не предоставляется возможным.

Соседние файлы в предмете Планирование медико-биологического эксперимента