
лр4
.pdfМИНОБРНАУКИ РОССИИ САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ ЭЛЕКТРОТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ «ЛЭТИ» ИМ. В.И. УЛЬЯНОВА (ЛЕНИНА) Кафедра биотехнических систем
ОТЧЕТ по лабораторной работе №4
по дисциплине «Планирование эксперимента» Тема: Мощность критерия Стьюдента. Размер выборки
Вариант 19
Студентка гр. 0501 |
|
Слободина Ю.А. |
|
Преподаватель |
|
|
Шевченко Д.С. |
Санкт-Петербург
2023
Задание: Требуется найти мощность критерия Стьюдента,
используемого в лабораторной работе 2 для проверки гипотезы об отсутствии различий значения признака ApEn (1) в двух классах (пусть дисперсии в исследуемых совокупностях равны!). Рассчитать минимальное количество измерений для решения поставленной задачи.
Для выполнения задания необходимо: 1) Загрузить данные в R:
- создать таблицу в Excel, состоящую из двух столбцов данных: в
соответствии с заданием, столбец 1 должен включать значения признака
ApEn (1) для 25 объектов из группы 1, а столбец 2 – значения признака ApEn
(1)для 25 объектов из группы 2;
-создать файл формата *.txt, в который скопировать таблицу с данными из Excel, при этом необходимо проконтролировать, что в созданном текстовом файле нет никаких имён, только числа, разделителем десятичной части которых является точка;
-загрузить таблицу с данными в R, используя функцию
read.table(“name.txt”), где name – имя созданного текстового файла,
помещённого в рабочую папку программы.
2) Создать в R две переменные, соответствующие столбцам загруженной таблицы данных. Таблица данных является матрицей!
Примечание: пусть имена загружаемых в R файлов и создаваемых переменных содержат только латинские буквы и цифры, причём имя должно начинаться с буквы.
3) С помощью R рассчитать значения величины эффекта (δ),
обобщенного стандартного отклонения (s), размера каждой выборки данных
(n) и квантиля Стьюдента (а=5 %), найти значение мощности критерия.
Примечание: величину эффекта δ нужно принять равной разнице средних значений для двух выборок данных.
4)Рассчитать, используя R, минимально необходимое количество измерений для решения задачи сравнения значений признака ApEn(1) в двух классах. При этом принять достаточный уровень мощности критерия Стьюдента равным 80 %. Вычисления выполняются итеративно, поскольку требуется указать число степеней свободы для определения квантилей Стьюдента (пусть для первой итерации n=10).
5)Используя функцию power.t.test(), получить значение мощности критерия Стьюдента (power), указав такие аргументы функции как n = n, delta
=δ, sd = s, sig.level = 0.05, аргументам type и alternative задать значения в соответствии с задачей, поставленной в лабораторной работе 2.
6)Используя функцию power.t.test(), получить минимально необходимый размер каждой выборки данных (n) для достижения значения мощности критерия равного 80 %. Для этого нужно указать такие аргументы функции как delta = δ, sd = s, sig.level = 0.05, power = 0.8, аргументам type и
alternative задать значения в соответствии с задачей, поставленной в лабораторной работе 2.
Ход работы:
1) Загрузка данных в R
a=read.table("C:/Users/Пользователь/Desktop/4 курс/ПМБЭ/lr1 пмбэ/19.txt") > read.table("C:/Users/Пользователь/Desktop/4 курс/ПМБЭ/lr1 пмбэ/19.txt")
V1 V2
11.013 0.705
20.890 0.597
30.473 0.419
41.164 0.552
51.135 0.587
61.024 0.513
70.991 0.446
80.957 0.665
90.984 0.419
101.133 0.590
111.017 0.524
120.974 0.449
130.959 0.680
140.982 0.416
150.981 0.477
160.914 0.677
170.957 0.574
181.099 0.640
191.164 0.512
201.071 0.604
211.087 0.539
221.172 0.575
231.151 0.636
240.975 0.581
250.997 0.711
m=matrix(nrow=2 , ncol=1) d=matrix(nrow=2 , ncol=1) n=matrix(nrow=2 , ncol=1) data=matrix(nrow=25 , ncol=2) data[,1]=a[,1]
data[,2] = a[,2]
m[1,1] = mean(data[,1]) #среднее значение выборки
[1] 1.01056
m[2,1] = mean(data[,2]) [1] 0.56352
d[1,1] = var(data[,1]) # дисперсия выборки
0.01948684
d[2,1] = var(data[,2]) [1] 0.00831751
n[1,1] = length(data[,1]) # размер выборок данных
[1] 25
n[2,1] = length(data[,2] [1] 25
delta = abs(m[1,1]-m[2,1]) #значение величины эффекта
[1] 0.44704
D = (d[1,1]+d[2,1])/(n[1,1]+n[2,1]-2) [1] 0.0005792573
SKO = sqrt(D) # обобщенное стандартное отклонение
[1] 0.02406776
t = qt(0.975, 2*(n[1,1]-1)) #квантиль стьюдента для a=0.05/2, n=2*(n1-1)) [1] 2.010635
tpow = delta/sqrt(2*D/n[1,1])-abs(t) #Значение квантиля
[1] 63.65916
nmin=2*((abs(qt(0.975, 2*(n[1,1]-1)))+abs(qt(0.8, 2*(n[1,1]-1))))^2)*D/(delta^2)
#определение минимального объема выборки
[1] 0.04741139
power.t.test(n=n[1,1], delta = delta, sd = sqrt(D), sig.level = 0.05) # определение уровня мощности критерия
Two-sample t test power calculation
n = 25
delta = 0.44704 sd = 0.02406776
sig.level = 0.05
power = 1 alternative = two.sided
NOTE: n is number in *each* group
power.t.test(delta = delta, sd = sqrt(D), sig.level = 0.05, power = 0.8)
#определение минимального числа элементов
Two-sample t test power calculation
n = 1.503091 delta = 0.44704
sd = 0.02406776 sig.level = 0.05
power = 0.8 alternative = two.sided
NOTE: n is number in *each* group
Вывод: Если разница между значениями регистрируемого параметра в исследуемых группах мала, а внутригрупповой разброс значений достаточно велик, то мощности критеря может быть недостаточно, чтобы обнаружить реально существующие различия. В таком случае требуемого уровня мощности можно добиться, увеличив размер выборки. Так как в нашем случае две выборки данных имеют довольно сильное расхождение в значениях (различия между двумя группами данных значительны),
адекватное применение мощности критерия не предоставляется возможным.