Скачиваний:
72
Добавлен:
25.12.2019
Размер:
23.55 Кб
Скачать

МИНОБРНАУКИ РОССИИ

Санкт-Петербургский государственный

электротехнический университет

«ЛЭТИ» им. В.И. Ульянова (Ленина)

Кафедра БТС

лАБОРАТОРНАЯ РАБОТА №3

по дисциплине «Планирование медико-биологического эксперимента»

Вариант № 1

Студент гр. 7501

Исаков А.О.

Преподаватель

Сидорова М. А.

Санкт-Петербург

2019 г.

Лабораторная работа 3: «Однофакторный дисперсионный анализ»

Цель работы: изучение и освоение дисперсионного критерия для сравнения независимых совокупностей.

Задание к лабораторной работе:

Требуется проверить статистическую гипотезу об отсутствии различий значения признака ApEn (1) в нескольких наборах данных, используя для этого однофакторный дисперсионный анализ.

Для выполнения задания необходимо:

1) Загрузить данные в R:

- создать таблицу в Excel, состоящую из двух столбцов данных: столбец 1 должен включать значения признака ApEn (1) для трёх классов (НР, ЧЭ и МА) (по 25 значений для трёх классов; выстраиваем друг под другом 3 столбика с данными), а столбец 2 – имя класса для каждого значения (буквенное!);

- создать файл формата *.txt, в который скопировать таблицу с данными из Excel (разделителем десятичной части для чисел является точка);

- загрузить таблицу с данными в R, используя функцию read.table(“name.txt”), где name – имя созданного текстового файла, помещённого в рабочую папку программы.

2) Создать в R три переменные, соответствующие трём выборкам данных.

Примечание: пусть имена загружаемых в R файлов и создаваемых переменных содержат только латинские буквы и цифры, причём имя должно начинаться с буквы.

3) В соответствии с методом однофакторного дисперсионного анализа, необходимо с помощью R:

- получить значения используемых для расчетов статистик,

- записать формулы для расчета межгрупповой и внутригрупповой дисперсий,

- получить значение статистического критерия,

- найти число степеней свободы критерия,

- найти критическое значение критерия (в R или используя таблицы квантилей распределения Фишера) для уровня значимости 5%,

- принять или опровергнуть нулевую гипотезу, используя для этого критическое значение.

4) Используя в R функцию anova(aov( )), где аргументом функции является модель данных, получить значения межгрупповой и внутригрупповой дисперсий, а также значение критерия F и р-значение критерия. Принять или отклонить нулевую гипотезу, используя для этого значение p-value.

Примечание: модель представляет собой зависимость значения исследуемого параметра от принадлежности его к определенному классу. В R модель может быть записана как x~y, где x – вектор, содержащий значения параметра для всех классов, а y – вектор с именем класса для каждого измерения.

Загружаемые в R данные:

1.434 HP

1.480 HP

1.307 HP

1.235 HP

1.345 HP

1.265 HP

1.201 HP

1.228 HP

1.840 HP

1.806 HP

1.040 HP

1.875 HP

1.078 HP

1.058 HP

1.140 HP

1.975 HP

1.232 HP

1.339 HP

1.295 HP

1.465 HP

0.808 HP

1.449 HP

1.315 HP

1.444 HP

1.245 HP

1.128 ЧЭ

1.196 ЧЭ

1.057 ЧЭ

1.016 ЧЭ

1.070 ЧЭ

0.988 ЧЭ

0.911 ЧЭ

0.995 ЧЭ

0.977 ЧЭ

0.903 ЧЭ

0.912 ЧЭ

0.876 ЧЭ

0.937 ЧЭ

0.906 ЧЭ

0.956 ЧЭ

0.841 ЧЭ

0.925 ЧЭ

0.884 ЧЭ

0.995 ЧЭ

0.885 ЧЭ

0.603 ЧЭ

1.165 ЧЭ

0.902 ЧЭ

1.045 ЧЭ

1.012 ЧЭ

0.553 MA

0.670 MA

0.697 MA

0.702 MA

0.729 MA

0.708 MA

0.696 MA

0.777 MA

0.279 MA

0.189 MA

0.680 MA

0.218 MA

0.697 MA

0.716 MA

0.683 MA

0.158 MA

0.579 MA

0.452 MA

0.577 MA

0.472 MA

0.497 MA

0.678 MA

0.460 MA

0.612 MA

0.663 MA

Код программы в R:

cat("\014")

rm(list=ls(all=TRUE))

a1=read.table("B:/Документы/R/Лаба 3/DataFile3.txt")

dim(a1)

p=matrix(nrow=25, ncol=3)

m=matrix(nrow=3,ncol=1)

K=matrix(nrow=25, ncol=3)

p[,1]=a1[1:25,1:1]

p[,2]=a1[26:50,1:1]

p[,3]=a1[51:75,1:1]

m[1,1]=mean(p[,1])

m[2,1]=mean(p[,2])

m[3,1]=mean(p[,3])

#общее среднее

M=(m[1,1]+m[2,1]+m[3,1])/3

#сумма квадратов отклонений вариант от общей средней -> R общая

for (i in 1:25){

for (j in 1:3){

K[i,j]=p[i,j]^2

}

}

RO=sum(K[,1])+sum(K[,2])+sum(K[,3])-25*3*M^2

RF=sum(p[,1])^2/25+sum(p[,2])^2/25+sum(p[,3])^2/25-(sum(p[,1])+sum(p[,2])+sum(p[,3]))^2/75

ROS=RO-RF

SF=RF/(3-1)

SOST=ROS/(75-3)

f=SF/SOST

#Для уровня значимости 0.05, чисел степеней свободы 2 и 72 находим fкр из таблицы распределения Фишера-Снедекора.

#fкр(0.05; 2; 72) = 3.12

#В связи с тем, что fнабл > fкр, нулевую гипотезу о существенном влиянии фактора на результаты экспериментов принимаем (нулевую гипотезу о равенстве групповых средних отвергаем). Другими словами, групповые средние в целом различаются значимо.

P=matrix(nrow=75 , ncol=1)

name=matrix(nrow=75, ncol=1)

name[,1]=a1[1:75,2]

P[,1]=(p[,1:3])

a=anova(aov(P~name))

Полученные значения:

Межгрупповая дисперсия: 7.81

Внутригрупповая дисперсия: 2.98

Кол-во степеней свободы критерия: df1=2 df2=72

Критическое значение критерия: 3.12

Расчетное значение критерия: 94.11

Так как расчетное значение критерия больше критического, нулевая

гипотеза не соблюдается.

Результат работы функции anova( ) :

Df

Sum Sq

Mean Sq

F value

Pr(>F)

name

2

7.806892

3.90344596

94.11014

8.159978e-21

Residuals

72

2.986374

0.04147742

NA

NA

Заключение: Так как значение p-value меньше, чем уровень значимости критерия, нулевая гипотеза не соблюдается.

Вывод: На основе дисперсионного анализа было выявлено невыполнение нулевой гипотезы: нулевая гипотеза заключается в том, что математические ожидания генеральных совокупностей одинаковы: Н0: μ1 = μ2 = … = μс. Альтернативная гипотеза гласит, что не все математические ожидания одинаковы: Н1: не все μj одинаковы j = 1, 2, …, с). Данные заключения были основаны на том, что расчетное значение F критерия больше, чем табличное критическое значение распределения Фишера.

Соседние файлы в папке Лаба 3