Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИИТ в медицине [Н.Ф.Рожков][2004].doc
Скачиваний:
121
Добавлен:
15.06.2014
Размер:
967.17 Кб
Скачать

5.7 Использование пакета Excel для решения более сложных задач обработки данных

В пакете Ехсеl помимо Мастера функций имеется набор более мощных инструментов для анализа данных, называемый Пакет анализа, который может быть использован для решения задач обработки медицинских данных.

Установка раздела Анализ данных в пакете Ехсеl:

а) в меню Сервис выбрать команду Надстройки;

б) в появившемся списке установить флажок Пакет анализа.

Возможности пакета анализа данных. Ехсеl позволяет проводить следующие методы анализа:

1. Однофакторный дисперсионный анализ.

2. двухфакторный дисперсионный анализ с повторениями.

З. двухфакторный дисперсионный анализ без повторений.

4. Корреляция.

5. Ковариация.

6. Описательная статистика.

7. Экспоненциальное сглаживание.

8. Двухвыборочный F-тест для дисперсий.

9. Анализ Фурье.

10. Гистограмма.

11. Скользящее среднее.

12. Генерация случайных чисел.

13. Ранг и персентиль.

14. Регрессия.

15. Выборка.

16. Парный двухвыборочный t-тест для средних.

17. двухвыборочный t-тест с одинаковыми дисперсиями.

18. Двухвыборочный t-тест с разными дисперсиями.

19. двухвыборочный z-тест для средних.

Ввод данных. Для использования пакета анализа исследуемые данные следует представить в виде таблицы, где столбцами являются соответствующие показатели. При создании таблицы Ехсеl информация вводится в отдельные ячейки. Совокупность ячеек, содержащих анализируемые данные, называется входным диапазоном.

Последовательность обработки данных. Для использования статистического пакета анализа данных необходимо:

а) указать курсором мыши на пункт меню Сервис и щелкнуть левой кнопкой мыши;

б) в спускающемся меню выбрать команду Анализ данных (если команда Анализ данных отсутствует в меню Сервис, то необходимо установить в Ехсеl пакет анализа данных);

в) выбрать необходимую строку в появившемся списке Инструменты анализа;

г) ввести входной и выходной диапазоны и выбрать необходимые параметры.

Описательная статистика. Используется для генерации одномерного статистического отчета, содержащего информацию о центральной тенденции и изменчивости входных данных. Для выполнения процедуры необходимо:

а) команда Сервис>Анализ данных;

б) в появившемся списке инструменты анализа выбрать строку Описательная-статистика и нажать кнопку ОК;

в) в появившемся диалоговом окне указать входной диапазон, т. е. ввести ссылку на ячейки, содержащие анализируемые

данные, для этого следует навести указатель мыши на левую верхнюю ячейку данных, нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к правой нижней ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши.

г) указать выходной диапазон, т. е. ввести ссылку на ячейки, в которые будут выведены результаты анализа. Для этого следует поставить переключатель в положение Выходной диапазон (навести указатель мыши и щелкнуть левой клавишей), далее навести указатель мыши в поле ввода Выходной диапазон и щелкнуть левой кнопкой мыши, затем указатель мыши наводится на левую верхнюю ячейку выходного диапазона и делается щелчок левой кнопкой мыши.

д) в разделе Группировка переключатель устанавливается в положение по столбцам;

е) устанавливается флажок в поле Итоговая статистика.

ж) нажимается кнопка ОК (указатель мыши наводится на кнопку ОК и делается щелчок левой кнопкой).

В результате анализа в указанном выходном диапазоне для каждого столбца данных выводятся следующие статистические характеристики: среднее, стандартная ошибка (среднего), медиана, мода, стандартное отклонение, дисперсия выборки, эксцесс, асимметричность, интервал, минимум, максимум, сумма, счет, наибольшее, наименьшее, уровень надежности.

Демонстрационный пример 3.

В ходе исследования возрастных изменений слуховой функции у детей использовался тест определения эмоциональной составляющей речи в условиях маскировки шумом. Были получены результаты:

Отношение сигнал/шум

Процент правильных ответов

Без шума

78,6

95,2

83,3

85,7

80,4

90,2

-6 дБ

61,9

97,6

61,9

73,8

75,6

68,8

-12 дБ

45,2

97,6

80,9

62,4

70,6

69,2

Необходимо определить основные статистические характеристики в группах результатов.

Решение

Для использования инструментов анализа исследуемые данные следует представить в виде таблицы, где столбцами являются соответствующие показатели. Так, значения процентов правильных ответов при подаче сигнала без шума вводим в диапазон А1:А6, с шумом бдБ — в диапазон В1:В6 и т.д. В результате получим таблицу:

1

2

3

4

5

6

А

78,6

95,2

83,3

85,7

80,4

90,2

В

61,9

97,6

61,9

73,8

75,6

68,8

С

45,2

97,6

80,9

62,4

70,6

69,2

Далее необходимо провести элементарную статистическую обработку. Для этого, указав курсором мыши на пункт меню Сервис, выбираем команду Анализ данных. Затем в появившемся списке Инструменты анализа выбираем строку Описательная статистика. В появившемся диалоговом окне указываем входной диапазон- А1 :С6. Указываем выходной диапазон — ячейку А8. В разделе Группировка переключатель устанавливается в положение по столбцам. Устанавливается флажок в поле Итоговая статистика, и нажимаем кнопку ОК.

В результате анализа в указанном выходном диапазоне для каждого столбца данных получим:

Столбец 1

Столбец 2

Столбец 3

Среднее

85,567

Среднее

73,267

Среднее

70,983

Стандартная ошибка

2,5472

Стандартная ошибка

5,4043

Стандартная ошибка

7,1846

Медиана

84,5

Медиана

71,3

Медиана

69,9

Мода

н/д

Мода

61,9

Мода

н/д

Стандартное отклонение

6,2394

Стандартное отклонение

13,238

Стандартное отклонение

17,599

Дисперсия выборки

38,931

Дисперсия выборки

175,34

Дисперсия выборки

309,71

Эксцесс

-0,6303

Эксцесс

2,5126

Эксцесс

0,7479

Здесь наиболее важными являются показатели Среднее, Стандартная ошибка (среднего) и Стандартное отклонение.

Проверка гипотез. Анализ двух выборок (t-тест Стьюдента). Как указывалось выше, в общем случае необходимо воспользоваться процедурой двухвыборочный t-тест с разными дисперсиями, так как процедуры парный двухвыборочный t-тест для средних и Двухвыборочный t-тест с одинаковыми дисперсиями относятся к частным, специальным случаям (более подробно см. раздел Компьютерный анализ Медицинских данных).

Для выполнения процедуры анализа необходимо:

а) команда Сервис>Анализ данных;

б) в появившемся списке Инструменты анализа выбрать строку Двухвыборочный t-тест с разными дисперсиями, щелкнуть левой кнопкой мыши и нажать кнопку ок;

в) в появившемся диалоговом окне указать Интервал переменной 1, т. е. ввести ссылку на первый диапазон анализируемых данных, содержащий один столбец данных. Для этого следует навести указатель мыши на верхнюю ячейку первого столбца данных, нажать левую кнопку мыши и, не отпускал ее, протянуть указатель мыши к нижней ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши;

г) указать Интервал переменной 2, т. е. ввести ссылку на второй диапазон анализируемых данных, содержащий один столбец данных. Для этого следует навести указатель мыши в поле ввода Интервал переменной 2 и щелкнуть левой кнопкой мыши, затем навести указатель мыши на верхнюю ячейку второго столбца данных, нажать левую кнопку мыши и, не отпускал ее, протянуть указатель мыши к нижней ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши.

д) указать выходной диапазон, т. е. ввести ссылку на ячейки, в которые будут выведены результаты анализа. Для этого следует поставить флажок в левое поле Выходящий диапазон (навести указатель мыши и щелкнуть левой кнопкой), далее навести указатель мыши в правое поле ввода Выходной диапазон и щелкнуть левой кнопкой мыши, затем указатель мыши наводится на левую верхнюю ячейку выходного диапазона и делается щелчок левой кнопкой мыши. Размер выходного диапазона будет определен автоматически, и на экран будет выведено сообщение в случае возможного наложения выходного диапазона на исходные данные.

е) нажимается кнопка ОК.

Результаты анализа. В выходной диапазон будут выведены: средняя, дисперсия и число наблюдений для каждой переменной, гипотетическая разность средних, df (число степеней свободы), значение t-статистики, Р(Т<=t) одностороннее, t критическое одностороннеё, Р(Т<=t) двухстороннее, t критическое двухстороннее.

Интерпретация результатов. Если величина вероятности случайного появления анализируемых выборок ( Р(Т<=t) двух стороннее) меньше уровня значимости (р=0,05) принято считать, что различия между выборками не случайные, т. е. различия достоверные.

Демонстрационный пример 4.

Рассматривалась реакция организма добровольцев в ответ на введение ацетофоса. Измерялась активность холинэстеразы крови у мужчин и женщин через 2 ч после однократного введения ацетофоса в дозе 2 мг/кг веса (в процентах к исходному фону)

1

2

3

4

5

Мужчины

84,5

85,6

92,3

69,2

84,1

Женщины

51,5

75,7

57,6

60,4

Можно ли по этим данным сделать вывод о большей чувствительности женского организма к действию ацетофоса?

Решение

Для решения задач такого типа используются так называемые критерии различия, в частности, t-критерий Стьюдента.

Вводим данные: активность холинэстеразы для мужчин — в диапазон А1 :А5; активность холинэстеразы для женщин — в диапазон В1:В4 (заметим, что в русифицированной версии Ехсеl знаку запятой, отделяющей целую часть от дробной, соответствует "запятая").

Выбор процедуры здесь осуществляется из трех вариантов t-теста и поскольку данные не имеют опарного соответствия, число их различно и говорить о равенстве дисперсий затруднительно, выбираем процедуру Двухвыборочный t- тест с разными дисперсиями.

Для реализации процедуры в пункте меню Сервис выбираем строку Анализ данных и далее указываем курсором мыши на строку Двухвыборочный t- тест с разными дисперсиями.

В появившемся диалоговом окне задаем Интервал переменной 1. для этого наводим указатель мыши на верхнюю ячейку столбца (А1), нажимаем левую кнопку мыши и, не отпуская ее, протягиваем указатель мыши к нижней ячейке (А5), затем отпускаем левую кнопку мыши. Аналогично указываем Интервал переменной 2, т. е. ввести ссылку на диапазон второго столбца В1: В4. далее указываем выходной диапазон. Для этого ставим переключатель в положение Выходной диапазон (навести указатель мыши и щелкнуть левой кнопкой), затем наводим указатель мыши в правое поле ввода Выходной диапазон и, щелкнув левой кнопкой мыши, указатель мыши наводим на левую верхнюю ячейку выходного диапазона (С 1) и делаем щелчок левой кнопкой мыши. Нажимаем кнопку ОК.

Результаты анализа. В выходном диапазоне появятся следующие результаты:

двухвыборочный t-тест с различными дисперсиями

Переменная 1 Переменная 2

Среднее 83,14 61,3

……………………………………….

Р(Т<=t) двухстороннее 0,014190181

……………………………………….

Интерпретация результатов. Средние значения активности холинэстеразы (83% для мужчин и 61% для женщин) довольно сильно отличаются и нулевая гипотеза о том, что разницы между группами нет (т. е. средние выборок равны между собой), отвергается. Это следует из того, что вероятность реализации нулевой гипотезы мала (р0,014, что меньше чем уровень значимости 0,05, т. е. р<О,О5 и величина вероятности случайного появления анализируемых выборок ( Р(Т<=t) двухстороннее) меньше уровня значимости (р можно считать, что различия между выборками не случайные, т. е. различия достоверные.

Таким образом, из приведенных результатов исследования вытекает, что организм женщин более чувствителен к действию ацетофоса, чем мужской организм с уровнем значимости р<О,05.

Корреляционный анализ. Процедура позволяет получить корреляционную матрицу, содержащую коэффициенты корреляции между различными параметрами. Для реализации процедуры необходимо:

а) выполнить команду Сервис>Анализ данных;

б) в появившемся списке Инструменты анализа выбрать строку Корреляция и нажать кнопку ОК;

в) в появившемся диалоговом окне указать входной диапазон, т. е. ввести ссылку на ячейки, содержащие анализируемые данные. Для этого следует навести указатель мыши на левую верхнюю ячейку данных, нажать левую кнопку мыши и, не отпускал ее, протянуть указатель мыши к правой нижней

ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши. Входной диапазон должен содержать не менее двух столбцов.

г) в разделе Группировка переключатель устанавливается в положение по столбцам;

д) указать выходной диапазон, т. е. ввести ссылку на ячейки, в которые будут выведены результаты анализа. Для этого следует поставить флажок в левое поле Выходной диапазон (на вести указатель мыши и щелкнуть левой кнопкой), далее на вести указатель мыши в правое поле ввода Выходной диапазон и щелкнуть левой кнопкой мыши, затем указатель мыши наводится на левую верхнюю ячейку выходного диапазона и делается щелчок левой кнопкой мыши. Размер выходного диапазона будет определен автоматически, и на экран будет выведено сообщение в случае возможного наложения выходного диапазона на исходные данные.

е) нажимается кнопка ОК.

Результаты анализа. В выходной диапазон будет выведена корреляционная матрица, в которой на пересечении соответствующих строки и столбца находится коэффициент корреляции между соответствующими параметрами. Ячейки выходного диапазона, имеющие совпадающие координаты строк и столбцов, содержат значение 1, так как каждый столбец во входном диапазоне полностью коррелирует с самим собой.

Интерпретация результатов. Если коэффициент корреляции (г) по абсолютной величине (без учета знака) больше чем 0,95, то принято считать, что между параметрами существует практически линейная зависимость (прямая при положительном г и обратная при отрицательном г). Если коэффициент корреляции г лежит в диапазоне от 0,8 до 0,95, говорят о сильной степени линейной связи между параметрами. 0,6 < г < 0;8 — говорят о наличии линейной связи между параметрами. При г < 0,4 обычно считают, что линейную взаимосвязь между параметрами выявить не удалось.

Демонстрационный пример 5.

Пусть как в примере 1 исследовались возрастные изменений слуховой функции у детей, и использовался тест определения эмоциональной составляющей речи в условиях маскировки шумом. Были получены результаты

% распознавания

85,6

73,3

71,0

89,1

83,1

76,9

94,5

93,6

86,9

Возраст

7

7

7

11

11

11

15

15

15

Уровень шума

0

6

12

0

6

12

0

6

12

Необходимо выявить, существует ли взаимосвязь между возрастом, уровнем шума и эффективностью распознавания эмоций.

Решение

Для выполнения корреляционного анализа вводим в диапазон А1 :13 исходные данные:

A

B

C

D

E

F

G

H

I

85,6

73,3

71,0

89,1

83,1

76,9

94,5

93,6

86,9

7

7

7

11

11

11

15

15

15

0

6

12

0

6

12

0

6

12

Затем в меню Сервис выбираем пункт Анализ данных и далее указываем строку Корреляция. В появившемся диалоговом окне указываем входной диапазон М :13. Указываем, что данные рассматриваются по строкам. Указываем выходной диапазон. Для этого

ставим флажок в левое поле Выходной диапазон и в правое поле ввода Выходной диапазон вводим А4. Нажимаем кнопку ОК.

Результаты анализа. В выходном диапазоне получаем корреляционную матрицу:

Строка 1

Строка 2

Строка 3

Строка 1

1

Строка 2

0,7687326

1

Строка 3

-0,5863504

0

Интерпретация результатов. Из таблицы видно, что корреляция между процентом распознавания и возрастом равна 0,77, а между процентом распознавания и уровнем шума — -0,59, между уровнем шума и возрастом— г = 0.

Таким образом, в результате анализа выявлены зависимости: сильная степень линейной связи между эффективностью распознавания полезного сигнала и возрастом (г=0,77) и слабая обратная линейная связь между эффективностью распознавания полезного сигнала и уровнем маскирующего шума (г=-0,59).

Регрессионный анализ. Линейный регрессионный анализ заключается в подборе графика и его уравнения для набора наблюдений. Регрессия используется для анализа воздействия на отдельную зависимую переменную значений одной или бол независимых переменных. В Пакете анализа экспериментальные данные аппроксимируются линейным уравнением до 16 порядка:

У = аО + аIхХI + а2хХ2 + ... + а16хХ16

где У — зависимая переменная, ХI, ..., ХI6 — независимые переменные, аО, аI, ..., аIб — искомые коэффициенты регрессии.

Для получения коэффициентов регрессии необходимо:

а) выполнять команду Сервис>Анализ данных;

6) в появившемся диалоговом окне Анализ данных в списке Инструменты анализа выбрать строку Регрессия, указан кур сором мыши и щелкнув левой кнопкой мыши. Затем нажать кнопку Ок;

в) в появившемся диалоговом окне задать Входной интервал У, т. е. ввести ссылку на диапазон анализируемых зависимых данных, содержащий один столбец данных. Для этого следует навести указатель мыши на верхнюю ячейку столбца зависимых данных, нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к нижней ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши;

г) указать Входной интервал Х, т. е. ввести ссылку на диапазон независимых данных, содержащий до 16 столбцов анализируемых данных. Для этого следует навести указатель мыши в поле ввода Входной интервал Х и щелкнуть левой кнопкой мыши, затем навести указатель мыши на верхнюю левую ячейку диапазона независимых данных, нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к нижней правой ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши;

д) указать выходной диапазон, т. е. ввести ссылку на ячейки, в которые будут выведены результаты анализа. Для этого следует поставить переключатель в положение Выходной диапазон (навести указатель мыши и щелкнуть левой кнопкой), далее навести указатель мыши в правое поле ввода Выходной диапазон и щелкнуть левой кнопкой мыши, затем указатель мыши наводится на левую верхнюю ячейку выходного диапазона и делается щелчок левой кнопкой мыши. Размер выходного диапазона будет определен автоматически, и на экран будет вы ведено сообщение в случае возможного наложения выходного диапазона на исходные данные;

е) нажимается кнопка ОК.

Результаты анализа. Выходной диапазон будет включать в себя результаты дисперсионного анализа, коэффициенты регрессии, стандартную погрешность вычисления У, среднеквадратичные отклонения, число наблюдений, стандартные погрешности для коэффициентов.

Интерпретация результатов. Значения коэффициентов регрессии находятся в столбце Коэффициенты и соответствуют:

У-пересечение — а0;

Переменная Х — а1

Переменная Х2 — а2, и т. д.

В столбце Р-Значение приводится достоверность отличия соответствующих коэффициентов от нуля. В случаях, когда Р>0,05, коэффициент может считаться нулевым; это означает, что соответствующая независимая переменная практически не влияет на зависимую переменную.

Приводимое значение R-квадрат характеризует, с какой степенью точности полученное регрессионное уравнение аппроксимирует исходные данные. Если R-квадрат > 0,95, говорят о высокой точности аппроксимации (модель хорошо описывает явление). Если R -квадрат лежит в диапазоне от 0,8 до 0,95, говорят об удовлетворительной аппроксимации (модель в целом адекватна описываемому явлению). Если R-квадрат <0,95 принято считать, что точность аппроксимации недостаточна и модель требует улучшения (введения новых независимых переменных, учета нелинейностей и т.д.).

Демонстрационный пример 6.

Имеются результаты, проводившейся у 8 больных эффективной криодеструкции кожных рубцов различной толщины.

N

Время, мин

Толщина рубца, мм

1

2,4

17

2

0,6

3

3

1,7

12

4

1,0

5

5

1,6

8

6

1,5

9

7

1,8

14

8

3,0

20

Необходимо рассмотреть возможность на основании этих данных определять предполагаемое время криодеструкции.

Решение

Вводим данные: толщина рубца — в диапазон А1 :А8; время криодеструкции в диапазон В1: В8 (заметим, что знаку запятой, отделяющей целую часть от дробной, соответствует "запятая"). В пункте меню Сервис выбираем строку Анализ данных и далее указываем курсором мыши на строку Регрессия. В готовившемся диалоговом окне задаем Входной интервал У. Для этого наводим указатель мыши на верхнюю ячейку столбца зависимых данных (В1), нажимаем левую кнопку мыши и, не отпуская ее, протягиваем указатель мыши к нижней ячейке (В8), затем, отпускаем левую кнопку мыши. Аналогично указываем Входной интервал Х, т. е ввести ссылку на диапазон независимых данных А1 :А8. Далее указываем выходной диапазон. Для этого ставим

переключатель в положение Выходной диапазон (навести указатель мыши, и щелкнуть левой кнопкой), затем наводим указатель мыши в правое поле ввода Выходной диапазон и щелкнув левой кнопкой мыши, указатель мыши наводим на левую верхнюю ячейку выходного диапазона (С1) и делаем щелчок левой кнопкой мыши. Нажимаем кнопку ОК

Результаты анализа. В выходном диапазоне появятся следующие результаты:

ВЫВОД ИТОГОВ:

Регрессионная статистика

……………

R-квадрат 0,945442

………………..

Коэффициенты ... Р-значение……

У-пересеч 0,329583 .. 0,070564

Переменная 0,124583 5,18Е-05

………….

Отсюда выражение для определения времени криодеструкции по толщине рубца будет иметь следующий вид:

Время криодеструкции в мин = 0,33 + 0,125 * (толщину рубца в мм)

Полученная модель с высокой точностью позволяет определять время криодеструкции (R²=94,54%).

Демонстрационный пример 7.

Множественная линейная регрессия. Исследовалась связь между дефицитом циркулирующей крови при острой желудочно-кишечной геморрагии язвенной этиология (У, мл) и двумя факторами: вязкостью крови (ХI, условные единицы) и гематокритной величиной (Х2, проценты). Были получены следующие данные:

Y

2200

1600

700

400

1100

800

700

1100

800

700

X1

3,2

3,5

4,3

4,0

3,8

3,6

4,2

3,3

4,1

3,4

X2

22

25

30

40

30

39

30

39

26

23

Необходимо рассмотреть возможность оценки дефицита циркулирующей крови на основании измерения двух факторов вязкости крови и гематокритной величины.

Решение

Вводим данные: дефицит циркулирующей крови — в диапазон А1:А10; вязкость крови — в диапазон В1 :В10; гематокритную величину — в диапазон С1: С10. В пункте меню Сервис выбираем строку Анализ данных и далее указываем курсором мыши на строку Регрессия. В появившемся диалоговом окне задаем Входной интервал У. Для этого наводим указатель мыши на верхнюю ячейку столбца зависимых данных (А1) нажимаем левую кнопку мыши и, не отпуская ее протягиваем указатель мыши к нижней ячейке (А1 0), затем отпускаем левую кнопку мыши.

Аналогично указываем Входной интервал Х, т. е. ввести ссылку на диапазон независимых данных ВI:С10. Далее указываем выходной диапазон. Для этого ставим переключатель в положение Выходной диапазон (навести указатель мыши и щелкнуть левой кнопкой), затем наводим указатель мыши в правое поле ввода Выходной диапазон и щелкнув левой кнопкой мыши, указатель мыши наводим на левую верхнюю ячейку выходного диапазона (В 1) и делаем щелчок левой кнопкой мыши.

Нажимаем кнопку ОК.

Результаты анализа. В выходном диапазоне появятся следующие результаты:

Вывод итогов: регрессивная статистика: R-квадрат 0,991366

Коэффициенты

Р - значение

Y-пересечение

6244,295

7,87154Е-09

Переменная 1

-919,418

3,71273Е-07

Переменная 2

-54,4629

3,2912Е-07

Интерпретация результатов. Дефицит циркулирующей крови при острой желудочно-кишечной геморрагии язвенной этиологии может быть оценен с высокой точностью (с погрешностью около 5% — R-квадрат = 0,99) из следующего выражения:

Дефицит крови в мл = 6244 — 919 * (вязкость крови) — 54, (гематокритная величина в %)

Дисперсионный анализ — предназначен для исследования задачи о действии на измеряемую величину (отклик) одного или нескольких факторов. Причем в однофакторном, двухфакторном и т. д. анализе влияющие на результат факторы считаются известными, и речь идет только о выяснении существенности или оценке этого влияния.

Для проведения дисперсионного анализа необходимо:

а) ввести данные в таблицу, так чтобы в каждом столбце оказались данные, соответствующие одному значению исследуемого фактора, а столбцы располагались в порядке возрастания (убывания) величины исследуемого фактора;

б) выполнить команду Сервис>Анализ данных;

в) в появившемся диалоговом окне Анализ данных в списке Инструменты анализа выбрать процедуру. Одно факторный дисперсионный анализ, указан курсором мыши. И щелкнув левой кнопкой мыши. Затем нажать кнопку Ок;

г) в появившемся диалоговом окне задать Входной интервал, т. е. ввести ссылку на диапазон анализируемых данных, содержащий все столбцы данных. Для этого следует навести указатель мыши на верхнюю левую ячейку диапазона данных, нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к нижней правой ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши.

д) в разделе Группировка переключатель устанавливается в положение по столбцам;

е) указать выходной диапазон, т. е. ввести ссылку на ячейки, в которые будут выведены результаты анализа. Для этого следует поставить переключатель в положение Выходной диапазон (навести указатель мыши и щелкнуть левой кнопкой), далее навести указатель мыши в правое поле ввода Выходной диапазон и щелкнуть левой кнопкой мыши, затем указатель мыши наводится на левую верхнюю ячейку выходного диапазона и делается щелчок левой кнопкой мыши. Размер выходного диапазона будет определен автоматически, и на экран будет выведено сообщение в случае возможного наложения выходного диапазона на исходные данные;

ж) нажимается кнопка ОК.

Результаты анализа. Выходной диапазон будет включать в себя результаты дисперсионного анализа: средние, дисперсии, критерий Фишера и другие показатели.

Интерпретация результатов. Влияние исследуемого фактора определяется по величине значимости критерия Фишера, которая находится в таблице Дисперсионный анализ на пересечении строки Между группами и столбца Р-Значение. В случаях когда Р Значение < 0,05, критерий Фишера значим и влияние исследуемого фактора можно считать доказанным.

Демонстрационный пример 8.

В демонстрационном примере 5 необходимо определить влияет ли уровень шума на правильность распознавания эмоциональной составляющей речи у детей.

Решение

Исследуемте данные вводим в рабочую таблицу Ехсеl также, как и в примере 1 (диапазон А1 :Сб). Выполняем команду Сервис данных. В появившемся диалоговом окне

Анализ данных в списке Инструменты анализа щелчком мыши выбираем процедуру Однофакторный дисперсионный анализ. Нажимаем кнопку ОК. В появившемся диалоговом окне Однофакторный дисперсионный анализ задаем Входной интервал А1 :С6. Для этого наводим указатель мыши на ячейку А1 и протягиваем его к ячейке Сб при нажатой левой кнопке мыши. В разделе Группировка переключатель устанавливается в положение по столбцам. Далее необходимо указать выходной диапазон. Для этого ставим переключатель в положение Выходной диапазон (навести указатель мыши и щелкнуть левой кнопкой), затем щелкаем указателем мыши в правом поле ввода Выходной диапазон, и щелчком мыши на ячйке А8 указываем расположение выходного диапазона. Нажимаем кнопку ОК.

Результаты анализа. В результате будет получена следующая таблица.

Однофакторный дисперсионный анализ.

Группы

Счет

Сумма

Среднее

Дисперсия

Столбец 1

6

513,4

85,5667

38,90367

Столбец 2

6

439,6

73,2667

175,2387

Столбец 3

6

425,9

70,9833

309,7137

Дисперсионный анализ:

Источник вариации

SS

df

MS

F

P

F

Между группами

738,4

2

369,177

2,114082

0,1552926

3,682317

Внутри групп

2619

15

174,628

итого

3358

17

Интерпретация результатов. В таблице дисперсионный анализ на пересечении строки Между группами и столбца Р-Значение находится величина 0,15529. Величина Р-Значение 0,05, следовательно критерий Фишера незначим и влияние фактора шума на эффективность распознавания доказать не удалось.