Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методическое пособие 639

.pdf
Скачиваний:
5
Добавлен:
30.04.2022
Размер:
3.05 Mб
Скачать

таблица дисперсионного анализа при значениях a 3,

b 2,

m 3 будет иметь следующий вид (табл. 4).

 

 

 

 

 

 

Таблица 4

 

 

 

 

 

 

Уровни

Уровни фактора В

 

 

фактора А

1

 

2

 

 

1

y111

 

y121

 

 

1

y112

 

y122

 

 

1

y113

 

y123

 

 

2

y211

 

y221

 

 

2

y212

 

y222

 

 

2

y213

 

y223

 

 

3

y311

 

y321

 

 

3

y312

 

y322

 

 

3

y313

 

y323

 

Общая дисперсия выборки при двухфакторном анализе представляется в виде следующей суммы:

2 2A 2B 2AB 2z ,

где 2A , 2B - дисперсии, объясняемые независимым влиянием

факторов А и В, соответственно, 2AB - дисперсия, объясняемая совместным влиянием факторов А и В.

Для интерпретации результатов можно использовать

коэффициент детерминации, отражающий долю межгрупповой дисперсии в общей:

2

A .

2

Чем ближе значение коэффициента детерминации к 1, тем больше степень влияния исследуемого фактора на

51

результативный признак. Величина 1 показывает степень влияния неучтенных в модели случайных факторов.

2.2. Методы выполнения дисперсионного анализа в

Excel

Для выполнения дисперсионного анализа Microsoft Excel можно использовать следующие функции пакета анализа данных:

-однофакторный дисперсионный анализ;

-двухфакторный дисперсионный анализ с повторениями – применяется в том случае, если для каждого сочетания двух факторов задано несколько наблюдений;

-двухфакторный дисперсионный анализ без повторений – для каждого сочетания факторов есть только одно наблюдение.

2.3. Пример выполнения однофакторного дисперсионного анализа в Excel

Проведем анализ зависимости результатов тестирования от методов обучения. Предположим, что исследуемая группа студентов была разделена на три подгруппы, в первой из которых проводились только лекции, во второй – лекции и практические занятия, в третьей – лекции, практические и лабораторные занятия. Составим в Excel таблицу с исходными данными (рис. 27).

Рис. 27. Фрагмент листа Excel с входными данными

Для выполнения анализа данных вызовем процедуру Однофакторный дисперсионный анализ из пакета Анализ данных. Диалоговое окно ввода входных параметров данной

52

процедуры приведено на рис. 28. Особое внимание необходимо обратить на группирование данных. Т.к. данные для различных уровней факторного признака размещаются в строках, то надо выбрать группирование по строкам.

Рис. 28. Окно задания входных параметров процедуры Однофакторный дисперсионный анализ

Таблицы с результатами анализа приведены на рис. 29. Результаты анализа включают две таблицы: ИТОГИ, в которой приведены основные статистические данные об исследуемых группах наблюдений, и Дисперсионный анализ,

содержащую следующие показатели:

- столбец SS – суммы квадратов отклонений от среднего

– величины, связанные с дисперсией соотношением

2 SS/n, где n m k - общее число элементов в выборке; для данных значений также выполняется равенство

SS SSA SSz ,

где SSA и SSz - межгрупповая и внутригрупповая суммы квадратов, соответственно;

53

-столбец F – величина критерия Фишера, используемого для проверки значимости результатов анализа;

-p-значение – значимость критерия Фишера, если данное значение больше уровня значимости , то гипотеза о равенстве средних принимается, в противном случае отвергается.

Рис. 29. Результаты дисперсионного анализа данных

В рассматриваемом примере можно сделать вывод, что гипотеза о равенстве средних в группах не принимается, т.е. разные методы обучения сильно влияют на результаты тестирования; внутригрупповая изменчивость больше, чем межгрупповая, следовательно, изменчивость элементов выборки в большей степени (на 60%) зависит от неучтенных факторов, чем от методов обучения. По таблице итогов видно, что при изменении методов обучения меняется среднее значение результатов тестирования.

54

2.4. Пример выполнения двухфакторного дисперсионного анализа в Excel

Проведем анализ влияния на результаты тестирования методов обучения и разных форм обучения (очной, заочной). Таблица с исходными данными приведена на рис. 30.

Рис. 30. Таблица с исходными данными для двухфакторного анализа

Для анализа данных используется процедура Двухфакторный анализ с повторениями. Диалоговое окно с входными параметрами приведено на рис. 31.

55

Рис. 31. Диалоговое окно с входными параметрами процедуры Двухфакторный дисперсионный анализ с повторениями

Таблица с результатами дисперсионного анализа приведена на рис. 32.

Рис. 32. Результаты двухфакторного дисперсионного анализа

Как видно, таблица содержит следующие источники вариации:

-Выборка – строка содержит показатели для фактора А, уровни которого перечислены в строках;

-Столбцы – показатели для фактора В;

-Взаимодействие – показатели совместного влияния факторов А и В;

56

- Внутригрупповая изменчивость, объясняемая неучтенными факторами.

В рассматриваемом примере факторы методов и формы являются значимыми, при этом методы обучения влияют в большей степени, чем форма.

3. ЛАБОРАТОРНОЕ ЗАДАНИЕ

Задание 1. Выполнить однофакторный дисперсионный анализ:

а) выбрать факторный признак и разделить значения выборки на группы в соответствии с его значениями;

б) выполнить дисперсионный анализ с помощью Excel; в) сделать выводы по результатам анализа; г) построить ящичную диаграмму для визуальной

оценки влияния различных значений фактора на значения выборки (разобрать самостоятельно);

Задание 2. Выполнить двухфакторный дисперсионный анализ по алгоритму из первого задания, исходные данные задать в соответствии с табл. 5.

Таблица 5

Вариант

m

a

b

1

3

4

5

2

3

5

4

3

4

5

4

4

4

3

5

5

5

4

3

6

5

4

5

7

6

3

5

8

6

4

5

57

4.УКАЗАНИЯ ПО ОФОРМЛЕНИЮ ОТЧЕТА

Отчет должен содержать:

- наименование и цель работы; - краткие теоретические сведения;

- задание на лабораторную работу; - результаты выполнения лабораторной работы.

5.КОНТРОЛЬНЫЕ ВОПРОСЫ

1.Что такое дисперсионный анализ?

2.Какие составляющие можно выделить в общей вариации наблюдаемых данных?

3.Чем отличается однофакторный и многофакторный дисперсионный анализ?

4.Как выполняется дисперсионный анализ в Microsoft

Excel?

5.Как можно интерпретировать результаты дисперсионного анализа?

58

Лабораторная работа №5 ОСНОВЫ АНАЛИЗА И ПРОГНОЗИРОВАНИЯ ВРЕМЕННЫХ РЯДОВ С ПОМОЩЬЮ ПАКЕТА

STATISTICA

1. ОБЩИЕ УКАЗАНИЯ ПО ВЫПОЛНЕНИЮ ЛАБОРАТОРНОЙ РАБОТЫ

1.1. Цель работы

Изучение основных понятий дисперсионного анализа и методов его реализации в Microsoft Excel; получение практических навыков выполнения дисперсионного анализа и интерпретации его результатов.

1.2. Используемое оборудование и программное обеспечение

Для выполнения лабораторной работы требуется ПЭВМ типа IBM PC с установленной ОС Windows XP и выше, пакет STATISTICA 10 или последующих версий.

2. МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО ВЫПОЛНЕНИЮ ЛАБОРАТОРНОЙ РАБОТЫ

2.1. Понятие о рядах динамики и методах их анализа

Временной ряд (ряд динамики) – это последовательность значений статистического показателя, упорядоченная в хронологическом порядке. Отдельные значения ряда динамики называются уровнями ряда.

Каждый ряд динамики содержит значения времени и соответствующие им значения уровней ряда.

Примерами рядов динамики являются, например, объемы производства, курсы валют,

При анализе временных рядов принято считать, что значения уровней временных рядов содержат следующие составляющие:

- тренд – изменение, определяющее общее направление развития, основная тенденция временного ряда;

59

-сезонная компонента – периодическая составляющая ряда динамики, не превышающая одного года, например, годовая периодичность в колебаниях цен на определенные товары;

-циклическая компонента – периодическая составляющая с периодом колебаний больше года, например, экономические и демографические циклы;

-случайная составляющая – возникает под влиянием внезапных факторов, вызывающих значительные отклонения (кризис, эпидемии, стихийные бедствия и пр.) и большого числа текущих побочных факторов, влияние которых незначительно, но ощущается их суммарное воздействие.

Первые три составляющие являются детерминированными, а случайная составляющая получается в результате сложения большого числа внешних факторов.

Уровни рядов динамики могут описываться следующими видами моделей:

-аддитивная модель – ряд представляется в виде суммы компонент:

yi ti si ci ri ,

где yi - уровни ряда, ti - трендовая составляющая, si -

сезонная компонента, ci - циклическая компонента, ri - случайная составляющая;

- мультипликативная модель – ряд представляется в виде произведения компонент:

yi ti si ci ri .

Определить вид модели иногда можно по графику. Если амплитуда сезонных колебаний, отражающая отклонение от среднего значения, приблизительно постоянна, то модель аддитивная, если же амплитуда сезонных колебаний возрастает, то модель мультипликативная.

Важной задачей, возникающей при анализе рядов, является определение основной тенденции в развитии исследуемого явления. В некоторых случаях общая тенденция ясно прослеживается в динамике показателя, в других

60