
- •1. Характеристика учебной дисциплины
- •Назначение учебной дисциплины
- •Цель изучения дисциплины
- •Задачи изучения дисциплины
- •1.4. Методология
- •Календарно-тематический план курса
- •Темы (вопросы) для срс
- •4. Содержание программы
- •4.1. Планы лекций
- •4.2. Планы лабораторных занятий
- •4.3. Порядок изучения материала и выполнения заданий (срс)
- •5. Система оценки знаний студентов
- •Глоссарий
- •Базовые термины математической статистики и анализа данных
- •1.2 Краткая историческая справка[2]
- •1.4 Типы данных психолого-педагогического исследования
- •1.5 Описательная статистика
- •Случайная величина и вероятность события Математическая статистика тесно связана с другой математической наукой – теорией вероятности и базируется на ее математическом аппарате.
- •Математическое ожидание – числовая характеристика св, приближенно равная среднему значению св:
- •Закон распределения св
- •Биномиальное распределение (распределение Бернулли)
- •Распределение Пуассона
- •Нормальное (гауссовское) распределение
- •Распределение вероятностей непрерывной cв х, принимающие все свои значения из отрезка [а;b] называется равномерным, если ее плотность вероятности на этом отрезке постоянна, а вне его равна нулю:
- •Общие принципы проверки статистических гипотез
- •4.3 Понятие гипотезы в педагогике
- •Анализ одной и двух нормальных выборок
- •6.1 Параметрические критерии
- •6.1.1 Методы проверки выборки на нормальность
- •Случай независимых выборок
- •1. Что если полученное в опыте значение t окажется меньше табличного? Тогда надо принять нулевую гипотезу.
- •3. Что если в контрольной группе результаты окажутся выше, чем в экспериментальной? Поменяем, например, местами, сделав средней арифметической экспериментальной группы, a — контрольной:
- •Б) случай связанных (парных) выборок
- •Лекция_5 Однофакторный дисперсионный анализ для несвязанных выборок
- •Лекция_6 Дисперсионный анализ для связанных выборок
- •Двухфакторный анализ
- •Связь задач двухфакторного и однофакторного анализа
- •Аддитивная модель данных двухфакторного эксперимента при независимом действии факторов
- •Непараметрические критерии проверки гипотезы об отсутствии эффектов обработки
- •Лекция_8 Регрессионный анализ
- •1. Парная линейная регрессия
- •1.1. Взаимосвязи экономических переменных
- •Суть регрессионного анализа
- •1.3. Парная линейная регрессия.
- •8.1 Требования к статистическим пакетам общего назначения
- •8.2 Российские пакеты обработки данных
- •8.4 Пакет stadia
- •Лекция_10 Корреляционный анализ Понятие корреляционной связи
- •7.2.2 Коэффициент корреляции Пирсона
- •Параметрические критерии
- •6.1.1 Методы проверки выборки на нормальность
- •Анализ временных рядов на компьютере
- •Многомерный анализ и другие статистические методы
- •Многомерное шкалирование
- •1.1 Характеристика пакета Excel
- •1.2 Использование специальных функций
- •Задания для самостоятельной работы
- •1.2 Использование инструмента Пакет анализа
- •Задание для самостоятельной работы
- •2.1 Биномиальное распределение
- •Задания для самостоятельной работы
- •2.2 Нормальное распределение
- •Задания для самостоятельной работы
- •2.3 Генерация случайных величин
- •Задание для самостоятельной работы
Двухфакторный анализ
Связь задач двухфакторного и однофакторного анализа
Продолжая тему исследования зависимостей, начатую в главе 6, рассмотрим задачу о действии на измеряемую величину (отклик) двух факторов. В этой задаче мы предполагаем, что на отклик могут влиять два фактора, каждый из которых принимает конечное число значений (уровней), и интересуемся тем, как влияют эти факторы на изучаемый отклик и влияют ли вообще. Такие задачи характерны как для промышленных и технологических экспериментов, так и для гуманитарных исследований. Остановимся более подробно на одном из распространенных случаев возникновения задач двухфакторного анализа.
Бывает, что в рамках однофакторной модели (см. гл. 6) влияние интересующего нас фактора не проявляется, хотя содержательные соображения указывают, что такое влияние должно быть. Иногда это влияние проявляется, но точность выводов о количественной стороне этого влияния недостаточна. Причиной такого явления может быть большой внутригрупповой разброс, на фоне которого действие фактора остается незаметным или почти незаметным. Очень часто этот разброс вызывается не только случайными причинами, но также действием еще одного фактора. Если мы в состоянии указать такой фактор, можно попытаться включить его в модель, чтобы уменьшить статистическую неоднородность наблюдений и благодаря этому выявить действие на отклик закономерных причин. Конечно, не всегда удается поправить дело введением одного «мешающего» фактора и переходом к двухфакторным схемам, как выше. Иногда приходится рассматривать и трех-, и многофакторные модели. Замысел во всех этих случаях остается прежним.
К задачам двухфакторного или многофакторного анализа часто приводят также исследования по оптимизации технологических процессов. При этом чаще всего заранее известно, что оба фактора оказывают значимое влияние на отклик, а исследователя интересует численная оценка этого влияния с целью выбора оптимального уровня факторов.
Иногда
факторы разделяют на важные и мешающие,
но это совсем не
обязательно. В ряде задач факторы
содержательно равноправны для
экспериментатора.
Эти нюансы мало влияют на статистические
модели, они
могут сказаться только на постановках
статистических вопросов.
Таблица двухфакторного анализа
Рассмотрим, как изменяется таблица однофакторного анализа, приведенная в пункте 6. при включении в модель действия мешающего фактора.
Назовем главный фактор фактором А, а мешающий фактор — фактором В. Пусть фактор А принимает k, а фактор В — п различных значений. Фактор В разбивает все объекты наблюдения на п блоков, каждый блок образуют наблюдения, проведенные при одном уровне фактора В. В блоке отклики могут значимо различаться только за счет-применения к ним различных обработок, то есть за счет различных уровней фактора А. Уровни фактора А (обработки) отображаются в таблице по столбцам, а уровни фактора В (блоки) — по строкам. Традиционная терминология «блок-обработка» в применении к
Таблица 7.1
|
Обработки |
|||
Блоки |
1 |
2 |
|
к |
1 2 п |
in a?2i Хп1 |
Ж12 Х22 Хп2 |
|
Xlk Х2к Хпк |
факторам В и А сложилась как результат различного отношения к этим факторам, один из которых является мешающим, а другой определяющим.
Таблица 7.1, содержащая п х к наблюдений (по одному наблюдению в клетке) является основной таблицей двухфакторного анализа. Ее отличие от таблицы однофакторного анализа заключается в том, что наблюдения в любом столбце не являются однородными, то есть могут не образовывать выборки (если влияние мешающего фактора значимо). Для описания такой двухфакторной таблицы требуются более сложные вероятностные модели, чем для однофакторного анализа.