
- •1. Характеристика учебной дисциплины
- •Назначение учебной дисциплины
- •Цель изучения дисциплины
- •Задачи изучения дисциплины
- •1.4. Методология
- •Календарно-тематический план курса
- •Темы (вопросы) для срс
- •4. Содержание программы
- •4.1. Планы лекций
- •4.2. Планы лабораторных занятий
- •4.3. Порядок изучения материала и выполнения заданий (срс)
- •5. Система оценки знаний студентов
- •Глоссарий
- •Базовые термины математической статистики и анализа данных
- •1.2 Краткая историческая справка[2]
- •1.4 Типы данных психолого-педагогического исследования
- •1.5 Описательная статистика
- •Случайная величина и вероятность события Математическая статистика тесно связана с другой математической наукой – теорией вероятности и базируется на ее математическом аппарате.
- •Математическое ожидание – числовая характеристика св, приближенно равная среднему значению св:
- •Закон распределения св
- •Биномиальное распределение (распределение Бернулли)
- •Распределение Пуассона
- •Нормальное (гауссовское) распределение
- •Распределение вероятностей непрерывной cв х, принимающие все свои значения из отрезка [а;b] называется равномерным, если ее плотность вероятности на этом отрезке постоянна, а вне его равна нулю:
- •Общие принципы проверки статистических гипотез
- •4.3 Понятие гипотезы в педагогике
- •Анализ одной и двух нормальных выборок
- •6.1 Параметрические критерии
- •6.1.1 Методы проверки выборки на нормальность
- •Случай независимых выборок
- •1. Что если полученное в опыте значение t окажется меньше табличного? Тогда надо принять нулевую гипотезу.
- •3. Что если в контрольной группе результаты окажутся выше, чем в экспериментальной? Поменяем, например, местами, сделав средней арифметической экспериментальной группы, a — контрольной:
- •Б) случай связанных (парных) выборок
- •Лекция_5 Однофакторный дисперсионный анализ для несвязанных выборок
- •Лекция_6 Дисперсионный анализ для связанных выборок
- •Двухфакторный анализ
- •Связь задач двухфакторного и однофакторного анализа
- •Аддитивная модель данных двухфакторного эксперимента при независимом действии факторов
- •Непараметрические критерии проверки гипотезы об отсутствии эффектов обработки
- •Лекция_8 Регрессионный анализ
- •1. Парная линейная регрессия
- •1.1. Взаимосвязи экономических переменных
- •Суть регрессионного анализа
- •1.3. Парная линейная регрессия.
- •8.1 Требования к статистическим пакетам общего назначения
- •8.2 Российские пакеты обработки данных
- •8.4 Пакет stadia
- •Лекция_10 Корреляционный анализ Понятие корреляционной связи
- •7.2.2 Коэффициент корреляции Пирсона
- •Параметрические критерии
- •6.1.1 Методы проверки выборки на нормальность
- •Анализ временных рядов на компьютере
- •Многомерный анализ и другие статистические методы
- •Многомерное шкалирование
- •1.1 Характеристика пакета Excel
- •1.2 Использование специальных функций
- •Задания для самостоятельной работы
- •1.2 Использование инструмента Пакет анализа
- •Задание для самостоятельной работы
- •2.1 Биномиальное распределение
- •Задания для самостоятельной работы
- •2.2 Нормальное распределение
- •Задания для самостоятельной работы
- •2.3 Генерация случайных величин
- •Задание для самостоятельной работы
Аддитивная модель данных двухфакторного эксперимента при независимом действии факторов
Для описания данных таблицы 7.1 двухфакторного эксперимента в большинстве случаев оказывается приемлемой аддитивная модель. Она предполагает, что значение отклика хц является суммой самостоятельных вкладов соответствующих уровней каждого из факторов и независимых от этих факторов случайных величин. Последние отражают внутреннюю изменчивость отклика при фиксированных уровнях факторов, которая может порождаться различными причинами.
Таким образом, каждое наблюдение хц представляется в виде:
При этом числа b\,... ,bn являются результатом влияния на отклик мешающего фактора В, действие которого разбивает все данные на блоки. Поэтому величины Ьх,... , Ьп называют эффектами блоков. Числа t%,... , tk отражают действие на отклик интересующего нас фактора А и именуются эффектами обработки. Относительно случайных величин
eij
предполагается,
что они одинаково распределены и
независимы в совокупности.
Различные методы двухфакторного анализа
требуют от их
распределения либо только непрерывности,
либо принадлежности к нормальному
семейству распределений N(0,a2)
со
средним 0 и некоторой
неизвестной дисперсией а2.
Оба
эти случая разобраны ниже.
Непараметрические критерии проверки гипотезы об отсутствии эффектов обработки
Критерий Фридмана (произвольные альтернативы)
Непараметрический критерий Фридмана для проверки гипотезы Но против альтернативы о наличии влияния фактора А используется в случае, если о распределении случайных величин ец, г = 1,... , п, j = 1,... , fc в модели (7.2) известно только то, что оно непрерывно, а сами величины eij независимы в совокупности. (То, что е^- одинаково распределены, было оговорено раньше.) Критерий основан на идее перехода от значений величин хц в таблице двухфакторного анализа к их рангам. В отличие от однофакторного анализа, ранжирование происходит не по всей совокупности величин хц, а поблочно, то есть рассматривается каждая отдельная строка таблицы 7.1 и при фиксированном индексе i осуществляется ранжирование величин Жу при j = 1,... , к. Тем самым устраняется влияние «мешающего» фактора В, значение которого для каждой строки таблицы постоянно.
Обозначим полученные ранги величин хц через гц. Ясно, что значения nj изменяются от 1 до fc, а соответствующая строка рангов представляет собой некоторую перестановку чисел 1,2,... , fc. Для простоты изложения будем предполагать, что среди элементов хц, стоящих в одной строке таблицы (7.1), нет совпадающих (в противном случае следует использовать средние ранги). При гипотезе Hq : т-\_ = т2 = • • • = Tk = О каждая строка рангов Гц, rj2,..., r,fc будет представлять случайную перестановку чисел от 1 до fc, причем все fc! перестановок равновероятны. Введем величину: r.j — ^(X^=ir«j)' являющуюся средним значением рангов по столбцу j. При гипотезе Но в силу равновероятности всех перестановок рангов в каждой строке значение r.j для каждого j не должно сильно отличаться от величины г.. = (fc +1)/2, которая представляет собой общий средний ранг всех элементов таблицы рангов. (Действительно, сумма рангов по всей таблице есть nfc(fc -f l)/2. Средний ранг получается делением на число пк элементов таблицы).
Здесь множитель, стоящий перед знаком суммы, добавлен для того, чтобы S имело простое асимптотическое распределение. В вычислительном плане более удобна другая форма записи величины S, а именно:
(7.4)
Как отмечалось выше, при справедливости гипотезы Но величины (r.j — г..)2 в выражении (7.3) с большой вероятностью сравнительно малы для всех j, и, следовательно, значение S сравнительно невелико.
А
при нарушении Яо суммы рангов в одних
столбцах будут тяготеть к превышению
значения среднего ранга г.., а в других
— к уменьшению этого
значения, в зависимости от знака величины
т,- ф
0.
Это приводит к
возрастанию статистики Фридмана S.
Из
этих соображений вытекает вид
критерия Фридмана для проверки гипотезы
Яо
: т\
= т2
= • • • = Tfc
= 0 против альтернативы наличия эффектов
обработки.
Критерий Пейджа (альтернативы с упорядочением)
Назначение. Часто целью исследования является установление преимущества одного метода обработки над другим. Если таких обработок несколько, возможно предположение, что их эффективность возрастает в определенном направлении, например, по мере увеличения интенсивности воздействия. Для того, чтобы подтвердить или опровергнуть такое предположение, снова обратимся к проверке Яо. Но на этот раз постараемся выбрать критерий, чувствительный именно к альтернативам о возрастании (вариант: убывании) эффекта. Против такой специальной и более узкой группы альтернатив можно предложить ориентированный именно на эту ситуацию критерий Пейджа.
Критерий Пейджа предназначен для проверки гипотезы Яо об отсутствии эффектов обработки ( До : т% = т% = • •- = ть) против альтернатив с упорядочением: т\ ^ Т2 ^ • • • ^ т^, где хотя бы одно из неравенств строгое.
Статистика Пейджа. Введем величину г,- как rj = Х^Г=1гу- (-'та' тистика Пейджа L по определению есть: Вид критерия. Критерий проверки гипотезы Яо против альтернатив с упорядочением на уровне значимости а имеет вид:
принять Яо, если L < l(a,k,n);
отклонить Яо в пользу альтернативы, если L > l(a,k,n),
где функция l(a,k,n) удовлетворяет уравнению P{L > l(a,k,n)} = a.
Таблицы и асимптотика. Для значений к = 3, те = 2(1)20 и к = 4(1)8, те = 2(1)12 таблица приближенных значений l(a,k,n) дана в [115]. В случае больших значений /сите для нахождения процентных точек следует использовать асимптотическое распределение статистики L. Рассмотрим величину L*:
(7.6)
При справедливости Яо статистика L* имеет при те —> оо асимптотическое распределение N(0,1) (сведения о более точной аппроксимации можно найти в [65]). Следовательно, приближенный критерий для проверки Яо против альтернатив с упорядочением на уровне значимости а имеет вид: принять Яо, если L* < za, в противном случае — отклонить Яо в пользу альтернативы. Здесь za — а-процентная точка стандартного нормального распределения.
Если в пределах строки исходной двухфакторной таблицы встречаются совпадающие значения, надо использовать средние ранги. Чем больше таких совпадений, тем более приближенными становятся выводы.