- •Математическая статистика для психологов
- •Предмет и содержание курса, взаимосвязь курса со смежными дисциплинами, его значимость для профессиональной подготовки выпускников
- •Стохастичность и вероятность Стохастический характер реальности
- •Современное философское понимание вероятности
- •Роль математики в развитии понятия о вероятности
- •Вероятность как мера случайности
- •Предмет теории вероятностей
- •Определения понятия вероятности
- •Случайные события
- •Классическое определение вероятности
- •Геометрическое определение вероятности
- •Статистическое определение вероятности
- •Субъективная вероятность
- •Алгебра случайных событий
- •Аксиомы алгебры случайных событий
- •Отношения между случайными событиями
- •Простейшие свойства вероятности, помогающие их вычислять
- •Условная вероятность, независимые события и формула умножения вероятностей
- •Формула сложения вероятностей
- •Случайные величины Понятие функции в математике
- •Понятие случайной величины
- •Типы случайных величин
- •Закон распределения случайной величины
- •Ряд распределения дискретной случайной величины
- •Функция распределения случайной величины и её свойства
- •Плотность распределения вероятностей случайной величины
- •Математическое ожидание случайной величины и его свойства
- •Математическое ожидание дискретной случайной величины с конечным числом значений
- •Математическое ожидание дискретной случайной величины с бесконечным числом значений
- •Математическое ожидание непрерывной случайной величины
- •Свойства математического ожидания
- •Дисперсия случайной величины и его свойства
- •Свойства дисперсии
- •Другие характеристики центральных тенденций и изменчивости распределений случайных величин
- •Медиана
- •Квантили
- •Характеристики формы распределения случайной величины Понятие моментов случайной величины и z-оценки
- •Коэффициент асимметрии случайной величины
- •Эксцесс случайной величины
- •Совместные распределения случайных величин
- •Ряд распределения двумерной дискретной случайной величины
- •Плотность распределения для двумерной непрерывной случайной величины
- •Зависимые и независимые случайные величины
- •Понятие ковариации двух случайных величин и его свойства
- •Коэффициент корреляции двух случайных величин и его свойства
- •Законы больших чисел
- •Сходимость по вероятности
- •Неравенства Чебышева
- •Теорема Бернулли
- •Центральная предельная теорема
- •Понятие нормального распределения
- •Стандартное нормальное распределение
- •Правило трёх сигм
- •Нормальное распределение в реальном мире
- •Функция Лапласа
- •Вероятность попадания значения нормальной случайной величины в заданный промежуток
- •Вероятность отклонения значения нормальной случайной величины от математического ожидания
- •Прикладная статистика в психологии Происхождение и история статистики
- •Современное понимание статистики
- •Общее представление о прикладной статистике
- •Основные разделы прикладной статистики
- •Прикладная статистика как способ проверки вероятностных моделей
- •Специфика использования прикладной статистики в психологии
- •Стандарты обработки данных, нормативы представления результатов анализа данных в научной психологии
- •Шкалы измерений, связи и зависимости Научное знание и задачи науки
- •Моделирование в науке
- •Признаки и переменные
- •Понятие измерения в современной науке
- •Мера, метрика, показатель
- •Шкалы измерений, типы данных и переменных
- •Графическое представление данных
- •Зависимые и независимые переменные. Связи и зависимости: причинная и функциональная.
- •Понятие анализа данных, его цели и задачи. Связь анализа данных со статистикой
- •Описательная статистика Понятие описательной статистики
- •Ряд распределения
- •Полигон частот. Выборочная функция распределения и гистограмма.
- •Средние характеристики и характеристики рассеяния рядов распределений
- •Аналитическая статистика Понятие аналитической статистики, её составляющие
- •Выборочный метод в прикладной статистике Выборка как модель генеральной совокупности. Цели и задачи выборочного метода.
- •Статистическое понимание случайной выборки
- •Основные этапы формирования выборки
- •Единица отбора выборки
- •Определение объема выборки
- •Типы выборки и методы отбора Многоступенчатая и одноступенчатая выборки
- •Случайные и неслучайные выборки
- •Выборки для психологических исследований
- •Эмпирическая функция распределения и её свойства
- •Статистические оценки параметров генеральной совокупности
- •Параметры генеральной совокупности и выборочные статистики
- •Понятие точечной оценки и её свойства
- •Выборочное среднее как статистическая оценка среднего в генеральной совокупности
- •Статистическая оценка генеральной дисперсии
- •Статистическая оценка вероятности или генеральной доли
- •Понятие интервальной оценки
- •Доверительный интервал и доверительная вероятность
- •Основные задачи интервального оценивания
- •Доверительный интервал для математического ожидания при известном стандартном квадратичном отклонении
- •Доверительный интервал для математического ожидания при неизвестном стандартном квадратичном отклонении
- •Доверительный интервал для генеральной доли
- •Проверка статистических гипотез Понятие статистической проверки гипотез, её цели, задачи и основные понятия
- •Статистический критерий для проверки статистической гипотезы
- •Критическая область критерия: односторонняя и двусторонняя
- •Основной принцип проверки статистической гипотезы
- •Этапы проверки статистических гипотез, минимальный уровень значимости
- •Проверка статистической гипотезы о среднем
- •Проверка статистической гипотезы о равенстве средних
- •Проверка статистической гипотезы о генеральной доле
- •Проверка статистической гипотезы о равенстве долей или вероятностей
- •Программное обеспечение прикладной статистики Информационные технологии расчётов в электронных таблицах (пример - Microsoft Excel)
- •Статистические функции и их использование в Microsoft Excel
- •Построение диаграмм и графиков в Microsoft Excel
- •Информационные технологии статистической обработки данных
Проверка статистической гипотезы о равенстве средних
Пусть
и
- две случайные величины, распределённые
обе по нормальному закону с неизвестными
математическими ожиданиями и известными
дисперсиями
и
соответственно. Процедуры и выводы
этого раздела можно применять и в тех
случаях, когда случайные величины
и
,
оставаясь независимыми, распределены
не точно по нормальному закону, но близко
к нему.
По
независимым выборкам из
и
,
объёмы которых равны соответственно
и
,
определены выборочные средние
и
.
Требуется по выборочным средним при заданном уровне значимости проверить нулевую гипотезу, состоящую в том, что математические ожидания генеральных совокупностей и являются равными:
- нулевая гипотеза;
,
или
- альтернативные гипотезы.
Как
известно, выборочные средние являются
несмещёнными оценками генеральных
средних или математических ожиданий,
т.е.
и
,
где
и
- это случайные величины, являющиеся
выборочными средними для
и
соответственно. Тогда можно переформулировать
нулевую и альтернативную гипотезы уже
для средних:
- нулевая гипотеза;
,
или
- альтернативные гипотезы.
В качестве статистического критерия для проверки этих гипотез можно использовать случайную величину - - оценку следующего вида:
.
Тогда можно доказать, что
Для
доказательства преобразуем
.
Но выборочная дисперсия может быть
выражена через дисперсию генеральной
совокупности:
Аналогично:
.
Следовательно,
.
Тогда статистический критерий и принимает
вид:
Этот статистический критерий имеет стандартное нормальное распределение. Критическая область этого критерия определяется в зависимости от альтернативной гипотезы.
Случай 1. Альтернативная гипотеза представлена двусторонним неравенством (двусторонняя гипотеза).
Пусть уровень значимости равен . По таблицам или, например, в Excel необходимо определить значение - границу критической области. Это значение аргумента, при котором стандартная нормальная величина принимает значение .
Критическая область для такой альтернативной гипотезы будет задаваться неравенством: . Если это неравенство выполняется, нет оснований принимать нулевую гипотезу, т.е. она должна быть отклонена, поскольку значение статистического критерия попадает в критическую область.
Случай 2. Альтернативная гипотеза представлена односторонним неравенством (односторонняя гипотеза).
Пусть уровень значимости равен . По таблицам или, например, в Excel необходимо определить значение - границу критической области. Это значение аргумента, при котором стандартная нормальная величина принимает значение .
Критическая область для такой альтернативной гипотезы будет задаваться неравенством: . Если это неравенство выполняется, нет оснований принимать нулевую гипотезу, т.е. она должна быть отклонена, поскольку значение статистического критерия попадает в критическую область.
Случай 3. Альтернативная гипотеза представлена односторонним неравенством (односторонняя гипотеза).
Пусть уровень значимости равен . По таблицам или, например, в Excel необходимо определить значение - границу критической области. Это значение аргумента, при котором стандартная нормальная величина принимает значение .
Критическая область для такой альтернативной гипотезы будет задаваться неравенством: . Если это неравенство выполняется, нет оснований принимать нулевую гипотезу, т.е. она должна быть отклонена, поскольку значение статистического критерия попадает в критическую область.
Если дисперсии генеральных совокупностей и неизвестны, то применить указанный в этом разделе статистический критерий невозможно. Более того, точного решения этой задачи при неравных дисперсиях генеральных совокупностей, что чаще всего и бывает, до настоящего времени нет. На практике используются различные приближения.
Одно их таких приближений такое. Можно доказать, что в случае объёмов выборок из и не менее 30 элементов каждая, выборочные средние распределены близко к нормальному закону, а выборочные дисперсии являются хорошими оценками генеральных дисперсий. Поэтому в случае больших выборок неизвестные дисперсии генеральных совокупностей и можно заменить их несмещёнными оценками с помощью выборочных дисперсий. Тогда для проверки той же самой нулевой гипотезы можно использовать такой статистический критерий:
,
где
и
- это несмещённые выборочные оценки
дисперсии генеральных совокупностей
и
соответственно:
и
Дальнейшая процедура проверки статистической гипотезы не меняется, она полностью повторяет ту, которая была описана для случая известных дисперсий генеральных совокупностей.
Пример. Была измерена скорость чтения у детей. До обучения чтению по некоторой методике средняя скорость чтения составляла 100 слов в минуту со стандартным отклонением 12 для 100 обследованных детей. После обучения чтению по этой методике только 81 ребенка их скорость чтения в среднем составила 130 слов в минуту при стандартном отклонении 14. Можно ли на основании применения того или иного статистического критерия утверждать, есть эффект обучения детей чтению или нет?
Нулевой гипотезой будем считать отсутствие существенных различий в скоростях чтения до и после обучения, а альтернативной гипотезой – наличие таких отличий. Таким образом, мы проверяем двустороннюю гипотезу.
В
данном случае можно применить критерий
сравнения средних по Z-оценке,
т.е. считая, что данные имеют близкие к
нормальным распределения и до обучения,
и после обучения чтению. В этом случае:
распределение X – это распределение
скоростей чтения до обучения, распределение
Y – это распределение скоростей чтения
после обучения по методике,
– это средняя скорость чтения до
обучения,
– это средняя скорость чтения после
обучения по методике,
– это дисперсия распределения X,
– это дисперсия распределения Y,
– это размер выборки до обучения чтению,
а
– это размер выборки после обучения
чтению по методике.
Вычисляем
значение статистического критерия
.
По таблицам или с помощью функции
=НОРМСТОБР в Microsoft Excel вычисляем критические
значения для этого критерия на уровнях
значимости 0,95 и 0,99. Получаются,
соответственно, критические значения
1,6449 и 2,3263. Значение статистического
критерия, вычисленного для сравнения
скоростей чтения до и после обучения
по модулю существенно больше и одного
и другого критического значения.
Следовательно, наше значение статистического
критерия, показывающее различия в
скоростях чтения, лежит вне области
допустимых значения критерия. Поэтому
нулевая гипотеза должна быть отвергнута
на обоих уровнях значимости, что означает
статистическое подтверждение наличия
эффекта обучения чтению по применённой
методике обучения.
