- •Математическая статистика для психологов
- •Предмет и содержание курса, взаимосвязь курса со смежными дисциплинами, его значимость для профессиональной подготовки выпускников
- •Стохастичность и вероятность Стохастический характер реальности
- •Современное философское понимание вероятности
- •Роль математики в развитии понятия о вероятности
- •Вероятность как мера случайности
- •Предмет теории вероятностей
- •Определения понятия вероятности
- •Случайные события
- •Классическое определение вероятности
- •Геометрическое определение вероятности
- •Статистическое определение вероятности
- •Субъективная вероятность
- •Алгебра случайных событий
- •Аксиомы алгебры случайных событий
- •Отношения между случайными событиями
- •Простейшие свойства вероятности, помогающие их вычислять
- •Условная вероятность, независимые события и формула умножения вероятностей
- •Формула сложения вероятностей
- •Случайные величины Понятие функции в математике
- •Понятие случайной величины
- •Типы случайных величин
- •Закон распределения случайной величины
- •Ряд распределения дискретной случайной величины
- •Функция распределения случайной величины и её свойства
- •Плотность распределения вероятностей случайной величины
- •Математическое ожидание случайной величины и его свойства
- •Математическое ожидание дискретной случайной величины с конечным числом значений
- •Математическое ожидание дискретной случайной величины с бесконечным числом значений
- •Математическое ожидание непрерывной случайной величины
- •Свойства математического ожидания
- •Дисперсия случайной величины и его свойства
- •Свойства дисперсии
- •Другие характеристики центральных тенденций и изменчивости распределений случайных величин
- •Медиана
- •Квантили
- •Характеристики формы распределения случайной величины Понятие моментов случайной величины и z-оценки
- •Коэффициент асимметрии случайной величины
- •Эксцесс случайной величины
- •Совместные распределения случайных величин
- •Ряд распределения двумерной дискретной случайной величины
- •Плотность распределения для двумерной непрерывной случайной величины
- •Зависимые и независимые случайные величины
- •Понятие ковариации двух случайных величин и его свойства
- •Коэффициент корреляции двух случайных величин и его свойства
- •Законы больших чисел
- •Сходимость по вероятности
- •Неравенства Чебышева
- •Теорема Бернулли
- •Центральная предельная теорема
- •Понятие нормального распределения
- •Стандартное нормальное распределение
- •Правило трёх сигм
- •Нормальное распределение в реальном мире
- •Функция Лапласа
- •Вероятность попадания значения нормальной случайной величины в заданный промежуток
- •Вероятность отклонения значения нормальной случайной величины от математического ожидания
- •Прикладная статистика в психологии Происхождение и история статистики
- •Современное понимание статистики
- •Общее представление о прикладной статистике
- •Основные разделы прикладной статистики
- •Прикладная статистика как способ проверки вероятностных моделей
- •Специфика использования прикладной статистики в психологии
- •Стандарты обработки данных, нормативы представления результатов анализа данных в научной психологии
- •Шкалы измерений, связи и зависимости Научное знание и задачи науки
- •Моделирование в науке
- •Признаки и переменные
- •Понятие измерения в современной науке
- •Мера, метрика, показатель
- •Шкалы измерений, типы данных и переменных
- •Графическое представление данных
- •Зависимые и независимые переменные. Связи и зависимости: причинная и функциональная.
- •Понятие анализа данных, его цели и задачи. Связь анализа данных со статистикой
- •Описательная статистика Понятие описательной статистики
- •Ряд распределения
- •Полигон частот. Выборочная функция распределения и гистограмма.
- •Средние характеристики и характеристики рассеяния рядов распределений
- •Аналитическая статистика Понятие аналитической статистики, её составляющие
- •Выборочный метод в прикладной статистике Выборка как модель генеральной совокупности. Цели и задачи выборочного метода.
- •Статистическое понимание случайной выборки
- •Основные этапы формирования выборки
- •Единица отбора выборки
- •Определение объема выборки
- •Типы выборки и методы отбора Многоступенчатая и одноступенчатая выборки
- •Случайные и неслучайные выборки
- •Выборки для психологических исследований
- •Эмпирическая функция распределения и её свойства
- •Статистические оценки параметров генеральной совокупности
- •Параметры генеральной совокупности и выборочные статистики
- •Понятие точечной оценки и её свойства
- •Выборочное среднее как статистическая оценка среднего в генеральной совокупности
- •Статистическая оценка генеральной дисперсии
- •Статистическая оценка вероятности или генеральной доли
- •Понятие интервальной оценки
- •Доверительный интервал и доверительная вероятность
- •Основные задачи интервального оценивания
- •Доверительный интервал для математического ожидания при известном стандартном квадратичном отклонении
- •Доверительный интервал для математического ожидания при неизвестном стандартном квадратичном отклонении
- •Доверительный интервал для генеральной доли
- •Проверка статистических гипотез Понятие статистической проверки гипотез, её цели, задачи и основные понятия
- •Статистический критерий для проверки статистической гипотезы
- •Критическая область критерия: односторонняя и двусторонняя
- •Основной принцип проверки статистической гипотезы
- •Этапы проверки статистических гипотез, минимальный уровень значимости
- •Проверка статистической гипотезы о среднем
- •Проверка статистической гипотезы о равенстве средних
- •Проверка статистической гипотезы о генеральной доле
- •Проверка статистической гипотезы о равенстве долей или вероятностей
- •Программное обеспечение прикладной статистики Информационные технологии расчётов в электронных таблицах (пример - Microsoft Excel)
- •Статистические функции и их использование в Microsoft Excel
- •Построение диаграмм и графиков в Microsoft Excel
- •Информационные технологии статистической обработки данных
Проверка статистической гипотезы о равенстве долей или вероятностей
Пусть в двух генеральных совокупностях проводятся независимые испытания, в результате которых может осуществиться или не осуществиться одно и то же событие.
Обозначим
неизвестную долю появления этого события
в первой генеральной совокупности через
,
а во второй генеральной совокупности
– через
.
Нулевая гипотеза формулируется как
утверждение о равенстве этих долей в
обоих генеральных совокупностях:
,
где
- это просто обозначение общего значения
долей в двух генеральных совокупностях.
В качестве альтернативной гипотезы
можно выбрать следующие варианты:
- двусторонняя,
- односторонняя,
- тоже односторонняя.
Для
осуществления проверки нулевой гипотезы
производится выборка, объёмом
из первой генеральной совокупности,
т.е. для этой генеральной совокупности
произведено
испытаний. Пусть в этих испытаниях
интересующее нас событие появлялось
раз. Тогда относительная частота
появления этого события в выборке из
первой генеральной совокупности
.
Аналогично, производится выборка,
объёмом
из второй генеральной совокупности,
т.е. для этой генеральной совокупности
произведено
испытаний. Пусть в этих испытаниях
интересующее нас событие появлялось
раз. Тогда относительная частота
появления этого события в выборке из
второй генеральной совокупности
.
Если обе выборки достаточно велики, то законы распределения случайных величин и будут близки к нормальному.
Выше
уже обосновывалось, что математическое
ожидание выборочной частоты равно
генеральной доле:
и
.
Дисперсии этих случайных величин таковы:
и
.
Покажем,
что
является несмещённой оценкой для
.
Действительно,
.
Поскольку испытания независимы, выборки
будут тоже независимыми. Тогда можно
использовать следующую формулу для
дисперсии разности:
.
Если
нулевая гипотеза верна, то
.
Величина
- неизвестна, её заменяют наилучшей
точечной статистической оценкой:
.
Для
проверки нулевой гипотезы в этом случае
используют
-оценку,
имеющую стандартное нормальное
распределение:
Вычисленное значение -оценки следует сравнить с критическим. А вывод о том, принимать или отклонять нулевую гипотезу определяется тем, как сформулированы альтернативные гипотезы.
Пусть уровень значимости равен . Напомним, что уровень значимости задаёт исследователь из своих содержательных соображений, используя свой опыт проверки аналогичных гипотез. По таблицам или, например, в Excel необходимо определить значение - границу критической области. Это значение аргумента, при котором стандартная нормальная величина принимает значение .
Случай 1. Альтернативная гипотеза представлена двусторонним неравенством (двусторонняя гипотеза).
Критическая область для такой альтернативной гипотезы будет задаваться неравенством: . Если это неравенство выполняется, нет оснований принимать нулевую гипотезу, т.е. она должна быть отклонена, поскольку значение статистического критерия попадает в критическую область.
Случай 2. Альтернативная гипотеза представлена односторонним неравенством (односторонняя гипотеза).
Критическая область для такой альтернативной гипотезы будет задаваться неравенством: . Если это неравенство выполняется, нет оснований принимать нулевую гипотезу, т.е. она должна быть отклонена, поскольку значение статистического критерия попадает в критическую область.
Случай 3. Альтернативная гипотеза представлена односторонним неравенством (односторонняя гипотеза).
Критическая область для такой альтернативной гипотезы будет задаваться неравенством: . Если это неравенство выполняется, нет оснований принимать нулевую гипотезу, т.е. она должна быть отклонена, поскольку значение статистического критерия попадает в критическую область.
Пример. Для того чтобы оценить в сравнении активность электората Москвы и Санкт-Петербурга при избрании депутатов Государственной Думы, была сделана случайная выборка избирателей в этих двух городах. Затем выяснялось, какая часть каждой выборки реально пришла на тот или иной избирательный участок для участия в выборах. Данные оказались следующими: в Москве из 1500 потенциальных случайно выбранных избирателей реально в выборах приняли участие 480 человек, а в Санкт-Петербурге из 1630 потенциальных избирателей на избирательные участки пришли 490 человек. На уровне значимости 10% проверить гипотезу о равенстве генеральных долей избирателей в двух этих городах, которые реально приняли участие в выборах.
В качестве нулевой гипотезы можно принять равенство генеральных долей избирателей в Москве и в Санкт-Петербурге, а в качестве двусторонней альтернативной гипотезы – неравенство этих долей.
В
данном случае в Москве приняли участие
в выборах
человек из
избирателей, а в Санкт-Петербурге –
человек из
избирателей. Тогда доли избирателей из
выборок, реально принявших участие в
выборах в Москве равна
,
а в Санкт-Петербурге –
.
Вычислим
наилучшую точечную статистическую
оценку доли, если она одинакова в обоих
генеральных совокупностях:
.
Используя эту оценку доли избирателей,
вычислим Z-оценку:
.
По таблице значений функции Лапласа или используя функцию =НОРМСТОБР в Microsoft Excel находим критические значения для нормального распределения: для уровня значимости 0,9 оно равно 1,2816, а дополнительно – для уровня значимости 0,95 оно равно 1,6449, для уровня значимости 0,99 оно равно 2,3263.
Для всех уровней значимости получается, что вычисленное значение Z-оценки оказалось меньшим критических при указанных выше уровнях значимости – 0,9, 0,95 и 0,99. Ъто означает, что вычисленное значение Z-оценки находится в области допустимых значений, поэтому нет оснований отвергать нулевую гипотезу. Следовательно, генеральные доли избирателей, реально принявших участие в выборах в Москве и в Санкт-Петербурге, статистически значимо не отличаются, т.е. их можно считать одинаковыми.
Покажем все найденные значения на графике плотности стандартного нормального закона распределения, который описывает поведение случайной величины Z при справедливости нулевой гипотезы.
График
стандартного нормального распределения
с указанием области допустимых и
критических значений для уровня
значимости 0,9 (
).
Тогда
,
а
).
На этом графике видно, что красная точка, соответствующая вычисленному значению Z-оценки, находится внутри области допустимых значений нулевой гипотезы на уровне значимости 0,9. Это положение красной точки и определяет вывод о том, что нет оснований отвергать нулевую гипотезу на этом уровне значимости.
