- •Математическая статистика для психологов
- •Предмет и содержание курса, взаимосвязь курса со смежными дисциплинами, его значимость для профессиональной подготовки выпускников
- •Стохастичность и вероятность Стохастический характер реальности
- •Современное философское понимание вероятности
- •Роль математики в развитии понятия о вероятности
- •Вероятность как мера случайности
- •Предмет теории вероятностей
- •Определения понятия вероятности
- •Случайные события
- •Классическое определение вероятности
- •Геометрическое определение вероятности
- •Статистическое определение вероятности
- •Субъективная вероятность
- •Алгебра случайных событий
- •Аксиомы алгебры случайных событий
- •Отношения между случайными событиями
- •Простейшие свойства вероятности, помогающие их вычислять
- •Условная вероятность, независимые события и формула умножения вероятностей
- •Формула сложения вероятностей
- •Случайные величины Понятие функции в математике
- •Понятие случайной величины
- •Типы случайных величин
- •Закон распределения случайной величины
- •Ряд распределения дискретной случайной величины
- •Функция распределения случайной величины и её свойства
- •Плотность распределения вероятностей случайной величины
- •Математическое ожидание случайной величины и его свойства
- •Математическое ожидание дискретной случайной величины с конечным числом значений
- •Математическое ожидание дискретной случайной величины с бесконечным числом значений
- •Математическое ожидание непрерывной случайной величины
- •Свойства математического ожидания
- •Дисперсия случайной величины и его свойства
- •Свойства дисперсии
- •Другие характеристики центральных тенденций и изменчивости распределений случайных величин
- •Медиана
- •Квантили
- •Характеристики формы распределения случайной величины Понятие моментов случайной величины и z-оценки
- •Коэффициент асимметрии случайной величины
- •Эксцесс случайной величины
- •Совместные распределения случайных величин
- •Ряд распределения двумерной дискретной случайной величины
- •Плотность распределения для двумерной непрерывной случайной величины
- •Зависимые и независимые случайные величины
- •Понятие ковариации двух случайных величин и его свойства
- •Коэффициент корреляции двух случайных величин и его свойства
- •Законы больших чисел
- •Сходимость по вероятности
- •Неравенства Чебышева
- •Теорема Бернулли
- •Центральная предельная теорема
- •Понятие нормального распределения
- •Стандартное нормальное распределение
- •Правило трёх сигм
- •Нормальное распределение в реальном мире
- •Функция Лапласа
- •Вероятность попадания значения нормальной случайной величины в заданный промежуток
- •Вероятность отклонения значения нормальной случайной величины от математического ожидания
- •Прикладная статистика в психологии Происхождение и история статистики
- •Современное понимание статистики
- •Общее представление о прикладной статистике
- •Основные разделы прикладной статистики
- •Прикладная статистика как способ проверки вероятностных моделей
- •Специфика использования прикладной статистики в психологии
- •Стандарты обработки данных, нормативы представления результатов анализа данных в научной психологии
- •Шкалы измерений, связи и зависимости Научное знание и задачи науки
- •Моделирование в науке
- •Признаки и переменные
- •Понятие измерения в современной науке
- •Мера, метрика, показатель
- •Шкалы измерений, типы данных и переменных
- •Графическое представление данных
- •Зависимые и независимые переменные. Связи и зависимости: причинная и функциональная.
- •Понятие анализа данных, его цели и задачи. Связь анализа данных со статистикой
- •Описательная статистика Понятие описательной статистики
- •Ряд распределения
- •Полигон частот. Выборочная функция распределения и гистограмма.
- •Средние характеристики и характеристики рассеяния рядов распределений
- •Аналитическая статистика Понятие аналитической статистики, её составляющие
- •Выборочный метод в прикладной статистике Выборка как модель генеральной совокупности. Цели и задачи выборочного метода.
- •Статистическое понимание случайной выборки
- •Основные этапы формирования выборки
- •Единица отбора выборки
- •Определение объема выборки
- •Типы выборки и методы отбора Многоступенчатая и одноступенчатая выборки
- •Случайные и неслучайные выборки
- •Выборки для психологических исследований
- •Эмпирическая функция распределения и её свойства
- •Статистические оценки параметров генеральной совокупности
- •Параметры генеральной совокупности и выборочные статистики
- •Понятие точечной оценки и её свойства
- •Выборочное среднее как статистическая оценка среднего в генеральной совокупности
- •Статистическая оценка генеральной дисперсии
- •Статистическая оценка вероятности или генеральной доли
- •Понятие интервальной оценки
- •Доверительный интервал и доверительная вероятность
- •Основные задачи интервального оценивания
- •Доверительный интервал для математического ожидания при известном стандартном квадратичном отклонении
- •Доверительный интервал для математического ожидания при неизвестном стандартном квадратичном отклонении
- •Доверительный интервал для генеральной доли
- •Проверка статистических гипотез Понятие статистической проверки гипотез, её цели, задачи и основные понятия
- •Статистический критерий для проверки статистической гипотезы
- •Критическая область критерия: односторонняя и двусторонняя
- •Основной принцип проверки статистической гипотезы
- •Этапы проверки статистических гипотез, минимальный уровень значимости
- •Проверка статистической гипотезы о среднем
- •Проверка статистической гипотезы о равенстве средних
- •Проверка статистической гипотезы о генеральной доле
- •Проверка статистической гипотезы о равенстве долей или вероятностей
- •Программное обеспечение прикладной статистики Информационные технологии расчётов в электронных таблицах (пример - Microsoft Excel)
- •Статистические функции и их использование в Microsoft Excel
- •Построение диаграмм и графиков в Microsoft Excel
- •Информационные технологии статистической обработки данных
Этапы проверки статистических гипотез, минимальный уровень значимости
Для проверки статических гипотез необходимо выполнить следующую последовательность действий или этапов.
Сформулировать нулевую и альтернативную гипотезы так, чтобы их можно было проверить уже разработанными статистическим критериями, и по результатам их проверки можно было сделать содержательные выводы для анализируемой ситуации.
Выбрать или установить уровень значимости, на котором будет осуществляться проверка нулевой статистической гипотезы. Выбор осуществляется на основании традиции и опыта аналогичных проверок.
Выбор статистического критерия для проверки нулевой гипотезы. Осуществляется по справочникам с использованием опыта и традиций анализа статистических данных. При прочих равных нужно брать критерии с максимально возможными мощностями.
По заданному уровню значимости определить по таблицам критическое или критические значения выбранного статистического критерия. К анализируемой ситуации это отношения не имеет.
Вычислить фактическое значение статистического критерия в анализируемой ситуации.
Сравнить вычисленное значение статистического критерия с его критическими значениями, полученными для заданного уровня значимости. Если вычисленное значение критерия попадает в критическую область, то нулевая гипотеза отклоняется. Если вычисленное значение критерия попадает в область допустимых значений, нулевая гипотеза не отклоняется, фактически, она принимается.
Эта последовательность действий должна осуществляться при проверке любых статистических гипотез. Различия в этих действиях будут только в том, какие статистические критерии выбираются и, соответственно, какие у них будут критические области. Для проверки одной и той же гипотезы можно использовать не один, а несколько статистических критериев, как уже отмечалось, лучше отдавать предпочтение тем статистическим критериям, которые имеют наибольшие мощности.
В некоторых случаях при проверке статистической гипотезы ставится более сложная задача: найти минимальный уровень значимости, т.е. для полученного вычислениями по выборке значения статистического критерия найти уровень значимости, при котором следует отказаться от нулевой гипотезы, но при значениях, меньших этого уровня значимости, от неё отказываться не следует. Обычно такая задача решается методом подбора такого минимального уровня значимости для вычисленного значения статистического критерия, например, по статистическим таблицам.
Проверка статистической гипотезы о среднем
Пусть - случайная величина, распределённая по нормальному закону с математическим ожиданием и дисперсией . Процедуры и выводы этого раздела можно применять и в тех случаях, когда случайная величина распределена не точно по нормальному закону, но близко к нему.
Сначала рассмотрим случай, когда математическое ожидание этой случайной величины неизвестно и его необходимо определить, но дисперсия этой случайной величины известна.
Типичная
статистическая гипотеза в этом случае
может быть сформулирована так:
,
где
- предполагаемое значение математического
ожидания. Альтернативные гипотезы для
этой нулевой могут быть трёх разных
вариантов:
(двусторонняя гипотеза),
(левосторонняя гипотеза) или
(правосторонняя гипотеза). Неравенства
в односторонних гипотезах можно заменять
нестрогими, результаты проверки от
этого не изменятся, потому что вероятность
принять какое-то конкретное значение
для нормальной случайной величины равна
нулю.
В
предположении, что дисперсия
случайной величины
известна, в качестве статистического
критерия можно использовать
-оценку:
,
где
-
средняя по выборке,
- предполагаемое значение средней по
генеральной совокупности,
- стандартное квадратичное отклонение
в генеральной совокупности,
- объём выборки. Вычисленное значение
-оценки
следует сравнить с критическим. А вывод
о том, принимать или отклонять нулевую
гипотезу определяется тем, как
сформулированы альтернативные гипотезы.
Случай 1. Альтернативная гипотеза представлена двусторонним неравенством (двусторонняя гипотеза).
Пусть
уровень значимости равен
.
По таблицам или, например, в Excel
необходимо определить значение
- границу критической области. Это
значение аргумента, при котором
стандартная нормальная величина
принимает значение
.
Критическая
область для такой альтернативной
гипотезы будет задаваться неравенством:
.
Если это неравенство выполняется, нет
оснований принимать нулевую гипотезу,
т.е. она должна быть отклонена, поскольку
значение статистического критерия
попадает в критическую область.
Случай 2. Альтернативная гипотеза представлена односторонним неравенством (односторонняя гипотеза).
Пусть уровень значимости равен . По таблицам или, например, в Excel необходимо определить значение - границу критической области. Это значение аргумента, при котором стандартная нормальная величина принимает значение .
Критическая
область для такой альтернативной
гипотезы будет задаваться неравенством:
.
Если это неравенство выполняется, нет
оснований принимать нулевую гипотезу,
т.е. она должна быть отклонена, поскольку
значение статистического критерия
попадает в критическую область.
Случай 3. Альтернативная гипотеза представлена односторонним неравенством (односторонняя гипотеза).
Пусть уровень значимости равен . По таблицам или, например, в Excel необходимо определить значение - границу критической области. Это значение аргумента, при котором стандартная нормальная величина принимает значение .
Критическая
область для такой альтернативной
гипотезы будет задаваться неравенством:
.
Если это неравенство выполняется, нет
оснований принимать нулевую гипотезу,
т.е. она должна быть отклонена, поскольку
значение статистического критерия
попадает в критическую область.
В
предположении, что дисперсия
случайной величины
неизвестна, в качестве статистического
критерия можно использовать
-распределение
Стьюдента:
,
где
-
средняя по выборке,
- предполагаемое значение средней по
генеральной совокупности,
- стандартное квадратичное отклонение
в выборке, определённое с учётом поправки
на несмещённость,
- объём выборки. В таком случае число
степеней свободы, от которого зависят
значения
-распределения
Стьюдента, будет равно
.
Вычисленное значение
следует сравнить с критическим
,
определяемым как аргумент функции
распределения
-распределения
Стьюдента, при котором значение этой
функции распределения равно уровню
значимости
.
А вывод о том, принимать или отклонять
нулевую гипотезу определяется тем, как
сформулированы альтернативные гипотезы.
Случай
1. Альтернативная гипотеза представлена
двусторонним неравенством
(двусторонняя гипотеза). Критическая
область для такой альтернативной
гипотезы будет задаваться неравенством:
.
Если это неравенство выполняется, нет
оснований принимать нулевую гипотезу,
т.е. она должна быть отклонена, поскольку
значение статистического критерия
попадает в критическую область.
Случай
2. Альтернативная гипотеза представлена
односторонним неравенством
(односторонняя гипотеза). Критическая
область для такой альтернативной
гипотезы будет задаваться неравенством:
.
Если это неравенство выполняется, нет
оснований принимать нулевую гипотезу,
т.е. она должна быть отклонена, поскольку
значение статистического критерия
попадает в критическую область.
Случай
3. Альтернативная гипотеза представлена
односторонним неравенством
(односторонняя гипотеза). Критическая
область для такой альтернативной
гипотезы будет задаваться неравенством:
.
Если это неравенство выполняется, нет
оснований принимать нулевую гипотезу,
т.е. она должна быть отклонена, поскольку
значение статистического критерия
попадает в критическую область.
Пример. Владелец небольшого магазина утверждает, что среднедневная выручка за прошлый год у него составила 35000 рублей. Для проверки были выбраны 40 дней этого года, по которым среднедневная выручка составила 33500 рублей при стандартном отклонении 3500 рублей. Можно ли на уровне значимости 0,95 доверять утверждению владельца магазина о его среднедневной выручке за прошлый год? А на уровне значимости 0,99?
В данном случае нулевой гипотезой будем считать равенство среднедневных выручек по данным владельца магазина и по данным выборочной проверки. Альтернативной гипотезой будем считать неравенство этих средних. Поскольку нам известно стандартное отклонение только для выборочной проверки, в качестве статистического критерия необходимо использовать -распределение Стьюдента.
Вычисляем
значение
-распределения
Стьюдента при средней по генеральной
совокупности
,
среднем по выборке
,
стандартном отклонении по выборке
,
объёме выборки
,
а потому числе степеней свободы
:
.
Для
уровня значимости 0,95 и числе степеней
свободы 39 определяем критическое
значение
-распределения
Стьюдента, оно равно 2,0227. При этом для
расчётов в Microsoft Excel необходимо
использовать функцию =СТЬЮДРАСПОБР, а
в качестве уровня значимости его
американское значение
.
В нашем случае получается, что вычисленное
значение
-распределения
Стьюдента лежит вне области допустимых
значений, потому что 2,7105>2,0227.
Следовательно, на уровне значимости
0,95 нулевая гипотеза отвергается, и
владелец магазина занизил среднедневную
выручку за прошлый год. Аналогично, на
уровне значимости 0,99 критическое
значение
-распределения
Стьюдента будет равно 2,7079. И на этом,
более высоком уровне значимости
вычисленное значение
-распределения
Стьюдента лежит вне области допустимых
значений, потому что 2,7105>2,7079.
Следовательно, с ещё большей достоверностью,
можно утверждать, что владелец магазина
занизил среднедневную выручку за прошлый
год.
