- •Математическая статистика для психологов
- •Предмет и содержание курса, взаимосвязь курса со смежными дисциплинами, его значимость для профессиональной подготовки выпускников
- •Стохастичность и вероятность Стохастический характер реальности
- •Современное философское понимание вероятности
- •Роль математики в развитии понятия о вероятности
- •Вероятность как мера случайности
- •Предмет теории вероятностей
- •Определения понятия вероятности
- •Случайные события
- •Классическое определение вероятности
- •Геометрическое определение вероятности
- •Статистическое определение вероятности
- •Субъективная вероятность
- •Алгебра случайных событий
- •Аксиомы алгебры случайных событий
- •Отношения между случайными событиями
- •Простейшие свойства вероятности, помогающие их вычислять
- •Условная вероятность, независимые события и формула умножения вероятностей
- •Формула сложения вероятностей
- •Случайные величины Понятие функции в математике
- •Понятие случайной величины
- •Типы случайных величин
- •Закон распределения случайной величины
- •Ряд распределения дискретной случайной величины
- •Функция распределения случайной величины и её свойства
- •Плотность распределения вероятностей случайной величины
- •Математическое ожидание случайной величины и его свойства
- •Математическое ожидание дискретной случайной величины с конечным числом значений
- •Математическое ожидание дискретной случайной величины с бесконечным числом значений
- •Математическое ожидание непрерывной случайной величины
- •Свойства математического ожидания
- •Дисперсия случайной величины и его свойства
- •Свойства дисперсии
- •Другие характеристики центральных тенденций и изменчивости распределений случайных величин
- •Медиана
- •Квантили
- •Характеристики формы распределения случайной величины Понятие моментов случайной величины и z-оценки
- •Коэффициент асимметрии случайной величины
- •Эксцесс случайной величины
- •Совместные распределения случайных величин
- •Ряд распределения двумерной дискретной случайной величины
- •Плотность распределения для двумерной непрерывной случайной величины
- •Зависимые и независимые случайные величины
- •Понятие ковариации двух случайных величин и его свойства
- •Коэффициент корреляции двух случайных величин и его свойства
- •Законы больших чисел
- •Сходимость по вероятности
- •Неравенства Чебышева
- •Теорема Бернулли
- •Центральная предельная теорема
- •Понятие нормального распределения
- •Стандартное нормальное распределение
- •Правило трёх сигм
- •Нормальное распределение в реальном мире
- •Функция Лапласа
- •Вероятность попадания значения нормальной случайной величины в заданный промежуток
- •Вероятность отклонения значения нормальной случайной величины от математического ожидания
- •Прикладная статистика в психологии Происхождение и история статистики
- •Современное понимание статистики
- •Общее представление о прикладной статистике
- •Основные разделы прикладной статистики
- •Прикладная статистика как способ проверки вероятностных моделей
- •Специфика использования прикладной статистики в психологии
- •Стандарты обработки данных, нормативы представления результатов анализа данных в научной психологии
- •Шкалы измерений, связи и зависимости Научное знание и задачи науки
- •Моделирование в науке
- •Признаки и переменные
- •Понятие измерения в современной науке
- •Мера, метрика, показатель
- •Шкалы измерений, типы данных и переменных
- •Графическое представление данных
- •Зависимые и независимые переменные. Связи и зависимости: причинная и функциональная.
- •Понятие анализа данных, его цели и задачи. Связь анализа данных со статистикой
- •Описательная статистика Понятие описательной статистики
- •Ряд распределения
- •Полигон частот. Выборочная функция распределения и гистограмма.
- •Средние характеристики и характеристики рассеяния рядов распределений
- •Аналитическая статистика Понятие аналитической статистики, её составляющие
- •Выборочный метод в прикладной статистике Выборка как модель генеральной совокупности. Цели и задачи выборочного метода.
- •Статистическое понимание случайной выборки
- •Основные этапы формирования выборки
- •Единица отбора выборки
- •Определение объема выборки
- •Типы выборки и методы отбора Многоступенчатая и одноступенчатая выборки
- •Случайные и неслучайные выборки
- •Выборки для психологических исследований
- •Эмпирическая функция распределения и её свойства
- •Статистические оценки параметров генеральной совокупности
- •Параметры генеральной совокупности и выборочные статистики
- •Понятие точечной оценки и её свойства
- •Выборочное среднее как статистическая оценка среднего в генеральной совокупности
- •Статистическая оценка генеральной дисперсии
- •Статистическая оценка вероятности или генеральной доли
- •Понятие интервальной оценки
- •Доверительный интервал и доверительная вероятность
- •Основные задачи интервального оценивания
- •Доверительный интервал для математического ожидания при известном стандартном квадратичном отклонении
- •Доверительный интервал для математического ожидания при неизвестном стандартном квадратичном отклонении
- •Доверительный интервал для генеральной доли
- •Проверка статистических гипотез Понятие статистической проверки гипотез, её цели, задачи и основные понятия
- •Статистический критерий для проверки статистической гипотезы
- •Критическая область критерия: односторонняя и двусторонняя
- •Основной принцип проверки статистической гипотезы
- •Этапы проверки статистических гипотез, минимальный уровень значимости
- •Проверка статистической гипотезы о среднем
- •Проверка статистической гипотезы о равенстве средних
- •Проверка статистической гипотезы о генеральной доле
- •Проверка статистической гипотезы о равенстве долей или вероятностей
- •Программное обеспечение прикладной статистики Информационные технологии расчётов в электронных таблицах (пример - Microsoft Excel)
- •Статистические функции и их использование в Microsoft Excel
- •Построение диаграмм и графиков в Microsoft Excel
- •Информационные технологии статистической обработки данных
Основные задачи интервального оценивания
В интервальном оценивании чаще всего решается одна из следующих задач:
1. Известны объём выборки и доверительная вероятность, либо они просто заданы техническим заданием на проведение исследования. Необходимо найти доверительный интервал для значений того или иного параметра генеральной совокупности.
2. Известны объём выборки и ширина доверительного интервала, т.е. известна требуемая точность определения значения параметра генеральной совокупности. Необходимо найти доверительную вероятность, с которой в такой доверительный интервал будут попадать значения того или иного параметра генеральной совокупности. Это задача прогноза того, с какой вероятностью будет получена интервальная оценка, если исследователи зададут тот или иной доверительный интервал или его ширину в симметричном случае.
3. Известны ширина доверительного интервала и доверительная вероятность, с которой в такой доверительный интервал будут попадать значения того или иного параметра генеральной совокупности. Эти значения ширины доверительного интервала и доверительной вероятности, т.е. указание точности необходимого измерения значения параметра генеральной совокупности, могут быть просто заданы техническим заданием на проведение исследования. Необходимо найти объём случайной выборки, обеспечивающий значениям ширины доверительного интервала и доверительной вероятности соответствующую точность интервального оценивания.
Доверительный интервал для математического ожидания при известном стандартном квадратичном отклонении
Известно
значение дисперсии
распределения некоторого параметра
генеральной совокупности. Обозначим
неизвестное нам значение математического
ожидания этого параметра генеральной
совокупности через
,
интервальную оценку которого нам
необходимо найти.
Предполагаем, что значения этого параметра в генеральной совокупности распределены по нормальному закону. Это не всегда легко проверить. Часто для проверки используются те или иные варианты законов больших чисел. Обычно, например, распределения, близкие к нормальным получаются в ситуациях действия многих относительно слабых и независимых факторов, которые могут определить значение этого параметра в генеральной совокупности.
В
большинстве случаев необходимо не то,
что значения этого параметра в генеральной
совокупности распределены по нормальному
закону. Пусть сделана выборка
из распределения
для случайной величины
.
Достаточно того, чтобы по нормальному
закону были распределены значения
выборочной средней
.
Можно доказать, что при достаточно
больших объёмах выборок (
)
закон распределения выборочной средней
будет близок к нормальному. Этот вывод
обосновывается применением законов
больших чисел.
Как
мы уже выяснили, математическое ожидание
выборочной средней равно математическому
ожиданию или среднему значений в
генеральной совокупности:
,
а дисперсия выборочной средней будет
.
Тогда стандартное квадратичное отклонение
для
будет равно
.
Предположим,
что мы задали доверительную вероятность
,
с которой значение среднего генеральной
совокупности попадает в доверительный
интервал, т.е. выполняется
.
В этом соотношении
известно, задано, а
нужно определить. Поскольку
является случайной величиной,
распределённой по нормальному закону,
для неё по свойствам функции распределения
для нормального закона:
Напомним,
что здесь
- это функция Лапласа, определяющая
значения функции распределения
стандартной нормальной случайной
величины с математическим ожиданием
или средней, равной 0, а дисперсией – 1.
У
нас получилось, что
.
Из этого соотношения нужно найти
.
Если мы для удобства обозначим через
,
то получим возможность выразить через
значение половины ширины доверительного
интервала:
.
А значение
определяется из уравнения
.
На практике значение
определяют либо по таблицам функции
Лапласа, либо расчётным путём из функции,
обратной к функции Лапласа. Последняя
возможность имеется, например, в
электронных таблицах Microsoft Excel.
В
результате получилось, что при заданном
значении дисперсии
распределения значений параметра в
генеральной совокупности на уровне
доверительной вероятности
значение его средней
в генеральной совокупности находится
внутри доверительного интервала
,
т.е.
,
где
- это реализация средней в сделанной
выборке из генеральной совокупности.
Как
видно, при возрастании объёма выборки
точность такой интервальной оценки
увеличивается, потому что значение
уменьшается. С другой стороны,
- это возрастающая функция, поэтому из
уравнения
получается, что увеличение уровня
доверительной вероятности приводит к
увеличению значения
,
а, следовательно, и
,
т.е. приводит к снижению точности
интервальной оценки. Можно сказать, что
чем точнее интервальная оценка, тем
ниже её доверительная вероятность, а
чем менее точна интервальная оценка,
тем с большей точностью её можно сделать.
Заметим,
что эти формулы были получены для
повторной выборки. Для бесповторной
выборки логика вывода остаётся неизменной,
но необходимо использовать дополнительный
множитель в определении
,
где
- это объём генеральной совокупности.
Если
мало, например, когда объём генеральной
совокупности
велик или бесповторная выборка имеет
объём малый относительно объёма
генеральной совокупности, множитель
с высокой точностью равен 1, и им можно
пренебречь. В этом случае для бесповторной
выборки можно использовать те же формулы,
что и для повторной без существенного
снижения уровня точности определения
ширины доверительного интервала.
Таким образом, последовательность действий для определения доверительного интервала математического ожидания некоторого параметра в генеральной совокупности при известном значении дисперсии распределения этого параметра генеральной совокупности с заданной доверительной вероятностью должна быть следующей.
Вычисляем значение половины доверительной вероятности
.По таблицам функции Лапласа
или вычислениями в Microsoft
Excel находим такое значение
,
для которого
.
При вычислениях в Microsoft
Excel, а иногда и при
использовании статистических таблиц
часто вместо функции Лапласа
используют функцию
.
В таких случаях для пересчёта значений
нужно воспользоваться соотношением
и тогда решать уравнение:
,
т.е. искать такое значение
,
для которого
или записанное иначе
.Вычисляется половина доверительного интервала по формуле .
Доверительный интервал записывается в виде
или
.
На этом вычисление доверительного интервала при данных условиях заканчивается.
