- •Математическая статистика для психологов
- •Предмет и содержание курса, взаимосвязь курса со смежными дисциплинами, его значимость для профессиональной подготовки выпускников
- •Стохастичность и вероятность Стохастический характер реальности
- •Современное философское понимание вероятности
- •Роль математики в развитии понятия о вероятности
- •Вероятность как мера случайности
- •Предмет теории вероятностей
- •Определения понятия вероятности
- •Случайные события
- •Классическое определение вероятности
- •Геометрическое определение вероятности
- •Статистическое определение вероятности
- •Субъективная вероятность
- •Алгебра случайных событий
- •Аксиомы алгебры случайных событий
- •Отношения между случайными событиями
- •Простейшие свойства вероятности, помогающие их вычислять
- •Условная вероятность, независимые события и формула умножения вероятностей
- •Формула сложения вероятностей
- •Случайные величины Понятие функции в математике
- •Понятие случайной величины
- •Типы случайных величин
- •Закон распределения случайной величины
- •Ряд распределения дискретной случайной величины
- •Функция распределения случайной величины и её свойства
- •Плотность распределения вероятностей случайной величины
- •Математическое ожидание случайной величины и его свойства
- •Математическое ожидание дискретной случайной величины с конечным числом значений
- •Математическое ожидание дискретной случайной величины с бесконечным числом значений
- •Математическое ожидание непрерывной случайной величины
- •Свойства математического ожидания
- •Дисперсия случайной величины и его свойства
- •Свойства дисперсии
- •Другие характеристики центральных тенденций и изменчивости распределений случайных величин
- •Медиана
- •Квантили
- •Характеристики формы распределения случайной величины Понятие моментов случайной величины и z-оценки
- •Коэффициент асимметрии случайной величины
- •Эксцесс случайной величины
- •Совместные распределения случайных величин
- •Ряд распределения двумерной дискретной случайной величины
- •Плотность распределения для двумерной непрерывной случайной величины
- •Зависимые и независимые случайные величины
- •Понятие ковариации двух случайных величин и его свойства
- •Коэффициент корреляции двух случайных величин и его свойства
- •Законы больших чисел
- •Сходимость по вероятности
- •Неравенства Чебышева
- •Теорема Бернулли
- •Центральная предельная теорема
- •Понятие нормального распределения
- •Стандартное нормальное распределение
- •Правило трёх сигм
- •Нормальное распределение в реальном мире
- •Функция Лапласа
- •Вероятность попадания значения нормальной случайной величины в заданный промежуток
- •Вероятность отклонения значения нормальной случайной величины от математического ожидания
- •Прикладная статистика в психологии Происхождение и история статистики
- •Современное понимание статистики
- •Общее представление о прикладной статистике
- •Основные разделы прикладной статистики
- •Прикладная статистика как способ проверки вероятностных моделей
- •Специфика использования прикладной статистики в психологии
- •Стандарты обработки данных, нормативы представления результатов анализа данных в научной психологии
- •Шкалы измерений, связи и зависимости Научное знание и задачи науки
- •Моделирование в науке
- •Признаки и переменные
- •Понятие измерения в современной науке
- •Мера, метрика, показатель
- •Шкалы измерений, типы данных и переменных
- •Графическое представление данных
- •Зависимые и независимые переменные. Связи и зависимости: причинная и функциональная.
- •Понятие анализа данных, его цели и задачи. Связь анализа данных со статистикой
- •Описательная статистика Понятие описательной статистики
- •Ряд распределения
- •Полигон частот. Выборочная функция распределения и гистограмма.
- •Средние характеристики и характеристики рассеяния рядов распределений
- •Аналитическая статистика Понятие аналитической статистики, её составляющие
- •Выборочный метод в прикладной статистике Выборка как модель генеральной совокупности. Цели и задачи выборочного метода.
- •Статистическое понимание случайной выборки
- •Основные этапы формирования выборки
- •Единица отбора выборки
- •Определение объема выборки
- •Типы выборки и методы отбора Многоступенчатая и одноступенчатая выборки
- •Случайные и неслучайные выборки
- •Выборки для психологических исследований
- •Эмпирическая функция распределения и её свойства
- •Статистические оценки параметров генеральной совокупности
- •Параметры генеральной совокупности и выборочные статистики
- •Понятие точечной оценки и её свойства
- •Выборочное среднее как статистическая оценка среднего в генеральной совокупности
- •Статистическая оценка генеральной дисперсии
- •Статистическая оценка вероятности или генеральной доли
- •Понятие интервальной оценки
- •Доверительный интервал и доверительная вероятность
- •Основные задачи интервального оценивания
- •Доверительный интервал для математического ожидания при известном стандартном квадратичном отклонении
- •Доверительный интервал для математического ожидания при неизвестном стандартном квадратичном отклонении
- •Доверительный интервал для генеральной доли
- •Проверка статистических гипотез Понятие статистической проверки гипотез, её цели, задачи и основные понятия
- •Статистический критерий для проверки статистической гипотезы
- •Критическая область критерия: односторонняя и двусторонняя
- •Основной принцип проверки статистической гипотезы
- •Этапы проверки статистических гипотез, минимальный уровень значимости
- •Проверка статистической гипотезы о среднем
- •Проверка статистической гипотезы о равенстве средних
- •Проверка статистической гипотезы о генеральной доле
- •Проверка статистической гипотезы о равенстве долей или вероятностей
- •Программное обеспечение прикладной статистики Информационные технологии расчётов в электронных таблицах (пример - Microsoft Excel)
- •Статистические функции и их использование в Microsoft Excel
- •Построение диаграмм и графиков в Microsoft Excel
- •Информационные технологии статистической обработки данных
Центральная предельная теорема
Многие из случайных явлений возникают в результате взаимодействия, совместного проявления большого числа малых по воздействию и возбуждаемым эффектам случайных факторов, разнонаправленных возмущений. Примерами могут служить помехи в радиотехнике, диффузии в жидкостях и газах, рост некоторых микроорганизмов и другие. При некоторых условиях действие таких малых по воздействию факторов и возмущений приводит к тому, что величина результирующего или суммарного эффекта совокупного действия таких факторов становится случайной величиной, мало отличающейся от нормально распределённой случайной величины.
Описание условий, при которых это становится возможным, составляет условие центральной предельной теоремы. Эта теорема существует в разных вариантах, но её заключение всегда состоит в том, что суммарный эффект действия относительно слабых факторов является случайной величиной, мало отличающейся от нормально распределённой случайной величины.
Иначе говоря, когда проводится суммирование большого количества независимых случайных величин (или зависимых несильно) с близкими масштабами (никакое слагаемое не вносит в сумму большой вклад, отдельное слагаемое как бы не является «решающей силой». Тогда согласно центральной предельной теореме сумма – это случайная величина, имеющая распределение, близкое к нормальному распределению.
Это пояснение показывает, как можно, например, смоделировать нормальное распределение. Берём n случайных (точнее, псевдослучайных чисел), полученных программно по обычному датчику случайных чисел, который есть в любой программной среде разработки, например, в сети Интернет. Такие датчики моделируют равномерное распределение. Каждое из n чисел должно находиться в одном и том же заранее выбранном диапазоне (скажем, [0; 1]). Тогда сумма из n случайных чисел и будет случайной величиной, распределение которой можно считать нормальным при достаточно большом n, т.е. при достаточно большом числе сгенерированных случайных числе. Если выбирался диапазон [0; 1], то математическое ожидание этой нормальной случайной величины составит n/2.
Центральная предельная теорема определяет условия, при которых довольно часто в практике проведения разнообразных испытаний появляются случайные величины с нормальными законами распределения. Центральная предельная теорема имеет несколько форм, в каждой из которых задаются различные условия на распределения участвующих в её формулировках случайные величины.
Более
точная формулировка центральной
предельной теоремы может быть следующей.
Обозначим через
.
Тогда при определённых условиях на
последовательность случайных величин
для всякого
будет верно, что
.
Разные формулировки центральной
предельной теоремы различаются, в
частности, условиями, которые накладываются
на последовательность случайных величин
.
В
следующей формулировке центральная
предельная теорема нередко применяется
на практике, например, при проведении
измерений тех или иных величин. В
соответствии с этой формулировкой от
последовательности случайных величин
требуется иметь примерно равные
дисперсии, т.е. слабо отличающиеся от
некоторого среднего значения. Центральная
предельная теорема при таких условиях
утверждает, что при взятии предела при
закон распределения суммарной случайной
величины
будет неограниченно приближаться к
нормальному, математическое ожидание
которого будет стремиться к
,
а дисперсия – к
.
Слабое отличие дисперсий означает, что
вероятность существенного отклонения
от их среднего значения очень мала.
Какие отклонения значений дисперсий
считаются существенными, какие – нет,
какие вероятности отклонений следует
считать малыми, а какие – нет, определяется
весьма непросто и здесь не приводится.
Более общая формулировка центральной предельной теоремы может быть следующей. Если случайная величина равна сумме достаточно большого числа независимых случайных величин, вклад каждой из которых в общую сумму является малым, то закон распределения суммарной случайной величины будет близок к нормальному.
Эта формулировка центральной предельной теоремы показывает, почему в современной теории вероятностей и прикладной статистике такое большое значение имеет нормальное распределение. Оно с высокой точностью возникает тогда, когда суммируются много независимых или слабо зависимых случайных величин, сравнимых между собой по порядку влияния на величину общей суммы. Эта как раз ситуация, в которой и возникают вероятности: когда результат какого-то испытания определяется воздействием на это результат большого числа независимо действующих относительно слабых факторов. В таких ситуациях результат конкретного испытания не может быть точно спрогнозирован, но определённые закономерности появляются при большом числе проведённых испытаний. Эти закономерности позволяют определить вероятность как меру случайности. При этом на основании центральной предельной теоремы оказывается, что в самом определении вероятности очень велика значимость нормального распределения: именно оно появляется в пределе при проведении серий испытаний и закономерности случайности, выражаемые вероятностями, во многих случаях на практике определяются свойствами именно нормальных распределений.
Например, когда на практике пытаются определить значение какой-то величины, чаще всего проводят несколько измерений, а потом вычисляют среднее значение результатов всех проведённых измерений. По теории и по обобщению практического опыта при этом необходимо следить, чтобы в серии независимо проведённых измерений, т.е. испытаний, не появлялось каких-то систематических ошибок, т.е. не было каких-то существенных воздействий какого-то фактора на общий результат. В этих условиях, как утверждает центральная предельная теорема, ошибка измерения будет случайной величиной с нормальным распределением, для которой наиболее вероятным значением будет его математическое ожидание или среднее значение. Если систематические ошибки исключены, то математическое ожидание суммы всех ошибок будет равно 0. Поэтому среднее значение для серии измерений с высокой вероятностью будет равно истинному значению измеряемой величины. Именно в применении к теории ошибок Лапласом и Гауссом был впервые описан нормальный закон распределения и показана его значимость в теории вероятностей и прикладной статистике.
Справедливость центральной предельной теоремы объясняет широкую распространенность нормальных распределений в социологических исследования. Так, одна из формулировок центральной предельной теоремы в форме теоремы Ляпунова утверждает, что если значения некоторой случайной величины складываются из значений достаточно большого количества произвольно распределенных независимых величин, каждая из которых действует на первую величину сравнительно слабо, то первая величина распределена нормально. Многие переменные, изучаемые в ходе социологических исследований, интегрируют в себе большую совокупность не связанных друг с другом социальных, экономических, психологических и других факторов, каждый из которых в отдельности оказывает на итоговую переменную сравнительно слабое влияние. А такие переменные, согласно указанной теореме, должны быть распределены нормально.
В массовых социологических исследованиях поэтому так распространены случайные выборки: случайность их построения гарантирует выявление параметров генеральных совокупностей с большой точностью. При этом случайность в построении выборки никоим образом не отождествляется со стихийностью или произвольностью отбора – напротив, случайность означает то, что все объекты генеральной совокупности должны иметь равные шансы попасть в выборку.
Центральная предельная теорема гарантирует, что статистики случайной выборки будут близки к значениям параметров генеральной совокупности: эти параметры распределены нормально, следовательно, случайная выборка даст статистически малозначимые отклонения своих статистик от параметров такой генеральной совокупности. Например, если в обществе сформировалось какое-то мнение относительно той или иной проблемы, то большинство граждан будут высказывать именно это мнение в социологическом опросе, если выборка будет случайной. Неслучайная выборка может сдвинуть ответы респондентов опроса от истинных значений параметров генеральной совокупности.
Для обоснования выборочных опросов в социологии используется такая формулировка центральной предельной теоремы: для очень широкого круга случайных величин, если будем формировать выборки достаточно большого объема и рассчитывать для каждой выборки среднее значение рассматриваемой случайной величины, распределение таких выборочных средних будет близким к нормальному со средним, равным средней в генеральной совокупности, и дисперсией этого среднего, равной дисперсии генеральной совокупности, делённой на объём выборки. Чем выше будет объём выборки, тем, следовательно, меньше будет дисперсия средней, т.е. истинное значение средней выборочной средней будет меньше отклоняться от средней в генеральной совокупности. Поэтому, чем больше объём выборки в социологическом исследовании, тем выше точность определения средних генеральных совокупностей по средним в этих выборках.
Многие методы статистического анализа социологических данных предполагают нормальность распределений рассматриваемых переменных, например, методы анализа регрессионного и анализа дисперсионного. Поэтому сама возможность их использования для решения стоящей перед социологом задачи в значительной мере определяется справедливостью центральной предельной теоремы.
