Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Psy_stat_bach_1.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.74 Mб
Скачать

Центральная предельная теорема

Многие из случайных явлений возникают в результате взаимодействия, совместного проявления большого числа малых по воздействию и возбуждаемым эффектам случайных факторов, разнонаправленных возмущений. Примерами могут служить помехи в радиотехнике, диффузии в жидкостях и газах, рост некоторых микроорганизмов и другие. При некоторых условиях действие таких малых по воздействию факторов и возмущений приводит к тому, что величина результирующего или суммарного эффекта совокупного действия таких факторов становится случайной величиной, мало отличающейся от нормально распределённой случайной величины.

Описание условий, при которых это становится возможным, составляет условие центральной предельной теоремы. Эта теорема существует в разных вариантах, но её заключение всегда состоит в том, что суммарный эффект действия относительно слабых факторов является случайной величиной, мало отличающейся от нормально распределённой случайной величины.

Иначе говоря, когда проводится суммирование большого количества независимых случайных величин (или зависимых несильно) с близкими масштабами (никакое слагаемое не вносит в сумму большой вклад, отдельное слагаемое как бы не является «решающей силой». Тогда согласно центральной предельной теореме сумма – это случайная величина, имеющая распределение, близкое к нормальному распределению.

Это пояснение показывает, как можно, например, смоделировать нормальное распределение. Берём n случайных (точнее, псевдослучайных чисел), полученных программно по обычному датчику случайных чисел, который есть в любой программной среде разработки, например, в сети Интернет. Такие датчики моделируют равномерное распределение. Каждое из n чисел должно находиться в одном и том же заранее выбранном диапазоне (скажем, [0; 1]). Тогда сумма из n случайных чисел и будет случайной величиной, распределение которой можно считать нормальным при достаточно большом n, т.е. при достаточно большом числе сгенерированных случайных числе. Если выбирался диапазон [0; 1], то математическое ожидание этой нормальной случайной величины составит n/2.

Центральная предельная теорема определяет условия, при которых довольно часто в практике проведения разнообразных испытаний появляются случайные величины с нормальными законами распределения. Центральная предельная теорема имеет несколько форм, в каждой из которых задаются различные условия на распределения участвующих в её формулировках случайные величины.

Более точная формулировка центральной предельной теоремы может быть следующей. Обозначим через . Тогда при определённых условиях на последовательность случайных величин для всякого будет верно, что . Разные формулировки центральной предельной теоремы различаются, в частности, условиями, которые накладываются на последовательность случайных величин .

В следующей формулировке центральная предельная теорема нередко применяется на практике, например, при проведении измерений тех или иных величин. В соответствии с этой формулировкой от последовательности случайных величин требуется иметь примерно равные дисперсии, т.е. слабо отличающиеся от некоторого среднего значения. Центральная предельная теорема при таких условиях утверждает, что при взятии предела при закон распределения суммарной случайной величины будет неограниченно приближаться к нормальному, математическое ожидание которого будет стремиться к , а дисперсия – к . Слабое отличие дисперсий означает, что вероятность существенного отклонения от их среднего значения очень мала. Какие отклонения значений дисперсий считаются существенными, какие – нет, какие вероятности отклонений следует считать малыми, а какие – нет, определяется весьма непросто и здесь не приводится.

Более общая формулировка центральной предельной теоремы может быть следующей. Если случайная величина равна сумме достаточно большого числа независимых случайных величин, вклад каждой из которых в общую сумму является малым, то закон распределения суммарной случайной величины будет близок к нормальному.

Эта формулировка центральной предельной теоремы показывает, почему в современной теории вероятностей и прикладной статистике такое большое значение имеет нормальное распределение. Оно с высокой точностью возникает тогда, когда суммируются много независимых или слабо зависимых случайных величин, сравнимых между собой по порядку влияния на величину общей суммы. Эта как раз ситуация, в которой и возникают вероятности: когда результат какого-то испытания определяется воздействием на это результат большого числа независимо действующих относительно слабых факторов. В таких ситуациях результат конкретного испытания не может быть точно спрогнозирован, но определённые закономерности появляются при большом числе проведённых испытаний. Эти закономерности позволяют определить вероятность как меру случайности. При этом на основании центральной предельной теоремы оказывается, что в самом определении вероятности очень велика значимость нормального распределения: именно оно появляется в пределе при проведении серий испытаний и закономерности случайности, выражаемые вероятностями, во многих случаях на практике определяются свойствами именно нормальных распределений.

Например, когда на практике пытаются определить значение какой-то величины, чаще всего проводят несколько измерений, а потом вычисляют среднее значение результатов всех проведённых измерений. По теории и по обобщению практического опыта при этом необходимо следить, чтобы в серии независимо проведённых измерений, т.е. испытаний, не появлялось каких-то систематических ошибок, т.е. не было каких-то существенных воздействий какого-то фактора на общий результат. В этих условиях, как утверждает центральная предельная теорема, ошибка измерения будет случайной величиной с нормальным распределением, для которой наиболее вероятным значением будет его математическое ожидание или среднее значение. Если систематические ошибки исключены, то математическое ожидание суммы всех ошибок будет равно 0. Поэтому среднее значение для серии измерений с высокой вероятностью будет равно истинному значению измеряемой величины. Именно в применении к теории ошибок Лапласом и Гауссом был впервые описан нормальный закон распределения и показана его значимость в теории вероятностей и прикладной статистике.

Справедливость центральной предельной теоремы объясняет широкую распространенность нормальных распределений в социологических исследования. Так, одна из формулировок центральной предельной теоремы в форме теоремы Ляпунова утверждает, что если значения некоторой случайной величины складываются из значений достаточно большого количества произвольно распределенных независимых величин, каждая из которых действует на первую величину сравнительно слабо, то первая величина распределена нормально. Многие переменные, изучаемые в ходе социологических исследований, интегрируют в себе большую совокупность не связанных друг с другом социальных, экономических, психологических и других факторов, каждый из которых в отдельности оказывает на итоговую переменную сравнительно слабое влияние. А такие переменные, согласно указанной теореме, должны быть распределены нормально.

В массовых социологических исследованиях поэтому так распространены случайные выборки: случайность их построения гарантирует выявление параметров генеральных совокупностей с большой точностью. При этом случайность в построении выборки никоим образом не отождествляется со стихийностью или произвольностью отбора – напротив, случайность означает то, что все объекты генеральной совокупности должны иметь равные шансы попасть в выборку.

Центральная предельная теорема гарантирует, что статистики случайной выборки будут близки к значениям параметров генеральной совокупности: эти параметры распределены нормально, следовательно, случайная выборка даст статистически малозначимые отклонения своих статистик от параметров такой генеральной совокупности. Например, если в обществе сформировалось какое-то мнение относительно той или иной проблемы, то большинство граждан будут высказывать именно это мнение в социологическом опросе, если выборка будет случайной. Неслучайная выборка может сдвинуть ответы респондентов опроса от истинных значений параметров генеральной совокупности.

Для обоснования выборочных опросов в социологии используется такая формулировка центральной предельной теоремы: для очень широкого круга случайных величин, если будем формировать выборки достаточно большого объема и рассчитывать для каждой выборки среднее значение рассматриваемой случайной величины, распределение таких выборочных средних будет близким к нормальному со средним, равным средней в генеральной совокупности, и дисперсией этого среднего, равной дисперсии генеральной совокупности, делённой на объём выборки. Чем выше будет объём выборки, тем, следовательно, меньше будет дисперсия средней, т.е. истинное значение средней выборочной средней будет меньше отклоняться от средней в генеральной совокупности. Поэтому, чем больше объём выборки в социологическом исследовании, тем выше точность определения средних генеральных совокупностей по средним в этих выборках.

Многие методы статистического анализа социологических данных предполагают нормальность распределений рассматриваемых переменных, например, методы анализа регрессионного и анализа дисперсионного. Поэтому сама возможность их использования для решения стоящей перед социологом задачи в значительной мере определяется справедливостью центральной предельной теоремы.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]