
- •Нормальное распределение
- •I. Нормальное распределение
- •Вероятность равна площади фигуры, ограниченной кривой нормального распределения
- •1. Любой набор нормально распределенных случайных величин можно преобразовать в стандартизованный вид и вычислить искомые вероятности, пользуясь таблицей стандартизованного нормального распределения.
- •2. Среднее квадратическое отклонение является единицей измерения «качества» нормально распределенных случайных величин.
- •II. Равномерное распределение
- •IV. Выборочные распределения
- •V. Выборочное распределение долей
- •VI. Вопросы и задачи по материалам учебного модуля
II. Равномерное распределение
Случайная величина имеет равномерное распределение, если вероятность того, что она принимает любое значение в интервале, ограниченном минимальным числом а и максимальным числом b, постоянна. Поскольку график плотности этого распределения имеет вид прямоугольника, равномерное распределение иногда называют прямоугольным. Плотность вероятности равномерного распределения задается формулой:
(6)
где а — минимальное значение переменной X;
b — максимальное значение переменной X.
Математическое
ожидание равномерного распределения
вычисляется по формуле:
. (7)
Дисперсия и среднее квадратическое отклонение равномерного распределения вычисляются соответственно по формулам:
;
. (8)
D(X) = M(X - m)2 = M(X2 - 2mX + m2) = M(X2) - 2mM(X) + m2 = M(X2) - 2 m2 + m2 = M(X2) - m2.
Задачи к разделу II
Задача 7. Предположим, что из генеральной совокупности, равномерно распределенной в интервале а = 0 и b = 10, извлекаются случайные числа.
Вычислите вероятности следующих событий:
Извлеченное число больше 5 и меньше 7.
Число больше 2 и меньше 3.
3. Чему равно математическое ожидание?
4. Чему равно среднее квадратическое отклонение?
Задача 8. Предположим, что время между двумя последовательными приходами клиентов в отделение банка в первой половине дня равномерно распределено в интервале от 0 до 100 с.
Вычислите вероятность того, что время между двумя приходами меньше 20 с.
Вычислите вероятность того, что время между двумя приходами больше 10 и меньше 30 с.
Вычислите вероятность того, что время между двумя приходами больше 35 с.
Чему равно математическое ожидание времени между двумя последовательными приходами клиентов?
Чему равно среднее квадратическое отклонение времени между двумя последовательными приходами клиентов?
IV. Выборочные распределения
Оценка качества продукции, как правило, осуществляется на основе выборочного исследования. На практике из генеральной совокупности извлекается выборка заранее установленного объема. Элементы, принадлежащие данной выборке, выбираются случайным образом, например, с помощью таблицы случайных чисел. Распределения выборочных параметров называют выборочными. Для оценки математического ожидания распределения чаще всего используется арифметическое среднее. Это наилучшая оценка математического ожидания, если распределение является нормальным.
Основной целью анализа статистических данных являются выводы о свойствах и качестве всей генеральной совокупности. Статистические выводы относятся к генеральным совокупностям, а не к выборкам из них. Например, изучают результаты выборочных обследований только для того, чтобы оценить шансы кандидатов получить голоса от всех избирателей, участвующих в выборах. Аналогично менеджера по качеству выборочные показатели интересуют лишь потому, что они позволяют сделать выводы о качестве всей продукции компании. Выборочные параметры, в том числе, и выборочное среднее, полученное при обследовании конкретной выборки, само по себе интереса не представляют.
Арифметическое среднее3 называется несмещенным (unbiased), поскольку среднее значение всех выборочных средних (при заданном объеме выборки п) равно математическому ожиданию генеральной совокупности.
Упражнение 4. Предположим, что генеральная совокупность – это оценки, которые получили три студента на экзамене по статистике. Каждый из них получил различные оценки: 3; 2 и 4.
Математическим ожиданием для данной генеральной совокупности будет сумма всех баллов совокупности, деленная на ее объем:
(9)
где μ — математическое ожидание генеральной совокупности;
N — объем генеральной совокупности;
Xi — i-й элемент генеральной совокупности;
—
сумма всех
элементов
генеральной совокупности.
Средним квадратическим отклонением генеральной совокупности оценок будет корень квадратный из ее дисперсии:
(10)
Решение. Таким образом, для приведенных данных, имеем:
.
.
Если
из этой генеральной совокупности
необходимо извлечь выборку, состоящую
из оценок двух студентов, то возникает
3 варианта выбора:
.
Этим вариантам соответствуют следующие средние баллы:
Вариант выборки (студенты) |
Экзаменационные оценки |
Средний балл выборки |
1 и 2 |
3 и 2 |
2,5 |
1 и 3 |
3 и 4 |
3,5 |
2 и 3 |
2 и 4 |
3 |
|
|
|
Средний
балл всех выборок,
|
3 |
Если
усреднить все варианты средних значений,
мы получим величину
μ
,
равную математическому
ожиданию генеральной совокупности μ,
т.е.
число равное 3.
Итак, среднее значение всех выборочных средних равно математическому ожиданию генеральной совокупности. Следовательно, хотя нам неизвестно, насколько хорошо конкретное выборочное среднее аппроксимирует математическое ожидание генеральной совокупности, среднее значение всех выборочных средних совпадает с математическим ожиданием генеральной совокупности.
Стандартная ошибка среднего
Колебание выборочных средних вокруг математического ожидания генеральной совокупности меньше, чем колебание исходных данных. Этот факт непосредственно следует из закона больших чисел (law of large number). Исходная генеральная совокупность может содержать числа, которые являются как очень большими, так и очень маленькими. Однако если экстремальное значение попадет в выборку, ее влияние на среднее значение будет ослаблено, поскольку оно будет просуммировано со всеми остальными элементами выборки. При увеличении объема выборки влияние экстремальных значений ослабевает, поскольку в усреднении принимает участие все большее количество элементов.
Диапазон
изменения выборочных средних описывается
их стандартным отклонением.
Эта величина называется стандартной
ошибкой среднего
(standard
error
of
the
mean)
и обозначается как
.
Стандартная
ошибка среднего
равна стандартному отклонению генеральной
совокупности
σ,
деленному на квадратный корень из объема
выборки п:
.
(11)
Следовательно, при возрастании объема выборки n стандартная ошибка среднего уменьшается со скоростью, пропорциональной квадратному корню из п4.
Выборки из нормально распределенных генеральных совокупностей
Введя
понятие выборочных распределений и дав
определение стандартной ошибки среднего,
мы можем ответить на вопрос, как
распределены выборочные средние
.
Можно
доказать, что если выборки извлекаются
с возвращением из нормально распределенной
генеральной совокупности, математическое
ожидание которого равно μ,
а
среднее квадратическое отклонение
— σ,
то
выборочное распределение средних
(sampling
distribution
of
the
mean)
также
является нормальным при любом объеме
выборок п,
причем
, а стандартная ошибка
равна
.
Зададимся вопросом, как вычислить вероятность того, что выборочное среднее, полученное для выборки объемом п, окажется меньше некоторого значения X. Из свойств нормального распределения следует, что площадь, отсекаемую каждым значением случайной величины X от фигуры, ограниченной гауссовой кривой, можно вычислить, преобразовав ее в стандартизованную нормальную случайную величину Z и определив соответствующее значение по таблице функции стандартизованного нормального распределения:
.
Аналогично с этой формулой, определяем величину Z для распределения выборочного среднего:
(12)
Обратите внимание на то, что, например, четырехкратное увеличение объема выборки приводит к уменьшению стандартного отклонения выборочного среднего вдвое. Это значит, что, извлекая из генеральной совокупности выборки большего объема, мы обнаружим меньшую изменчивость выборочного среднего.
Иногда необходимо найти интервал, в котором лежит фиксированная часть элементов выборки или выборочных средних. В этом случае необходимо вычислить расстояние между и μ, которому соответствует заданная площадь фигуры, ограниченная гауссовой кривой. Воспользуемся формулой (12), имеем:
(13)
Откуда, величину можно вычислить по формуле (14):
.
(14)
Упражнение 5. Найдите интервал, в котором лежат 95% всех выборочных средних, вычисленных по выборке, состоящим из 25 единиц, если математическое ожидание и среднее квадратическое отклонение генеральной совокупности соответственно равны: μ =150; σ =10.
Решение. Интервал, содержащий 95% всех выборочных средних, вычисленных по выборкам, имеющим объем п = 25, делится на две равные части. Первая часть лежит слева от математического ожидания генеральной совокупности, а вторая — справа. Значение величины Z, соответствующей площади 0,0250, равно -1,96, а значение величины Z, соответствующей суммарной площади 0,975, равно +1,96 (см. табл. 2). Нижняя и верхняя границы величины определяются по формуле (15):
Следовательно, 95% всех выборочных средних, вычисленных по выборкам, имеющим объем п = 25, лежат в интервале от 146,08 до 153,92.
Выборки из генеральных совокупностей, распределения которых отличаются от нормального
Во многих ситуациях распределение генеральной совокупности либо неизвестно, либо заведомо отличается от нормального. Таким образом, следует рассмотреть выборочное распределение средних для генеральной совокупности, распределение которой отличается от нормального. Этот анализ приводит нас к основной теореме статистики — центральной предельной теореме.
Ц
ентральная
предельная теорема (central
limit
theorem)
утверждает, что при достаточно
большом
объеме
выборок выборочное распределение
средних можно аппроксимировать
нормальным распределением. Это свойство
не зависит от вида распределения
генеральной совокупности.
Какой объем выборок следует считать «достаточно большим»?
Как правило, для подавляющего большинства генеральных совокупностей выборочное распределение средних становится приближенно нормальным при n = 30. Однако, если известно, что распределение генеральной совокупности является колокообразным, эту теорему можно применять и для меньшего объема выборок. Если же распределение генеральной совокупности обладает сильной асимметрией или имеет несколько мод, объем выборок следует увеличить.
Если генеральная совокупность является нормально распределенной, выборочное распределение средних также является нормальным, независимо от объема выборок. При увеличении объема выборок изменчивость выборочных средних уменьшается. Поскольку выборочное среднее является несмещенной оценкой, среднее выборочных средних всегда совпадает с математическим ожиданием генеральной совокупности.
Для генеральной совокупности, имеющей равномерное распределение при n = 5, выборочное распределение средних является приближенно нормальным, а при n = 30 выборочное распределение средних становится практически нормальным. В любом случае среднее выборочных средних всегда совпадает с математическим ожиданием генеральной совокупности, а его изменчивость при увеличении объема выборок уменьшается.
Свойства выборочного распределения средних:
• если объем выборок превышает 30, выборочное распределение средних для большинства генеральных совокупностей является приближенно нормальным;
• если генеральная совокупность распределена симметрично, выборочное распределение средних становится приближенно нормальным уже при п = 15;
• если генеральная совокупность является нормально распределенной, выборочное распределение средних является нормальным при любом объеме выборок.
Задачи к разделу IV
Задача 9. Рассмотрим выборку, имеющую объем п =25, извлеченную из нормально распределенной генеральной совокупности, математическое ожидание которой равно 100, а среднее квадратическое отклонение — 10.
Вычислите вероятность того, что < 95 .
Вычислите вероятность того, что 95 < < 97,5 .
Вычислите вероятность того, что > 102,2 .
Вычислите вероятность того, что 99 < < 101 .
Какому значению X соответствует вероятность Р( > X), равная 65% ?
Как изменятся ответы на вопросы 1-5, если объем выборки n = 16?
Задача 10. Рассмотрим выборку, имеющую объем п = 100, извлеченную из нормально распределенной генеральной совокупности, математическое ожидание которой равно 50, а среднее квадратическое отклонение — 5.
Вычислите вероятность того, что < 49,5.
Вычислите вероятность того, что 47 < < 49,5.
Вычислите вероятность того, что > 51,1 .
Вычислите вероятность того, что 49 < < 51 .
Задача 11. Диаметры шариков для настольного тенниса, произведенных на большой фабрике, имеют приближенно нормальное распределение. Математическое ожидание этого распределения равно 5,5 см, а среднее квадратическое отклонение — 0,05 см.
Какова вероятность того, что диаметр случайно выбранного шарика меньше 5,45 см?
Какова вероятность того, что диаметр случайно выбранного шарика лежит в интервале от 5,4 до 5,55 см?
Между какими двумя значениями (симметрично расположенными относительно математического ожидания) лежат 60% диаметров шариков?
Чему равны математическое ожидание генеральной совокупности и стандартная ошибка среднего, вычисленные по большому количеству выборок, состоящих из 25 шариков?
Как распределены выборочные средние, вычисленные по большому количеству выборок, состоящих из 25 шариков?
Какая доля выборочных средних, вычисленных по большому количеству выборок, состоящих из 25 шариков, меньше 5,48 см?
Какая доля выборочных средних, вычисленных по большому количеству выборок, состоящих из 25 шариков, дожит в интервале от 5,49 до 5,52 см?
Между какими двумя значениями (симметрично расположенными относительно математического ожидания) лежат 60% выборочных средних? 9. Что более вероятно — диаметр отдельного шарика превысит 5,4 см, выборочное среднее, подсчитанное по выборке, состоящей из 4 шариков, окажется больше 5,55, или выборочное среднее, подсчитанное по выборке, состоящей из 25 шариков, окажется больше 5,51? Обоснуйте свой ответ.
Задача 12. Время, которое пользователи проводят, пользуясь электронной почтой, распределено по нормальному закону, Его математическое ожидание равно 8 мин., а среднее квадратическое отклонение — 2 мин.
Какая доля выборочных средних, вычисленных по большому количеству выборок, состоящих из 25 сеансов работы с электронной почтой, лежит в интервале от 7,8 до 8,2 мин?
Какая доля выборочных средних, вычисленных по большому количеству выборок, состоящих из 25 сеансов работы с электронной почтой, лежит в интервале от 7,5 до 8 мин?
Какая доля выборочных средних, вычисленных по большому количеству выборок, состоящих из 100 сеансов работы с электронной почтой, лежит в интервале от 7,8 до 8,2 мин?
Какое событие более вероятно:
продолжительность определенного сеанса работы с электронной почтой превышает 11 мин.;
выборочное среднее, вычисленное по большому количеству выборок, состоящему из 25 сеансов, превысит 9 мин.;
выборочное среднее, вычисленное по большому количеству выборок, состоящему из 100 сеансов, превысит 8,6 мин.?
Задача 13. Время, которое служащий затрачивает на обслуживание одного клиента, распределено по нормальному закону. Его математическое ожидание равно 5,5 мин., а среднее квадратическое отклонение — 0,5 мин. Предположим, из генеральной совокупности извлечена выборка, состоящая из 16 клиентов.
Какова вероятность, что среднее время, которое затрачивается на обслуживание клиента, не меньше 5 мин.?
Допустим, вероятность того, что выборочное среднее, подсчитанное по выборке, состоящей из 16 клиентов, не превосходит некую продолжительность обслуживания, равна 85% . Вычислите эту величину.
Допустим, вероятность того, что выборочное среднее, подсчитанное по выборке, состоящей из 64 клиентов, не превосходит некую продолжительность обслуживания, равна 85% . Вычислите эту величину.