Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
IV-Н-РАСПР.doc
Скачиваний:
2
Добавлен:
01.04.2025
Размер:
435.71 Кб
Скачать

II. Равномерное распределение

Случайная величина имеет равномерное распределение, если вероятность того, что она принимает любое значение в интервале, ограниченном минимальным числом а и максималь­ным числом b, постоянна. Поскольку график плотности этого распределения имеет вид прямо­угольника, равномерное распределение иногда называют прямоугольным. Плотность вероятности равномерного распределения задается формулой:

(6)

где а — минимальное значение переменной X;

bмаксимальное значение переменной X.

Математическое ожидание равномерного распределения вычисляется по формуле: . (7)

Дисперсия и среднее квадратическое отклонение равномерного распределения вычисляются соответственно по формулам:

; . (8)

D(X) = M(X - m)2 = M(X2 - 2mX + m2) = M(X2) - 2mM(X) + m2 = M(X2) - 2 m2 + m2 = M(X2) - m2.

Задачи к разделу II

Задача 7. Предположим, что из генеральной совокупности, равномерно распределенной в интервале а = 0 и b = 10, извлекаются случайные числа.

Вычислите вероятности следующих событий:

  1. Извлеченное число больше 5 и меньше 7.

  2. Число больше 2 и меньше 3.

3. Чему равно математическое ожидание?

4. Чему равно среднее квадратическое отклонение?

Задача 8. Предположим, что время между двумя последовательными приходами клиентов в отделение банка в первой половине дня равномерно распределено в интервале от 0 до 100 с.

  1. Вычислите вероятность того, что время между двумя приходами меньше 20 с.

  2. Вычислите вероятность того, что время между двумя приходами больше 10 и меньше 30 с.

  3. Вычислите вероятность того, что время между двумя приходами больше 35 с.

  4. Чему равно математическое ожидание времени между двумя последователь­ными приходами клиентов?

  5. Чему равно среднее квадратическое отклонение времени между двумя последователь­ными приходами клиентов?

IV. Выборочные распределения

Оценка качества продукции, как правило, осуществляется на основе выборочного исследования. На практике из генеральной совокупности извлекается выборка заранее установ­ленного объема. Элементы, принадлежащие данной выборке, выбираются случайным образом, например, с помощью таблицы случайных чисел. Распределе­ния выборочных параметров называют выборочными. Для оценки математического ожидания распреде­ления чаще всего используется арифметическое среднее. Это наилучшая оценка математического ожидания, если распределение является нормальным.

Основной целью анализа статистических данных являются выводы о свойствах и качестве всей генеральной совокупности. Статисти­ческие выводы относятся к генеральным совокупностям, а не к выборкам из них. Например, изучают результаты выборочных обследований только для того, чтобы оценить шансы кандидатов получить голоса от всех избирателей, участвующих в выборах. Аналогично менеджера по качеству выбо­рочные показатели интересуют лишь потому, что они позволяют сделать выводы о качестве всей продукции компании. Выборочные параметры, в том числе, и выборочное среднее, полу­ченное при обследовании конкретной выборки, само по себе интереса не представляют.

Арифметическое среднее3 называется несмещенным (unbiased), поскольку среднее значение всех выборочных средних (при заданном объеме выборки п) равно математи­ческому ожиданию генеральной совокупности.

Упражнение 4. Предположим, что генеральная совокупность – это оценки, которые получили три студента на экзамене по статистике. Каждый из них получил различные оценки: 3; 2 и 4.

Математическим ожиданием для данной генеральной совокупности будет сумма всех баллов совокупности, деленная на ее объем:

(9)

где μ — математическое ожидание генеральной совокупности;

N — объем генеральной совокупности;

Xi i-й элемент генеральной совокупности;

— сумма всех элементов генеральной совокупности.

Средним квадратическим отклонением генеральной совокупности оценок будет корень квадратный из ее дисперсии:

(10)

Решение. Таким образом, для приведенных данных, имеем:

.

.

Если из этой генеральной совокупности необходимо извлечь выборку, состоящую из оценок двух студентов, то возникает 3 варианта выбора: .

Этим вариан­там соответствуют следующие средние баллы:

Вариант выборки

(студенты)

Экзаменационные оценки

Средний балл выборки

1 и 2

3 и 2

2,5

1 и 3

3 и 4

3,5

2 и 3

2 и 4

3

Средний балл всех выборок,

3

Если усреднить все варианты средних значений, мы получим величи­ну μ , равную математическому ожиданию генеральной совокупности μ, т.е. число равное 3.

Итак, среднее значение всех выборочных средних равно математическому ожи­данию генеральной совокупности. Следовательно, хотя нам неизвестно, насколько хо­рошо конкретное выборочное среднее аппроксимирует математическое ожидание гене­ральной совокупности, среднее значение всех выборочных средних совпадает с мате­матическим ожиданием генеральной совокупности.

Стандартная ошибка среднего

Колебание выборочных средних вокруг математического ожидания генеральной совокупности меньше, чем колебание исходных данных. Этот факт непосредственно следует из закона больших чисел (law of large number). Исходная генеральная совокупность может содержать числа, которые являются как очень большими, так и очень маленькими. Однако если экстремальное значе­ние попадет в выборку, ее влияние на среднее значение будет ослаблено, поскольку оно будет просуммировано со всеми остальными элементами выборки. При увеличении объема выборки влияние экстремальных значений ослабевает, поскольку в усреднении принимает участие все большее количество элементов.

Диапазон изменения выборочных средних описывается их стандартным отклонени­ем. Эта величина называется стандартной ошибкой среднего (standard error of the mean) и обозначается как .

Стандартная ошибка среднего равна стандартному отклонению генеральной со­вокупности σ, деленному на квадратный корень из объема выборки п:

. (11)

Следовательно, при возрастании объема выборки n стандартная ошибка среднего уменьшается со скоростью, пропорциональной квадратному корню из п4.

Выборки из нормально распределенных генеральных совокупностей

Введя понятие выборочных распределений и дав определение стандартной ошибки среднего, мы можем ответить на вопрос, как распределены выборочные средние . Мож­но доказать, что если выборки извлекаются с возвращением из нормально распределенной генеральной совокупности, математическое ожидание которого равно μ, а среднее квадратическое отклонение — σ, то выборочное распределение средних (sampling distribution of the mean) также является нормальным при любом объеме выборок п, причем , а стандартная ошибка равна .

Зададимся вопросом, как вычислить вероятность того, что выборочное среднее, полученное для выборки объемом п, окажется меньше некоторого значения X. Из свойств нормального распределения следует, что площадь, отсекаемую каждым значе­нием случайной величины X от фигуры, ограниченной гауссовой кривой, можно вычис­лить, преобразовав ее в стандартизованную нормальную случайную величину Z и определив соответствующее значение по таблице функции стандартизованного нормального распределения:

.

Аналогично с этой формулой, определяем величину Z для распределения выборочного среднего:

(12)

Обратите внимание на то, что, например, четырехкратное увеличение объема выборки приводит к уменьшению стандартного отклонения выборочного среднего вдвое. Это значит, что, извлекая из генеральной совокупности выборки большего объема, мы обнаружим меньшую изменчивость выборочного среднего.

Иногда необходимо найти интервал, в котором лежит фиксированная часть элемен­тов выборки или выборочных средних. В этом случае необходимо вычислить расстояние между и μ, кото­рому соответствует заданная площадь фигуры, ограниченная гауссовой кривой. Вос­пользуемся формулой (12), имеем:

(13)

Откуда, величину можно вычислить по формуле (14):

. (14)

Упражнение 5. Найдите интервал, в котором лежат 95% всех выборочных средних, вычисленных по выборке, состоящим из 25 единиц, если математическое ожидание и среднее квадратическое отклонение генеральной совокупности соответственно равны: μ =150; σ =10.

Решение. Интервал, содержащий 95% всех выборочных средних, вычисленных по выборкам, имеющим объем п = 25, делится на две равные части. Первая часть лежит слева от математического ожидания генеральной совокупности, а вторая — справа. Значение величины Z, соответствующей площади 0,0250, равно -1,96, а значение ве­личины Z, соответствующей суммарной площади 0,975, равно +1,96 (см. табл. 2). Нижняя и верхняя границы величины определяются по формуле (15):

Следовательно, 95% всех выборочных средних, вычисленных по выборкам, имею­щим объем п = 25, лежат в интервале от 146,08 до 153,92.

Выборки из генеральных совокупностей, распределения которых отличаются от нормального

Во многих ситуациях распределе­ние генеральной совокупности либо неизвестно, либо заведомо отличается от нормального. Таким образом, следует рассмотреть выборочное распределение средних для генеральной совокупности, распределение которой отличается от нормального. Этот анализ приводит нас к основной теореме статистики — центральной предельной теореме.

Ц ентральная предельная теорема (central limit theorem) утверждает, что при достаточно большом объеме выборок выборочное распределение средних можно ап­проксимировать нормальным распределением. Это свойство не зависит от вида рас­пределения генеральной совокупности.

Какой объем выборок следует считать «достаточно большим»?

Как правило, для подавляющего большинст­ва генеральных совокупностей выборочное распределение средних становится прибли­женно нормальным при n = 30. Однако, если известно, что распределение генеральной совокупности является колокообразным, эту теорему можно применять и для мень­шего объема выборок. Если же распределение генеральной совокупности обладает сильной асимметрией или имеет несколько мод, объем выборок следует увеличить.

Если генеральная совокупность является нормально распределенной, выбороч­ное распределение средних также является нормальным, независимо от объема выбо­рок. При увеличении объема выборок изменчивость выборочных средних уменьшается. Поскольку выборочное среднее является несмещенной оценкой, среднее выборочных средних всегда совпадает с математическим ожиданием генеральной совокупности.

Для генеральной совокупности, имеющей равномерное распределение при n = 5, выборочное распреде­ление средних является приближенно нормальным, а при n = 30 выборочное распреде­ление средних становится практически нормальным. В любом случае среднее выборочных средних всегда совпадает с математическим ожиданием генераль­ной совокупности, а его изменчивость при увеличении объема выборок уменьшается.

Свойства выборочного распределения средних:

• если объем выборок превышает 30, выборочное распределение средних для боль­шинства генеральных совокупностей является приближенно нормальным;

• если генеральная совокупность распределена симметрично, выборочное распределение средних становится приближенно нормальным уже при п = 15;

• если генеральная совокупность является нормально распределенной, выборочное распределение средних является нормальным при любом объеме выборок.

Задачи к разделу IV

Задача 9. Рассмотрим выборку, имеющую объем п =25, извлеченную из нормально рас­пределенной генеральной совокупности, математическое ожидание которой равно 100, а среднее квадратическое отклонение — 10.

  1. Вычислите вероятность того, что < 95 .

  2. Вычислите вероятность того, что 95 < < 97,5 .

  3. Вычислите вероятность того, что > 102,2 .

  4. Вычислите вероятность того, что 99 < < 101 .

  5. Какому значению X соответствует вероятность Р( > X), равная 65% ?

  6. Как изменятся ответы на вопросы 1-5, если объем выборки n = 16?

Задача 10. Рассмотрим выборку, имеющую объем п = 100, извлеченную из нормально рас­пределенной генеральной совокупности, математическое ожидание которой равно 50, а среднее квадратическое отклонение — 5.

  1. Вычислите вероятность того, что < 49,5.

  2. Вычислите вероятность того, что 47 < < 49,5.

  3. Вычислите вероятность того, что > 51,1 .

  4. Вычислите вероятность того, что 49 < < 51 .

Задача 11. Диаметры шариков для настольного тенниса, произведенных на большой фабри­ке, имеют приближенно нормальное распределение. Математическое ожидание этого распределения равно 5,5 см, а среднее квадратическое отклонение — 0,05 см.

  1. Какова вероятность того, что диаметр случайно выбранного шарика меньше 5,45 см?

  2. Какова вероятность того, что диаметр случайно выбранного шарика лежит в интервале от 5,4 до 5,55 см?

  3. Между какими двумя значениями (симметрично расположенными относительно математического ожидания) лежат 60% диаметров шариков?

  4. Чему равны математическое ожидание генеральной совокупности и стандартная ошибка среднего, вычисленные по большому количеству выборок, состоящих из 25 шариков?

  5. Как распределены выборочные средние, вычисленные по большому количе­ству выборок, состоящих из 25 шариков?

  6. Какая доля выборочных средних, вычисленных по большому количеству вы­борок, состоящих из 25 шариков, меньше 5,48 см?

  7. Какая доля выборочных средних, вычисленных по большому количеству вы­борок, состоящих из 25 шариков, дожит в интервале от 5,49 до 5,52 см?

  8. Между какими двумя значениями (симметрично расположенными относи­тельно математического ожидания) лежат 60% выборочных средних? 9. Что более вероятно — диаметр отдельного шарика превысит 5,4 см, вы­борочное среднее, подсчитанное по выборке, состоящей из 4 шариков, ока­жется больше 5,55, или выборочное среднее, подсчитанное по выборке, состоящей из 25 шариков, окажется больше 5,51? Обоснуйте свой ответ.

Задача 12. Время, которое пользователи проводят, пользуясь электронной почтой, распре­делено по нормальному закону, Его математическое ожидание равно 8 мин., а среднее квадратическое отклонение — 2 мин.

  1. Какая доля выборочных средних, вычисленных по большому количеству вы­борок, состоящих из 25 сеансов работы с электронной почтой, лежит в интер­вале от 7,8 до 8,2 мин?

  2. Какая доля выборочных средних, вычисленных по большому количеству выборок, состоящих из 25 сеансов работы с электронной почтой, лежит в интер­вале от 7,5 до 8 мин?

  3. Какая доля выборочных средних, вычисленных по большому количеству выборок, состоящих из 100 сеансов работы с электронной почтой, лежит в ин­тервале от 7,8 до 8,2 мин?

  4. Какое событие более вероятно:

продолжительность определенного сеанса ра­боты с электронной почтой превышает 11 мин.;

выборочное среднее, вычис­ленное по большому количеству выборок, состоящему из 25 сеансов, превысит 9 мин.;

выборочное среднее, вычисленное по большому количеству выбо­рок, состоящему из 100 сеансов, превысит 8,6 мин.?

Задача 13. Время, которое служащий затрачивает на обслуживание одного клиента, распределено по нормальному закону. Его математическое ожидание равно 5,5 мин., а среднее квадратическое отклонение — 0,5 мин. Предположим, из генеральной совокупности извлечена выборка, состоящая из 16 клиентов.

  1. Какова вероятность, что среднее время, которое затрачивается на обслужи­вание клиента, не меньше 5 мин.?

  2. Допустим, вероятность того, что выборочное среднее, подсчитанное по вы­борке, состоящей из 16 клиентов, не превосходит некую продолжительность обслуживания, равна 85% . Вычислите эту величину.

  3. Допустим, вероятность того, что выборочное среднее, подсчитанное по вы­борке, состоящей из 64 клиентов, не превосходит некую продолжительность обслуживания, равна 85% . Вычислите эту величину.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]