Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Обработка данных на компьютере.doc
Скачиваний:
4
Добавлен:
01.05.2019
Размер:
216.58 Кб
Скачать
  1. Интервальная оценка математического ожидания

Среднее Хср – центр выборки – есть точечная оценка математического ожидания М(х) – центра всей совокупности. Можно построить доверительные интервалы, которые с заданной гарантией (уровнем доверия Р) накроют неизвестное нам значение математического ожидания.

Известно, что множество Хср, вычисленных по разным выборкам объема N, распределено асимптотически нормально (центральная предельная теорема) с центром, совпадающим с центром совокупности М(х), и дисперсией в N раз меньшей дисперсии совокупности. Дисперсия совокупности нам не известна, мы можем вычислить только ее точечную оценку Sxx/N, корень квадратный из которой называется ошибкой среднего (стандартной ошибкой) Sxcp=Sx/КОРЕНЬ(N). Известно, что статистика t=(Xcp–M(x))/Sxcp распределена по закону Стьюдента, поэтому с уровнем доверия Р = 95% можно утверждать, что |t|<t05, где t05 – табличное значение распределения Стьюдента для Р = 95% и ЧСС = N – 1 (ЧСС – число степеней свободы). Отсюда получаем границы 95%-ного доверительного интервала на М(х) в виде: Хср–НСР05<M(x)<Хср+НСР05, где НСР05=t05*Sxcp.

В Excel табличные значения (квантили) распределения Стьюдента вычисляются функцией СТЬЮДРАСПОБР(Вероятность;Степени_свобо-ды), где Вероятность=1–Р. Для N = 49 (ЧСС = 48) имеем t05 = 2,0106.

Вычисляем ошибку среднего Sxcp =   = 1,1077 / 7 = 0,1582, наименьшую существенную разность НСР05 = t05*Sxcp = 2,011*0,1582 = 0,3181 и 95%-ные границы на М(х): Хср–НСР05=9,5612–0,3181=9,2431; Хср+НСР05 =9,5612+0,3181=9,8793. Таким образом, получен 95%-ный доверительный интервал на центр всей совокупности: 9,2431 < M(x) < 9,8793 с относительной погрешностью  = НСР05/Хср*100% = 0,1582/9,5612*100% = 3,33%.

Обычно уровень доверия принимают равным или Р = 90%, или 95%, или 99%. Соответственно, будут получены оценки математического ожидания с относительной погрешностью  = 2,78%, 3,22%, 4,44%.

Нас устраивает погрешность, не превышающая заданной величины q% (обычно q = 10%, 5%, или 1%). Из условия получаем формулу для определения потребного объема выборки (если впоследствии предстоит анализ подобных данных): N > (t05*Vx/q)2, где Vx – коэффициент вариации Vx = Sx/Xcp*100% = 11,59%. Для Vx  12% и q = 5% получаем потребный объем выборки N > (2,0106*12/5) = 23,3 , т.е. достаточно на анализ отбирать выборку в два раза меньшего размера N = 24

  1. Интервальная оценка дисперсии совокупности

Известно, что если величина Z распределена нормально с нулевым математическим ожиданием и единичной дисперсией, то ее сумма квадратов  Z2 распределена по закону Пирсона Хи-квадрат, поэтому с гарантией Р=90% можно утверждать, что , где табличные значения (квантили) распределения Пирсона вычисляются функцией ХИ2ОБР(Вероятность;Степени_свободы). Для N = 49 (ЧСС = N–1) получаем = 33,0981 и = 65,1708: Если исходные данные Х распределены нормально, то статистика Z = (X – Xcp) /  распределена нормально с нулевым математическим ожиданием и единичной дисперсией. Тогда сумма квадратов  Z2 = (N–1)*Sxx/2 распределена по закону Пирсона и с уровнем доверия Р = 90% заключена в пределах 33,0981 <  Z2 < 65,1708, откуда получаем границы 90%-ного доверительного интервала на дисперсию совокупности: Sxx*48/65,1708 < 2 < Sxx*48/33,0981, или 0,9038 < 2 < 1,7795. Извлекаем корень квадратный и получаем 90%-ный доверительный интервал на стандартное отклонение совокупности 0,951<<1,340 (сравни с Sx=1,108).

Б. Переходим к изучению распределения Х.

Некоторые значения случайной величины появляются часто, другие значительно реже. Во многих отраслях промышленности этот факт имеет очень большое значение. Например, в легкой промышленности необходимо правильно распределять общий заказ на пошив одежды, обуви, головных уборов, перчаток по стандартным классам (размерам) этих изделий. Если же изготавливать изделия только одного размера (что удобно для производства), то получится эффект затоваривания невостребованной продукции при неудовлетворенном спросе на другие типоразмеры. Иными словами, необходимо для любого заказа на изготовление n изделий найти частоты mj – количество изделий каждого типоразмера, где m1 + m2 + … m= n.

Одних двух характеристик Хср и Sx не достаточно для определения частот распределения, надо знать еще вид закона распределения. Иногда вид закона распределения заранее известен из теоретических соображений, в других случаях надо попытаться установить его по данным выборки. Для этого необходимо произвести группировку данных на несколько классов (интервалов) и сравнить полученное распределение эмпирических частот с предполагаемым теоретическим распределением. Имеются статистические критерии, на основании которых проверяется согласие между эмпирическим и теоретическим распределением. Поскольку нормальный закон распределения Гаусса является наиболее распространенным в природе, в любом учебном задании необходимо обязательно проверять согласие эмпирического распределения с нормальным законом.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]