- •0 Решение задач описательной статистики с помощью пакета анализа ms Excel
- •Прикладная статистика в пакете анализа ms excel
- •Предисловие
- •Введение
- •Методы описательной статистики
- •Решение задач описательной статистики с помощью пакета анализаMsExcel
- •Основные законы распределения
- •Табулирование функции-распределения
- •Табулирование функции распределения Стьюдента
- •Генерация случайных чисел, подчиненных данному закону
- •Проверка статистических гипотез
- •Гипотеза о нормальном распределении генеральной совокупности
- •Использование средствMsExcelдля проверки гипотезы о нормальном распределении генеральной совокупности
- •Некоторые двухвыборочные задачи
- •Проверка гипотезы о равенстве средних: случай известных и равных дисперсий
- •Проверка гипотезы о равенстве средних: случай неизвестных равных дисперсий
- •Проверка гипотезы о равенстве средних: случай неизвестных дисперсий
- •Проверка гипотезы о равенстве дисперсий
- •Использование средствMsExcelдля проверки гипотезы о равенстве средних: случай известных равных генеральных дисперсий
- •Использование средствMsExcelдля проверки гипотезы о равенстве средних: случай неизвестных равных генеральных дисперсий
- •Использование средствMsExcelдля проверки гипотезы о равенстве генеральных дисперсий
- •Задачи регрессионного анализа и математической теории эксперимента
- •Подбор параметров линейной модели
- •Случай модели, линейной по параметрам
- •Использование средствMsExcelдля построения одномерной линейной регрессионной модели
- •Основные понятия математической теории эксперимента
- •Использование средствMsExcelдля построения квадратичной модели в нормализованном факторном пространстве
- •Построение планов эксперимента
- •Анализ моделей, линейных по параметрам
- •Построение и анализ линейной двухфакторной модели
- •Приложение. Построение и анализ двухфакторной квадратичной модели с использованием программного комплекса «Градиент»
Гипотеза о нормальном распределении генеральной совокупности
Одной из наиболее распространенных одновыборочныхзадач является проверка гипотезы о нормальном распределении генеральной совокупности.
При использовании -статистикипосле построения непрерывного вариационного ряда вычисляется значение статистики (случайной величины, связанной с опытными данными):
, |
(4.24) |
где n– объем выборки (как правило – не менее 200);l– число разрядов непрерывного вариационного ряда (не менее 8);nj– частота;pj– вероятность, найденная расчетом по нормальной кривой, выравнивающей выборку:
,. |
(4.25) |
В последнем соотношении – оценка математического ожидания,s– оценка среднего квадратичного отклонения,– функция Лапласа (или функция стандартного нормального распределения).
Статистика ( 4 .24) подчинена -распределению с числом степеней свободы. С учетом этого ищется вероятность критического события, состоящего в том, что для выборки из нормально распределенной генеральной совокупности истинное (неизвестное) значение статистики окажется столь же большим (большим или равным), как и наблюдаемое на опыте значение. Если указанная вероятность близка к нулю (меньше выбранного уровня значимости), то нулевая гипотеза о нормальном распределении генеральной совокупности отвергается.
Вместо нахождения вероятности критического события можно сравнить найденное значение статистики ( 4 .24) с квантилью распределения длястепеней свободы и выбранного уровня значимости. При выполнении неравенства
считают, что на уровне значимости нет оснований отвергать нулевую гипотезу о нормальном распределении генеральной совокупности (вновь отметим, чтоистинностьгипотезы этим не доказывается!).
Использование средствMsExcelдля проверки гипотезы о нормальном распределении генеральной совокупности
Пусть требуется проверить гипотезу о нормальном распределении генеральной совокупности, из которой извлечена выборка с объемом 1000. Пусть варианты помещены в первый столбец рабочего листа (ячейкиA1:A1000).
Для нахождения оценок среднего и стандартного отклонения, а также для построения непрерывного вариационного ряда можно воспользоваться пакетом анализа.
Из меню СервисвыбратьАнализ данных, далее –Описательная статистика. Входной интервал –$A$1:$A$1000; верхняя левая ячейка выходного интервала$B$1. Установить флагИтоговая статистика.
Для данной выборки минимальное и максимальное значения оказались равными –277 и 302 соответственно, поэтому в качестве границ первого и последнего разрядов можно выбрать –280 и 310:
Так как , то число разрядов можно взять равным 10. Тогда длина разряда
.
В столбце Dвведем равномерную сетку от–280до310с шагом59(можно воспользоваться средствами автозаполнения: ввести в ячейкуD1значение–280, в ячейкуD2– формулу=D1+59, выделить ячейкиD1:D2и переместить маркер автозаполнения до ячейкиD11).
Для построения непрерывного вариационного ряда из меню Сервисследует выбратьАнализ данных, далее –Гистограмма. Входной интервал –$A$1:$A$1000; границы разрядов –$D$1:$D$11; верхняя левая ячейка выходного интервала$E$1.
Найдем вероятности pj,, соответствующие нормальной кривой, выравнивающей выборку. Для каждой из одиннадцати границxj,можно вычислить значение
,
соответствующее «стандартному» положению разрядов. В ячейку G2следует ввести формулу
=(E2-$C$3)/$C$7
и переместить маркер автозаполнения до ячейки G12(обратить внимание – запись ссылок$C$3и$C$7на ячейки, содержащие среднее и оценку стандартного отклонения, говорит о том, что эти ссылкине следует изменять в процессе автозаполнения).
Для нахождения вероятностей pjпоместим в ячейкуH3формулу
=НОРМСТРАСП(G3)-НОРМСТРАСП(G2)
и переместим маркер автозаполнения до ячейки H12.
Вычислим сумму
.
В ячейку I3введем
=(F3-$C$15*H3)^2/H3
и переместим маркер автозаполнения до ячейки I12.
После этого в ячейку I13 введем
=СУММ(I3:I12)/$C$15
Число разрядов , поэтому число степеней свободы‑распределения равно. Для вычисления вероятности критического события, состоящего в том, что значение случайной величины, подчиненной‑распределению, окажется столь же большим, как и наблюдаемое на опыте значение, в ячейкуI14введем
=ХИ2РАСП(I13;7)
Окончательный результат:
Пусть уровень значимости выбран равным . Так как, то на данном уровне значимости гипотеза о нормальном распределении генеральной совокупности не противоречит опытным данным.