Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Руководство по выполнению КР, (ТВ и МС).doc
Скачиваний:
53
Добавлен:
20.05.2015
Размер:
1.63 Mб
Скачать

4. Построение теоретического закона распределения

Для построения графика теоретического закона распределения совместно с графиком гистограммы и для проверки согласия по критерию хи-квадрат Пирсона надо заполнить таблицу, знакомую по лекции (см. ниже по тексту, таблица №1). Для построения этой таблицы надо воспользоваться таблицей карман – частота процедуры Гистограмма.

xi – границы интервалов группировки (карманы – получены как результат выполнения процедуры Гистограмма);

mi – количество элементов выборки, попавших в i – ый интервал (частота – получена в результате процедуры Гистограмма);

Таблица №1

xi

mi

n∙pi

карманы

частота

теоретическая частота

статистика U

x1

m1

n∙p1

x2

m2

n∙p2

xk

mk

n∙pk

Для построения этой таблицы в Excel к столбцам Карман и Частота процедуры Гистограмма надо добавить столбцы npi и , где в ячейках столбца будет находиться статистика (как показано на рис. 6).

pi – теоретическая вероятность попадания элементов выборки в i – ый интервал группировки для принятой гипотезы о нормальном распределении генеральной совокупности равна

pi = P(xi-1 < X < xi) = F(xi) – F(xi-1).

npi – теоретическая, ожидаемая частота попадания элементов выборки в i – ый интервал группировки для принятой гипотезы о нормальном распределении генеральной совокупности.

В Excel эту величину можно вычислить, воспользовавшись функцией НОРМРАСП.

npi = НОРМРАСП(xi; среднее; стандартное_откл; 1n

– НОРМРАСП(xi-1; среднее; стандартное_откл; 1) ·n.

–статистика, являющаяся мерой расхождения между значениями эмпирической и теоретической плотности распределения;

Рис. 6. Подготовительная таблица для построения графика теоретической плотности нормального распределения.

Замечание. Функцию НОРМРАСП вызывается следующим образом. В главном менюExcelвыбирается закладкаФормулы → Вставить функцию (или щелкните в строке формул значок fx)в диалоговом окне Мастер функций – шаг 1 из 2 в категории Статистические → НОРМРАСП.ОК.

Рис. 7. Окно Мастер функцийдля выбора функции НОРМРАСП из категорииСтатистические.

В раскрывшемся окне Аргументы функцииНОРМРАСПзаполните поля ввода как показано далее на рис. 10.

Рис. 8. Окно ввода параметров для получения функции нормального распределения

В поле Xвводится адрес ячейки, в которой находится граница интервала группировки.

В поле Среднеевводится адрес ячейки, в которой находится среднее значение выборки, полученное при выполнении процедурыОписательная статистикаE$10$.

В поле Стандартное_отклвводится адрес ячейки, в которой находится значение стандартного отклонения выборки, полученное при выполнении процедурыОписательная статистика – E$14$.

В поле Интегральнаявведите единица1. Единица в полеИнтегральнаяозначает вычисление функции распределенияF(x). ОК.

1. В ячейку E31 внесите формулу

для вычисления значения функции нормального распределения F(x1 = 2,93) = P(– ∞ < X ≤ x1), умноженного на число наблюдений n. В рассматриваемом примере n =100. В ячейку E31 будет получено теоретическое (ожидаемое) число случайных величин, попавших в интервал ,npi = F(x1)∙100, =НОРМРАСП(C31;E$10$;E$14$;1)*100 (как показано на рис. 9).

E10 – среднее значение, E14 – стандартное отклонение, взятые из таблицы Описательная статистика.

2. В ячейку E32 поместите формулу для вычисления теоретического (гипотетического) числа случайных величин, попавших в интервал :

np2 = n ∙ [F(x2) – F(x1)] = n ∙ [P(x1 < X ≤ x2)] = n ∙ [P(2,93 < X ≤ 4,87)],

где p2 = F(x2) – F(x1) = P(x1 < X ≤ x2) = P(2,93 < X ≤ 4,87) - теоретическая вероятность попадания нормально распределенных случайных величин в промежуток .

В Excel в строку формул необходимо поместить формулу:

=(НОРМРАСП(C32;$E$10;$E$14;1)*100 –

– НОРМРАСП(C31;$E$10;$E$14;1))*100

Заполните диапазон ячеек Е33:Е40 результатами вычисления этой формулы, используя маркер заполнения, чтобы получить в ячейках ,, … ,теоретическое (ожидаемое) число случайных величин, попавших в каждый частный интервал.

Рис. 9. Столбец npi (E31;E41) содержит результаты вычисления теоретических значений числа случайных величин попавших в каждый частичный интервал (карман) npi

3. В ячейку E41 поместите формулу для вычисления теоретического (гипотетического) числа случайных величин, попавших в промежуток (x10; ∞):

P(x10 < x < ∞) = 1 – P(– ∞ < x ≤ x10) = 1 – F(x10) – вероятность попадания нормально распределенных случайных величин в промежуток (x10; ∞).

В Excel в строку формул необходимо поместить формулу:

=(1 – НОРМРАСП(C40;E$10$;E$14$;1))*100

В результате всех этих операций выводится таблица (рис. 9).

Для проверки правильности вычислений просуммируйте числа в ячейках столбца E31:E41. В ячейке Е42 показана сумма содержимого ячеек Е31:Е40. Она должна быть равна n = 100.

В графике Гистограмма частот добавьте кривую нормального (теоретического) распределения, как это вы умеете делать.

Щелкните правой кнопкой мыши по столбику гистограммы, в появившемся меню выберите: Выбрать данные…Добавить → заполнить поля ввода Имя ряда: f, Значения: введите массив значений npi , (или Имя ряда:, Значения X:, Значения Y) ОК, ОК.

Рис. 10. Графики гистограммы эмпирических и теоретических частот, позволяющие по виду графиков выбрать в качестве гипотезы H0 нормальное распределение.

5. Проверка согласия эмпирического и теоретического законов распределения по критерию хи-квадрат Пирсона ( = 0,95)

Для того чтобы сохранить графики гистограммы эмпирических и теоретических частот в красивом виде необходимо скопировать таблицу на рис. 9 Карман – Частотаnpi U в другое место таблицы.

Скопируйте таблицу Карман – Частотаnpi U в свободные ячейки листа Excel, для чего, верхний левый угол копии разместите, например, в ячейке C75.

Для вычисления статистики необходимо выполнить условие – в каждом кармане должно быть не менее 5 элементов выборки(npi ≥ 5) для теоретических значений распределения частот. Объединим (просуммируем) три верхние ячейки (просуммируем ячейки E76, E77 и E78, их сумма дает величину больше 5, а именно 6,02979) и три нижние ячейки (просуммируем ячейки E84, E85 и E86, их сумма дает величину 8,33947), столбца npi , содержащего теоретические частоты.

Суммируемые ячейки на рис. 11 выделены красным курсивом.

Рис. 11. Верхние ячейки E76, E77 и E78, выделенные для суммирования , и нижние ячейки E84, E85 и E86, выделенные для суммирования.

В результате после суммирования получится таблица рис. 12.

Рис. 12. В столбце npi объединены ячейки E76, E77 и E78 (результат суммирования – в ячейке E78) и ячейки E84, E85 и E86 (результат суммирования – в ячейке E84).

Объедините три верхние ячейки D76, D77 и D78 и три нижние ячейки D84, D85 и D86 столбца Частота, содержащего эмпирические (опытные) частоты.

Рис. 13. В столбце Частота объединены ячейки D76, D77 и D78 (результат суммирования – в ячейке D78) и ячейки D84, D85 и D86 (результат суммирования – в ячейке D84).

Для проверки правильности проведенных операций суммирования просуммируйте столбцы D78 – D84 и столбцы E78 – E84, результат должен быть равен объему выборки n = 100.

В ячейку F78 столбца помеченного именем U введите формулу , в строку формул введите формулу=(D78-E78)^2)/E78, и скопируйте ее в ячейки F79 – F84.

В ячейке F85 получите сумму содержимого ячеек F78;F84.

Рис. 14. Таблицы с результатами вычисления статистики

В ячейке F85 получено значение статистики ,

U = 2,96483.

Критическое значение статистики U, которая имеет распределение для уровня значимости = 1 -  = 0,05, с шестью (число частичных интервалов1число параметров, в рассматриваемом примере 9 – 1 – 2 = 6) степенями свободы, определяется при помощи функции ХИ2ОБР.

Функцию ХИ2ОБР вызывается следующим образом. В главном меню Excel выбирается закладка Формулы → Вставить функцию → в диалоговом окне Мастер функций – шаг 1 из 2 в категории Статистические → ХИ2ОБР. ОК.

В диалоговом окне Аргументы функции ХИ2ОБР заполните поля как показано на рис. 15, предварительно выбрав ячейку для результата вычисления функции, например F88.

Рис. 15. Диалоговое окно функции ХИ2ОБР с заполненными полями ввода

Рис. 16. Таблица с окончательными результатами вычисления статистики

и критического значения =12.5916

Значение статистики U = 2,96483 оказалось меньше критического значения =12.5916, как это видно из таблицы.

Вывод. Следовательно, гипотеза, состоящая в том, что генеральная совокупность подчиняется нормальному закону распределения, принимается.

Теперь можно использовать принятый гипотетический закон распределения – закон распределения генеральной совокупности для вычисления вероятностей попадания исследуемой случайной величины в заданный интервал.

7. Вычисление вероятности попадания исследуемой случайной величины в заданные интервалы (c = 10, d = 15)

= , = ,= .

Вычисления выполнить в Excel. Используя функцию НОРМРАСП.

8. Доверительные интервалы для заданной доверительной вероятности = 0,99, = 0,95, = 0,9.

1. Доверительный интервал для неизвестного математического ожидания при неизвестной дисперсии

,

–критическая точка распределения Стьюдента с n – 1 числом степеней свободы и уровнем значимости  = 1 - 

2. Доверительный интервал для неизвестного дисперсии

,

и – критическая точка распределениясn – 1 числом степеней свободы и уровнем значимости .

Пример вычислений в Excel приведен в приложении 1.

Приложение 1

…. …… …… ….. ….

… … … … … … … …

… … … … … … … …

…. …. … … …. …. …. …