- •3.8. Равномерный закон распределения
- •3.9. Показательный закон распределения
- •3.10. Нормальный закон распределения
- •3.11. Нормально распределенная случайная величина. Примеры
- •Тема 4. Элеметы математической статистики
- •4.1. Выборочный метод
- •4.2. Статистическое распределение выборки и его характеристики
- •4.3. Полигон и гистограмма
- •4.4. Точечные оценки параметров генеральной совокупности
- •4.5. Интервальная оценка (доверительный интервал) для генеральной средней
- •4.6. Доверительный интервал. Примеры
- •4.7. Понятие о критериях согласия
- •4.8. Критерий согласия Пирсона. Пример
- •Тема 5. Элементы теории корреляции
- •5.1. Виды зависимостей между случайными величинами х и у
- •5.2. Корреляционная таблица
- •5.3. Виды уравнений регрессии
- •5.4. Метод наименьших квадратов
- •5.5. Показатели тесноты корреляционной связи
- •5.6. Пример составления уравнения регрессии и оценки тесноты корреляционной связи
4.6. Доверительный интервал. Примеры
Пример1. Найти доверительный интервал для оценки неизвестного математического ожидания нормально распределенного признака, если известны: = 2; = 5,4; n = 10; g = 0,95.
Решение: 2Ф(t) = 0,95, Ф(t) = 0,5*0,95=0,475. Из таблицы (Приложение 2) t = 1,96 .
Доверительный интервал ( – d; + d) = (5,4-1,14; 5,4+1,14)=(4,16; 6,6).
Пример 2. Найти минимальный объем выборки, при котором с надежностью 0,95 точность оценки математического ожидания нормально распределенного признака по выборочной средней будет равна 0,2, если среднее квадратическое отклонение равно 2.
Решение: Дано: g = 0,95; = 0,2; = 2. Найти n.
Из формулы находим . Из условия 2Ф(t) = 0,95 находим
t = 1,96. Тогда
Пример3. По заданным значениям характеристик нормально распределенного признака найти доверительный интервал для оценки неизвестного математического ожидания:
g = 0,95, n =12, S = 1,5. = 16,8.
Решение. Из таблицы (Приложение 4) по данным g и n находим t = 2,20,
тогда
Доверительный интервал: (16,8 – 0,95; 16,8 + 0,95) = (15,85; 17,75).
4.7. Понятие о критериях согласия
Статистической называется гипотеза о неизвестном законе распределения случайной величины или о параметрах закона распределения, вид которого известен.
Пусть имеется статистическое распределение выборки для случайной величины X:
xi |
x1 |
x2 |
x3 |
… |
xk |
ni |
n1 |
n2 |
n3 |
… |
nk |
По виду полигона пли гистограммы, сравнивая их с графиками дифференциальных функции распределения, делаем предположение о виде закона распределения случайной величины.
Сделанное предположение (гипотеза) подтверждается расчетами критерия согласия, имеются различные критерии согласия: Хинчина, Колмогорова, Пирсона, например, критерий Пирсона (хи-квадрат)
позволяет сравнивать близость частот ni данного статистического распределения выборки с теоретическими частотами ni, найденными с помощью функции распределения предполагаемого закона:
где f(x) – дифференциальная, F(x) – интегральная функции предполагаемого распределения.
Если все вычисленное значение критерия 2 - не превосходит некоторого критического значения 2кр, взятого по таблице (приложение 3), то выдвинутая гипотеза принимается с заданным уровнем надежности (вероятности) = *А в противном случае гипотеза отвергается.
В Приложении 3:
– уровень значимости, это вероятность отвергнуть правильную гипотезу;
S – число степеней свободы, S = k – 1 – r, где r – число параметров предполагаемого распределения; r = 2 для нормального распределения (а и ), г = 1 для показательного распределения ().
4.8. Критерий согласия Пирсона. Пример
Задача. В результате выборочного обследования торговых предприятий получены следующие значения их дневного товарооборота (млн. руб.) на интервале [0,5; 10,5]:
3,24 3,00 3,25 8,35 5,92 5,98 3,41 4,44 3,87 9,46
9,30 7,66 6,21 7,98 8,26 6,13 8,27 4,97 4,39 5,09
2,28 6,53 8,66 5,72 4,99 4,26 2,13 5,25 3,56 6,04
5,95 2,91 6,46 5,31 4,01 5,86 6,83 3,99 7,45 6,78
2,92 2,96 5,07 2,87 3,97 5,43 6,85 7,33 8,74.
Пользуясь критерием Пирсона, проверить гипотезу о нормальном распределении дневного товарооборота в генеральной совокупности данных, взяв уровень значимости = 0,05. Построить полигон и гистограмму выборочного распределения.
План решения
1. Провести интервальную обработку статистических данных, разбив заданный интервал на 10 равных частей и выбрав в качестве значений вариант середины частичных интервалов.
2. Построить полигон и гистограмму полученного статистического распределения выборки.
3. Найти основные характеристики распределения выборочные данных:
среднее значение, дисперсию, среднее квадратическое отклонений.
4. Принять гипотезу о нормальном распределении генеральной совокупности признака и записать функцию плотности распределения вероятности с учетом найденных параметров.
5. Вычислить теоретические частоты нормального распределения, результаты вычислении оформить таблицей.
6. Вычислить эмпирическое (наблюдаемое) значение 2 и составить расчетную таблицу.
7. Найти критическое значение 2кр в таблице по данным: К – число степеней свободы и – уровень значимости.
8. Сделать вывод о приемлемости выбранной гипотезы.
9. Найти доверительный интервал для неизвестной генеральной средней с надежностью = 0,95 (в случае, если гипотеза о нормальном распределении подтверждается).
Решение
1. Разобьем интервал [0,5; 10,5] на 10 равных частей, тогда шаг разбиения В качестве значения признака берем середины полученных частичных интервалов xi: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. Подсчитываем, сколько значений признака попадает в каждый интервал, это и есть соответствующие частоты ni.
В результате получим статистическое распределение дневного товарооборота по торговым предприятиям.
Товарооборот (млн. руб.) xi |
1 2 3 4 5 6 7 8 9 10 |
Количество предприятий ni |
0 2 8 8 7 9 6 5 4 0 |
Контроль: сумма всех частот должна быть равна объему выборки .
Полигон и гистограмма являются графическим изображением полученного статистического распределения выборки и строятся для наглядного уяснения основных черт этого распределения. Масштабы по осям ОХ и ОУ выбираются независимо друг от друга, исходя из удобств построения.
2. Полигон и гистограмма дают возможность сделать предположение о виде закона распределения изучаемого фактора.
По внешнему виду построенного графика можно предположить, что закон распределения дневного товарооборота по предприятиям является нормальным.
3. Определим основные характеристики статистического распределения выборки по формулам: – объем выборки;
– выборочное среднее значение;
– выборочная дисперсия;
– выборочное среднее квадратическое отклонение.
Вычисления по этим формулам удобно вести в таблице 1.
Таблица1.
№ |
хi |
ni |
хi ni |
хi - |
(хi- )2 |
(хi- )2ni |
1 2 3 4 5 6 7 8 9 10 |
1 2 3 4 5 6 7 8 9 10 |
0 2 8 8 7 9 6 5 4 0 |
0 4 24 32 35 54 42 40 36 0 |
-4,45 -3,45 -2,45 -1,45 -0,45 0,55 1,55 2,55 3,55 4,55 |
19,8 11,9 6 2,1 0,2 0,3 2,4 6,5 12,6 20,7 |
0 23,8 48 16,8 1,4 2,7 14,4 32,5 50,4 0 |
|
– |
49 |
267 |
– |
– |
190 |
n =49;
4. Согласно предположению о нормальном законе распределения дневного товарооборота X в генеральной совокупности, функция распределения плотности вероятности имеет вид:
или для нашего статистического распределения.
5. Используя данную функцию, вычислим теоретические частоты распределения по формуле , где рi – вероятность попадания нормально распределенной случайной величины по найденным параметрам и в частичный интервал [i; i]: – вспомогательный промежуточный параметр, – табулированная функция, значения которой берутся по таблице (Приложение 1). В силу четности, (– u) = (u). Так как h = 1, вычислим значение вспомогательной величины Найденные значения теоретических частот округляем до целых чисел. Все вычисления поместим в таблице 2.
6. Вычисляем наблюдаемое значение критерия . Предварительно рекомендуется объединить между собой соседние малочисленные интервалы, суммируя их частоты, в итоге каждый интервал должен содержать не менее пяти вариантов. В рассматриваемом примере объединяем три первых и три последних интервала. Число интервалов m после укрупнения равно шести, результаты вычислений поместим в таблице 3.
Таблица 2
№ / № |
α I; βi |
xi |
ni |
xi – |
ui |
Y(ui) |
ni/ |
1 |
0,5-1,5 |
1 |
0 |
-4,45 |
-2,26 |
0,0310 |
0,77 1 |
2 |
1,5-2,5 |
2 |
2 |
-3,45 |
-1,75 |
0,0863 |
2,15 2 |
3 |
2,5-3,5 |
3 |
8 |
-2,45 |
-1,24 |
0,1849 |
4,6 5 |
4 |
3,5-4,5 |
4 |
8 |
-1,45 |
-0,74 |
0,3034 |
7,55 8 |
5 |
4,5-5,5 |
5 |
7 |
-0,45 |
0,23 |
0,3885 |
9,66 10 |
6 |
5,5-6,5 |
6 |
9 |
0,55 |
0,28 |
0,3836 |
9,54 10 |
7 |
6,5-7,5 |
7 |
6 |
1,55 |
0,79 |
0,2920 |
7,26 7 |
8 |
7,5-8,5 |
8 |
5 |
2,55 |
1,29 |
0,1736 |
4,32 4 |
9 |
8,5-9,5 |
9 |
4 |
3,55 |
1,80 |
0,0790 |
1,96 2 |
10 |
9,5-10,5 |
10 |
0 |
4,55 |
2,31 |
0,0277 |
0,69 1 |
|
|
|
49 |
|
|
|
50 |
Таблица 3
№ / № |
ni |
ni/ |
ni - ni/ |
(ni - ni/)2 |
(ni - ni/)2 |
1 |
10 |
8 |
2 |
4 |
0,50 |
2 |
8 |
8 |
0 |
0 |
0 |
3 |
7 |
10 |
-3 |
9 |
0,90 |
4 |
9 |
10 |
-1 |
1 |
0,1 |
5 |
6 |
7 |
-1 |
1 |
0,14 |
6 |
9 |
7 |
2 |
4 |
0,54 |
|
49 |
50 |
|
|
2,21 |
7. Найдем в таблице (Приложение 3) критическое значение 2кр по заданным значениям: – уровень значимости (вероятность отвергнуть правильную гипотезу); k – число степеней свободы, у нас K = 6 – 2 – 1 = 3, =0,05; 2кр = 7,8.
8. Вывод: так как 2набл < 2кр (2,21< 7,8), то нет оснований отвергнуть гипотезу о нормальном распределении, то есть расхождение эмпирических ni и теоретических ni частот незначительное. Данные выборочных наблюдения согласуются с гипотезой о нормальном распределении дневного товарооборота среди торговых предприятий.
9. Считая, что распределение дневного товарооборота подчинено нормальному закону, оценим неизвестное генеральное среднее значение товарооборота: . По известной выборочной средней ;
, здесь – заданная надежность оценки, – характеризует точность оценки, , где t определяется из 2Ф(t) = . С помощью таблиц (Приложение 2) находим t: .
Вычисляем Находим доверительный интервал для генеральной средней: |a – 5,45| < 0,55; – 0,55 < а – 5,45 < 0,55;
4,9 < a < 6.
Таким образом, истинное среднее значение товарооборота содержится в интервале от 4,9 до 6 млн. руб. с надежностью = 95%.