Компьютерный практикум по статистике
.pdf∙под доверительными интервалами — числовые значения t-статистик и
критическую точку t0,05; n–m–1, найденную с помощью функции СТЬЮДРАСПОБР;
∙под значениями t-статистик — соответствующие P-значения.
6.Выбрать лучшее уравнение и, используя его, ответить на следующие вопросы:
а) Какой процент выборочной дисперсии признака Y обусловлен линей-
ным влиянием включенных в уравнение регрессоров?
б) Каковы точечная и 95%-ная интервальная оценки генерального среднего значения признака Y при значениях регрессоров на первом объекте?
в) Увеличение какого регрессора на единицу его измерения (при неизменных значениях других регрессоров) ведет к наибольшему изменению среднего значения результативного признака; увеличение какого регрессора на единицу его измерения (при неизменных значениях других регрессоров) ведет к наибольшему максимально возможному с 95%-ной вероятностью изменению среднего значения результативного признака?
г) Увеличение среднего значения какого регрессора на 1% (по отношению к его среднему значению) при неизменных значениях других регрессоров ведет к наибольшему процентному изменению среднего значения результативного признака (по отношению к его среднему значению); увеличение среднего значения какого регрессора на 1% (по отношению к его среднему значению) при неизменных значениях других регрессоров ведет к наибольшему максимально возможному с 95%-ной вероятностью процентному изменению среднего значения результативного признака?
РАБОТА 6. Компонентный и факторный анализ [выполняется с применением программы «Факторный анализ» пакета PASW Statistics (SPSS)].
Задача. Изучается система из пяти признаков X(1), X(2), X(3), X(4), X(5) по числовым данным, собранным на n = 52 объектах. Цель — выявить общие
для этих признаков латентные факторы (компоненты), влиянием которых обусловлены вариации признаков и их ковариации. Варианты признаков и их числовые значения приведены для каждого варианта в прил. 4 (они совпадают с вариантами факторных признаков в работе 5). Требуется:
1. Записать модель компонентного анализа и предъявляемые к ней требования. Используя в качестве исходных данных матрицу (52 × 5) значений признаков X(1), X(2), X(3), X(4), X(5) (сохраненную при выполнении п. 2 работы 5), обратиться к программе «Факторный анализ» и реализовать метод главных компонент, задав максимальное число факторов равным пяти.
2.В окне результатов работы программы «Факторный анализ»:
а) выбрав для просмотра таблицу «Total variance explained», определить
доли общей дисперсии признаков (в процентах), приходящиеся на каждую компоненту, и накопленные доли этой дисперсии (в процентах);
б) выбрав для просмотра таблицу «Component matrix»:
∙определить матрицу (5 × 5) нагрузок признаков на компоненты;
∙записать выражения исходных признаков через компоненты и выражения компонент через признаки.
11
3. Снизить размерность системы исходных признаков, ограничившись несколькими первыми главным компонентами, на долю которых приходится не менее 70% общей дисперсии признаков. Дать содержательную интерпретацию этих компонент, используя матрицу нагрузок исходных признаков на главные компоненты и факторную диаграмму (unrotated factor solution). Рассчитать значения отобранных главных компонент на 52 объек-
тах и сохранить эти значения для использования в работе 7 (п. 5).
4.Провести регрессионный анализ признака Y (из работы 5) на ото-
бранные главные компоненты. Сравнить его результаты с окончательными результатами регрессионного анализа признака Y на исходные пять факторных признаков x(1), x(2), x(3), x(4), x(5) (полученными в работе 5).
5.Записать модель факторного анализа и предъявляемые к ней требования. Считая, что число общих факторов не превышает числа главных компонент, на долю которых приходится не менее 70% общей дисперсии
исходных признаков, обратиться к программе «Факторный анализ» и реализовать метод максимального правдоподобия (maximum likehood), воспользовавшись методом «Varimax» для вращения факторного пространства; про-
верить значимость модели факторного анализа. Рассчитать значения полученных общих факторов на 52 объектах и сохранить эти значения для использования в работе 7 (п. 6).
6.Сравнить факторные диаграммы до вращения (unrotated factor solution) и после вращения (rotated solution) и предложить на основании анали-
за матрицы факторных нагрузок и факторной диаграммы после вращения содержательную интерпретацию факторов; сравнить полученные факторы
сглавными компонентами, построенными в п. 4.
7.Провести регрессионный анализ признака Y на общие факторы.
Сравнить его результаты с результатами регрессионного анализа признака Y на исходные пять факторных признаков x(1), x(2), x(3), x(4), x(5) (полученными
в работе 5).
РАБОТА 7. Кластерный анализ [выполняется с применением программ «Hierarchical cluster analysis» и «K-Means cluster» пакета PASW Statistics (SPSS)].
Задача. Изучается система из пяти признаков x(1), x(2), x(3), x(4), x(5) по числовым данным, собранным на n = 52 объектах. Варианты признаков и их чи-
словые значения приведены для каждого варианта в прил. 4 (они совпадают с вариантами факторных признаков в работе 5). Цель — провести классификацию 20 объектов, номера которых приведены в прил. 4. Требуется:
1. Используя в качестве исходных данных матрицу (52 × 5) значений признаков x(1), x(2), x(3), x(4), x(5) на объектах, провести вычисления по программе «Hierarchical cluster analysis», выбрав для классификации все пять признаков, и реализовать метод ближайшего соседа (nearest neighbor) с выбором евклидовой метрики расстояний (euclidean distance), предварительно стандартизовав исходные данные (standardize); построить дендрограмму (dendrogram); сохранить протокол объединения (agglomeration schedule) и матрицу расстояний (proximity matrix).
2.В окне результатов иерархического кластерного анализа:
12
а) просмотрев матрицу расстояний, выписать расстояние между первым и двадцатым объектами и привести формулу его расчета;
б) выписать первые пять строк протокола объединения, объяснить их смысл и привести алгоритм пересчета матрицы расстояний между объектами на каждом шаге объединения;
в) проанализировав по дендрограмме иерархию объединения кластеров (первые пять шагов сопоставить с протоколом объединения), предложить (если это возможно) разбиение исходных 20 объектов на два кластера — класса и указать объекты, относящиеся к каждому классу.
3.Выполнить пп. 1 — 2 для методов дальнего соседа (furthest neighbor) и средней связи (between-groups linkage).
4.Провести вычисления по программе «K-Means cluster», выбрав для классификации пять признаков x(1), x(2), x(3), x(4), x(5) (c предварительной стан-
дартизацией) и указав в качестве количества кластеров число 2.
5.Выполнить пп. 1 — 4, выбрав для классификации не исходные признаки x(1), x(2), x(3), x(4), x(5), а главные компоненты, на долю которых при-
ходится не менее 70% общей дисперсии исходных признаков, (полученные
вработе 6).
6.Выполнить пп. 1 — 4, выбрав для классификации не исходные признаки x(1), x(2), x(3), x(4), x(5), а общие факторы (полученные в работе 6).
7.По результатам пп. 1 — 6 для каждого варианта разбиения вычислить внутриклассовые средние значения признаков x(1), x(2), x(3), x(4), x(5) и
их выборочные дисперсии, после чего выбрать вариант разбиения 20 объектов на два кластера — класса, руководствуясь критерием минимума суммы внутриклассовых дисперсий.
8.Для выбранного варианта разбиения проверить гипотезы о равенстве математических ожиданий каждого из пяти признаков в кластерах и на основании результатов проверки этих гипотез провести содержательную интерпретацию структуры изучаемой совокупности из 20 объектов и предложить названия для построенных кластеров.
9.Провести регрессионный анализ признака Y на признаки x(1), x(2), x(3), x(4), x(5) отдельно для каждого кластера. Сравнить его результаты с результатами регрессионного анализа признака Y на признаки x(1), x(2), x(3), x(4), x(5), полученными в работе 5.
РАБОТА 8. Дискриминантный анализ [выполняется с применением программы «Discriminant analysis» пакета PASW Statistics (SPSS)].
Задача. Изучается система из шести признаков Y, X(1), X(2), X(3), X(4), X(5) по числовым данным, собранным на n = 52 объектах. Варианты признаков и
их числовые значения приведены для каждого варианта в прил. 4 (они совпадают с вариантами результативного и факторных признаков в работе 5). Используя в качестве обучающей выборки разбиение 20 объектов из 52 на две группы, полученное в результате кластерного анализа (п. 6 работы 7), требуется расклассифицировать по этим двум группам оставшиеся 32 объекта, которые в кластерном анализе не рассматривались (считая, что каждый из оставшихся 32 объектов входит в одну и только в одну из этих двух групп). Цель — определить, в какую из групп входит каждый из 32 объек-
13
тов в предположении, что каждая группа подчиняется пятимерному нормальному закону распределения с одинаковой для обеих групп ковариационной матрицей. Требуется:
1. Используя в качестве исходных данных матрицу (52 × 5) значений признаков X(1), X(2), X(3), X(4), X(5) на объектах, провести вычисления по программе «Discriminant analysis», выбрав для классификации все пять признаков. На основании анализа таблицы «Canonical discriminant function coefficients» запи-
сать дискриминантную функцию, построенную программой.
2.Указать, к каким группам были отнесены классифицируемые объекты, и вероятности, с которыми объекты входят в эти группы.
3.Указать объекты, которые в обучающей выборке были неверно отнесены к группам, прокомментировать эти несоответствия.
4.На основании анализа таблицы «Wilks’ Lambda» проверить значи-
мость различий средних значений дискриминантной функции в двух группах.
5.Проверить гипотезы о равенстве математических ожиданий признаков в двух группах и на основании результатов проверки этих гипотез провести содержательную интерпретацию структуры изучаемой совокупности из 52 объектов и предложить названия для групп.
6.Провести регрессионный анализ признака Y на признаки x(1), x(2), x(3), x(4), x(5) отдельно для каждой из двух групп объектов. Сравнить его результаты с результатами регрессионного анализа признака Y на признаки x(1), x(2), x(3), x(4), x(5), полученными в работе 5.
РАБОТА 9. Непараметрический анализ однородности выборок [выполняется с применением программы «Factor analysis» пакета PASW Statistics (SPSS)].
Требуется:
1.Сформулировать содержательную социально-экономическую задачу, состоящую в проверке гипотезы об однородности двух выборок.
2.Сформулировать такую гипотезу и проверить ее с помощью критерия Вилкоксона — Манна — Уитни, приняв уровень значимости равным 0,05.
3.Провести содержательную интерпретацию результатов решения.
РАБОТА 10. Оценка связи между двумя порядковыми случайными величинами [выполняется с применением программы «Factor analysis» пакета
PASW Statistics (SPSS)].
Требуется:
1.Сформулировать содержательную социально-экономическую задачу, состоящую в оценке связи между двумя порядковыми случайными величинами и предложить для этой задачи исходные числовые данные (связанность рангов обязательна!).
2.Вычислить ранговые коэффициенты корреляции Спирмэна и Кендалла и проверить статистическую значимость найденных значений коэффициентов, приняв уровень значимости равным 0,05.
3.Провести содержательную интерпретацию результатов решения.
РАБОТА 11. Оценка связи между порядковой и категоризованной случайными величинами.
14
Требуется:
1.Сформулировать содержательную социально-экономическую задачу, состоящую в оценке связи между порядковой и категоризованной случайными величинами и предложить для этой задачи исходные числовые данные (связанность рангов обязательна!).
2.Вычислить ранговые коэффициенты корреляции Спирмэна и Кендалла и проверить статистическую значимость найденных значений коэффициентов, приняв уровень значимости равным 0,05.
3.Провести содержательную интерпретацию результатов решения.
РАБОТА 12. Оценка связи между несколькими порядковыми случайными
величинами.
Требуется:
1.Сформулировать содержательную социально-экономическую задачу, состоящую в оценке связи между более чем двумя порядковыми случайными величинами и предложить для этой задачи исходные числовые данные (связанность рангов обязательна!).
2.Вычислить коэффициент конкордации и проверить статистическую значимость найденного значения коэффициента, приняв уровень значимости равным 0,05.
3.Провести содержательную интерпретацию результатов решения.
РАБОТА 13. Оценка связи между двумя категоризованными случайны-
ми величинами.
Требуется:
1.Сформулировать содержательную социально-экономическую задачу, состоящую в оценке связи между двумя категоризованными случайными величинами X и Y (каждая из которых должна иметь не менее трех
градаций) и предложить исходные данные для таблицы сопряженности, соответствующей поставленной задаче (см. прил. 5).
2.Приняв уровень значимости равным 0,05, проверить гипотезу о независимости категоризованных случайных величин X и Y с помощью
критериев χ2 и χ2 -информационный.
3.Найти точечные и 95%-е интервальные оценки коэффициентов Чупрова, Крамера и Пирсона; сделать выводы о силе связи между величинами X и Y.
4.Найти точечные оценки направленных и симметризованных коэффициентов нормированной информации и λ и τ -коэффициентов Гудме-
на — Краскала; привести 95%-ные интервальные оценки коэффициентов
λY|X и λ X|Y; выводы о силе зависимости величин и связи между ними.
5.Провести содержательную интерпретацию результатов решения.
РАБОТА 14. Оценка связи между тремя категоризованными случайны-
ми величинами.
Требуется:
1. Сформулировать содержательную социально-экономическую задачу, требующую анализа таблицы сопряженности трех категоризованных случайных величин, каждая из которых имеет две градации, и предложить
15
исходные данные для таблицы сопряженности, соответствующей поставленной задаче (см. прил. 6);
2.Оценить параметры следующих логарифмически линейных моделей:
∙модели с отсутствием парных связей,
∙моделей с одной, двумя и тремя парными связями,
∙насыщенной модели;
3.Проверить адекватность каждой модели, используя критерий χ2 -
информационный, приняв уровень значимости равным 0,05;
4.Сравнить модели и сделать вывод о механизме формирования частот таблицы сопряженности.
5.Провести содержательную интерпретацию результатов решения.
3.МЕТОДИЧЕСКИЕ УКАЗАНИЯ
КВЫПОЛНЕНИЮ РАБОТ И ОФОРМЛЕНИЮ РЕЗУЛЬТАТОВ
3.1. П о с т р о е н и е и н т е р в а л ь н о г о в а р и а ц и о н н о г о р я д а , о ц е н и в а н и е н о р м а л ь н о г о з а к о н а
р а с п р е д е л е н и я и е г о п а р а м е т р о в
Служба маркетинга оценивает дилеров фирмы по объему продаж. Сведения об объеме ежедневных продаж товара (в тыс. ден. ед.) дилером за последние 100 дней приведены в табл. 3.1.1.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т а б л и ц а |
3.1.1 |
|||
47,0 |
37,2 |
52,4 |
62,8 |
62,0 |
67,3 |
28,2 |
47,7 |
61,0 |
39,1 |
43,1 |
33,1 |
31,5 |
40,2 |
42,3 |
28,8 |
44,3 |
46,0 |
51,3 |
46,3 |
46,7 |
46,3 |
63,4 |
49,1 |
48,1 |
44,9 |
69,7 |
58,7 |
73,8 |
43,5 |
66,6 |
33,9 |
55,4 |
59,0 |
69,2 |
49,2 |
44,8 |
56,8 |
46,2 |
57,6 |
35,6 |
41,5 |
34,8 |
46,4 |
49,7 |
50,3 |
46,8 |
71,9 |
32,6 |
42,6 |
24,2 |
64,5 |
37,2 |
43,5 |
57,6 |
54,7 |
58,7 |
56,0 |
36,3 |
38,8 |
56,9 |
53,2 |
40,6 |
47,6 |
51,3 |
55,6 |
51,4 |
40,9 |
68,8 |
54,9 |
50,7 |
58,3 |
58,6 |
43,6 |
40,8 |
61,1 |
38,0 |
34,4 |
57,1 |
56,4 |
72,1 |
64,4 |
63,0 |
51,1 |
50,0 |
54,5 |
49,7 |
39,5 |
32,3 |
58,3 |
54,4 |
56,2 |
52,1 |
39,7 |
62,4 |
46,9 |
41,6 |
41,8 |
45,7 |
45,5 |
1. Построим интервальный вариационный ряд. В ячейки A1:A101 рабочего листа Microsoft Excel введем данные об объеме продаж из табл. 3.1.1
(в первой строке — заголовок, как показано на рис. 3.1.1). Ширина интервала
=x(max) − x(min)
1+ 3,322lgn
(здесь x(max) — максимальный объем продаж, а x(min) — минимальный, расчет
производится с числом знаков после запятой, на один большим чем в исходных данных). Границы интервалов (aj; aj+1) рассчитываются по правилу:
a1 = x(min) – / 2, a2 = a1 + , a3 = a2 + , …; формирование интервалов заканчивается, как только для конца aν+1 очередного интервала выполняется
условие aν+1 > x(max). Расчет границ интервалов проиллюстрирован рис. 3.1.1.
Для расчета интервальных частот и построения полигона и гистограммы воспользуемся программой «Гистограмма» из надстройки «Анализ данных» Microsoft Excel. Для этого в версиях до Microsoft Excel 2003 включительно выберем в меню «Сервис | Анализ данных» Microsoft Excel пункт «Гистограмма». В версиях Microsoft Excel 2007 и 2010 нужно на вкладке «Данные»
нажать кнопку «» и далее выбрать пункт «Гистограмма».
16
В окне ввода исходных данных программы «Гистограмма» (рис. 3.1.2) укажем входной интервал (ссылку на ячейки A1:A101, содержащие данные об объеме продаж; выделять заголовок столбца и отмечать флажок «Метки» не будем), интервал карманов (ссылку на ячейки C7:C16, содержащие правые границы интервалов), установим флажок «Метки», которые означает, что в первой строке каждого из диапазонов A1:A101 и C7:C16 содержится
текстовый заголовок. Укажем, что результаты работы программы необходимо вывести на новый рабочий лист. Установим флажок для генерации интегральных процентных отношений — значений выборочной функции распределения, также установим флажок автоматического вывода графика —
гистограммы и кумуляты.
|
A |
B |
C |
1 |
Объем продаж за 100 дней |
Параметры |
Значения параметров |
|
2 |
47,0 |
Объем выборки n |
=СЧЕТ(A2:A101) |
|
3 |
37,2 |
x(min) |
=МИН(A2:A101) |
|
4 |
52,4 |
x(max) |
=МАКС(A2:A101) |
|
5 |
62,8 |
Ширина интервала |
=(C4–C3)/(1+3,322*LOG(C2;10)) |
|
6 |
62,0 |
Границы интервалов |
|
|
7 |
67,3 |
Левые границы |
Правые границы |
|
8 |
28,2 |
=C3–C5/2 |
=B9+C5 |
|
9 |
47,7 |
=B9+C5 |
=B10+C5 |
|
10 |
61,0 |
=B10+C5 |
=B11+C5 |
|
11 |
39,1 |
=B11+C5 |
=B12+C5 |
|
12 |
43,1 |
=B12+C5 |
=B13+C5 |
|
13 |
33,1 |
=B13+C5 |
=B14+C5 |
|
14 |
31,5 |
=B14+C5 |
=B15+C5 |
|
15 |
40,2 |
=B15+C5 |
=B16+C5 |
|
16 |
|
=B16+C5 |
=B17+C5 |
|
|
а) формулы Microsoft Excel |
||
|
|
|
|
|
|
|
A |
B |
C |
|
1 |
Объем продаж за 100 дней |
Параметры |
Значения параметров |
|
2 |
47,0 |
Объем выборки n |
100 |
|
3 |
37,2 |
x(min) |
24,2 |
|
4 |
52,4 |
x(max) |
73,8 |
|
5 |
62,8 |
Ширина интервала |
6,49 |
|
6 |
62,0 |
Границы интервалов |
|
|
7 |
67,3 |
Левые границы |
Правые границы |
|
8 |
28,2 |
20,956 |
27,444 |
|
9 |
47,7 |
27,444 |
33,933 |
|
10 |
61,0 |
33,933 |
40,422 |
|
11 |
39,1 |
40,422 |
46,911 |
|
12 |
43,1 |
46,911 |
53,399 |
|
13 |
33,1 |
53,399 |
59,888 |
|
14 |
31,5 |
59,888 |
66,377 |
|
15 |
40,2 |
66,377 |
72,866 |
|
16 |
|
72,866 |
79,354 |
б) результаты расчетов
Рис. 3.1.1. Расчет границ интервалов
Результаты работы программы «Гистограмма» представлены на рис. 3.1.3. В столбце «Правые границы» на рис. 3.1.3, а указаны правые границы интервалов, в столбце «Частота» — интервальные частоты, а в столбце
17
«Интегральный %» — накопленные частоты, рассчитанные программой. На рис. 3.1.3, б представлен график, построенный программой, — на одной диа-
грамме построены гистограмма и кумулята (впоследствии мы разделим этот график на два).
|
Рис. 3.1.2. Окно ввода данных программы «Гистограмма» |
|||
|
Правые границы Частота Интегральный % |
|
||
|
27,444 |
1 |
1,00% |
|
|
33,933 |
7 |
8,00% |
|
|
40,422 |
12 |
20,00% |
|
|
46,911 |
25 |
45,00% |
|
|
53,399 |
18 |
63,00% |
|
|
59,888 |
20 |
83,00% |
|
|
66,377 |
9 |
92,00% |
|
|
72,866 |
7 |
99,00% |
|
|
79,354 |
1 |
100,00% |
|
|
Еще |
0 |
100% |
|
|
а) числовые результаты |
|
||
|
|
Гистограмма |
|
|
|
30 |
|
120,00% |
|
|
25 |
|
100,00% |
|
|
20 |
|
80,00% |
|
Частота |
|
|
|
Частота |
15 |
|
60,00% |
Интегральный % |
|
|
|
|
||
|
|
|
|
|
|
10 |
|
40,00% |
|
|
5 |
|
20,00% |
|
|
0 |
|
0,00% |
|
|
27,444 33,933 40,422 46,911 53,399 59,888 66,377 72,866 79,354 |
Еще |
|
|
|
Правые границы |
|
|
|
б) графические результаты
Рис. 3.1.3. Результаты работы программы «Гистограмма»
18
|
Добавим к таблице, полученной в результате работы программы «Гис- |
|||||||||||||
тограмма» и уже содержащей правые границы интервалов (aj; aj+1) и интер- |
||||||||||||||
вальные частоты mj , столбцы, содержащие: |
|
|
|
|
||||||||||
∙ |
левые границы интервалов; |
|
|
|
|
|
|
|||||||
∙ |
|
|
|
|
|
|
′ |
|
|
|
|
|
|
|
середины интервалов xj = (aj + aj+1)/2; |
|
|
|
|
||||||||||
∙ |
интервальные частости ˆp |
= m |
/n ; |
|
|
|
|
|
||||||
|
|
|
|
|
|
|
j |
j |
|
|
|
|
|
|
∙ |
|
|
|
|
|
|
|
|
|
|
|
ˆ |
|
|
оценки функции плотности внутри интервалов f (x′) =ˆp / . |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
X |
j |
j |
|
Для получения оценок функции распределения в концах интервалов |
|||||||||||||
ˆ |
|
) = |
∑ |
ˆp установим в столбце «Интегральный %» (в результатах рабо- |
||||||||||
F (a |
j+1 |
|||||||||||||
X |
|
k |
|
|
|
|
|
|
|
|
|
|
||
|
|
|
k j+1 |
|
|
|
|
|
|
|
|
|
|
|
ты программы «Гистограмма» рис. 3.1.3) числовой формат значений с двумя |
||||||||||||||
десятичными знаками после запятой. |
|
|
|
|
|
|||||||||
|
Теперь мы можем заполнить первые шесть столбцов табл. 3.1.2, содер- |
|||||||||||||
жащие интервальный вариационный ряд, и построить полигон [ломаную, со- |
||||||||||||||
|
|
|
|
|
′ ˆ |
′ |
|
|
|
|
|
|
|
|
единяющую точки (xj |
; fX (xj )), j = 1, 2, …, ν] и гистограмму [фигуру, состоя- |
|||||||||||||
щую из прямоугольников, в основании которых лежат интервалы группиро- |
||||||||||||||
вания (aj; aj + 1), а высотами являются значения |
ˆ |
′ |
|
|
||||||||||
fX (xj )] на рис. 3.1.4 и кумуля- |
||||||||||||||
|
|
|
|
|
|
|
|
|
ˆ |
|
|
|
|
|
ту [ломаную, соединяющую точки (aj+1; FX |
(aj+1)) , j = 1, 2, …, ν] на рис. 3.1.5. |
|||||||||||||
|
|
|
|
|
f(x) |
|
|
|
|
|
|
|
|
|
|
|
|
|
0,0450 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,0400 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,0350 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,0300 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,0250 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,0200 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,0150 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,0100 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,0050 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
0 |
24,20 |
30,69 |
37,18 |
43,67 |
50,16 |
56,64 |
63,13 |
69,62 |
76,11 |
|
|
|
|
|
Гистограмма |
Полигон |
Функция плотности нормального закона |
||||||||
Рис. 3.1.4. Гистограмма, полигон и функция плотности нормального закона |
F(x) |
|
|
|
|
|
|
|
|
1,0000 |
|
|
|
|
|
|
|
|
0,8000 |
|
|
|
|
|
|
|
|
0,6000 |
|
|
|
|
|
|
|
|
0,4000 |
|
|
|
|
|
|
|
|
0,2000 |
|
|
|
|
|
|
|
|
0,0000 |
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
27,444 |
33,933 |
40,422 |
46,911 |
53,399 |
59,888 |
66,377 |
72,866 |
79,354 |
Кумулята |
|
Функция распределения нормального закона |
||||||
Рис. 3.1.5. Кумулята и функция распределения нормального закона |
19
20
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т а б л и ц а |
3.1.2 |
|
||||
|
Сере- |
Интер- |
Ин- |
Оценка |
Оценка |
Функция |
Функция рас- |
|
pj = |
|
|
np |
|
m |
|
2 |
|
||||
|
дина |
валь- |
функции |
плотности |
|
|
|
|
j |
j |
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Интервал |
ин- |
ная |
терваль- |
функции |
распре- |
нормаль- |
пределения |
F(aj) |
= F(aj + 1)– |
Частота |
после |
объ- |
(npj − mj ) |
|
|||||||
(aj; aj + 1) |
ная час- |
плотности |
нормального |
npj |
|
единения |
|
npj |
|
||||||||||||
терва- |
часто- |
деления |
ного зако- |
|
–F(a ) |
|
|
|
|||||||||||||
|
′ |
|
тость ˆp |
ˆ |
′ |
ˆ |
|
|
|
′ |
закона F(aj + 1) |
|
j |
|
|
интерва- |
|
|
|
||
|
та m |
j |
fX (xj ) |
(a |
|
) |
|
|
|
|
|
|
|
|
|
|
|||||
|
ла xj |
|
|
|
F |
+ |
на fN (xj ) |
|
|
|
|
|
лов |
|
|
|
|||||
|
|
j |
|
|
|
X |
j |
1 |
|
|
|
|
|
|
|
|
|
|
|||
[20,956; 27,444) |
24,20 |
1 |
0,01 |
0,0015 |
0,01 |
|
0,0022 |
0,0187 |
0,0000 |
0,0187 |
1,87 |
|
7,04 |
8 |
|
0,1295 |
|
||||
[27,444; 33,933) |
30,69 |
7 |
0,07 |
0,0108 |
0,08 |
|
0,0077 |
0,0704 |
0,0187 |
0,0518 |
5,18 |
|
|
|
|||||||
|
|
|
|
|
|
|
|
||||||||||||||
[33,933; 40,422) |
37,18 |
12 |
0,12 |
0,0185 |
0,20 |
|
0,0190 |
0,1942 |
0,0704 |
0,1237 |
12,37 |
|
12,37 |
12 |
|
0,0112 |
|
||||
[40,422; 46,911) |
43,67 |
25 |
0,25 |
0,0385 |
0,45 |
|
0,0321 |
0,4002 |
0,1942 |
0,2060 |
20,60 |
|
20,60 |
25 |
|
0,9375 |
|
||||
[46,911; 53,399) |
50,16 |
18 |
0,18 |
0,0277 |
0,63 |
|
0,0374 |
0,6395 |
0,4002 |
0,2393 |
23,93 |
|
23,93 |
18 |
|
1,4677 |
|
||||
[53,399; 59,888) |
56,65 |
20 |
0,20 |
0,0308 |
0,83 |
|
0,0301 |
0,8332 |
0,6395 |
0,1937 |
19,37 |
|
19,37 |
20 |
|
0,0203 |
|
||||
[59,888; 66,377) |
63,14 |
9 |
0,09 |
0,0139 |
0,92 |
|
0,0167 |
0,9426 |
0,8332 |
0,1094 |
10,94 |
|
10,94 |
9 |
|
0,3429 |
|
||||
[66,377; 72,866) |
69,63 |
7 |
0,07 |
0,0108 |
0,99 |
|
0,0064 |
0,9856 |
0,9426 |
0,0430 |
4,30 |
|
5,74 |
8 |
|
0,8876 |
|
||||
[72,866; 79,354) |
76,12 |
1 |
0,01 |
0,0015 |
1,00 |
|
0,0017 |
1,0000 |
0,9856 |
0,0144 |
1,44 |
|
|
|
|||||||
|
|
|
|
|
|
|
|
||||||||||||||
Итого |
— |
100 |
1,00 |
— |
|
|
— |
|
|
— |
— |
— |
— |
— |
|
— |
|
100 |
|
χ42=3,80 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|