02 а Гистограмма
.doc
Омский Государственный Технический Университет
Кафедра «Транспорта и хранения нефти и газа,
стандартизация и сертификация»
Дисциплина: «Статистические методы. Контроль и управление качеством»
ЗАДАНИЕ
Гистограмма 02а
Вариант 10
Выполнил:
студент гр. СК-518
Манзюк А.П.
Проверила:
Боярникова Л.В.
Омск 2012
Гистограммы
Вычисление параметров распределения
Проанализировать результаты статистических данных о возрасте пострадавших от травм и несчастных случаев при различных видах деятельности
-
Обработать данные, разбив их на диапазоны с границами 13-17, 18-22 и т.д.
-
Вычислить параметры распределения несчастных случаев: среднее арифметическое, моду, медиану, СКО, размах.
-
Построить гистограмму значений, пользуясь диапазонами с теми же границами.
-
Прокомментировать форму гистограмм, сделать выводы.
Таблица 1- Возраст пострадавших от травм и несчастных случаев при различных видах деятельности
с |
64 |
71 |
47 |
37 |
26 |
32 |
25 |
75 |
27 |
69 |
28 |
58 |
48 |
45 |
13 |
36 |
15 |
14 |
55 |
71 |
32 |
81 |
29 |
46 |
16 |
44 |
39 |
71 |
26 |
58 |
66 |
29 |
16 |
79 |
32 |
43 |
69 |
79 |
56 |
46 |
34 |
63 |
27 |
19 |
59 |
53 |
45 |
55 |
28 |
48 |
58 |
74 |
59 |
24 |
55 |
77 |
56 |
47 |
35 |
29 |
40 |
43 |
58 |
25 |
37 |
49 |
45 |
51 |
66 |
17 |
33 |
Решение:
1. Определяются наибольшее Xmax и наименьшее Xmin значения из всех полученных данных и вычисляется размах R:
R =Xmax - Xmin=81-13=68
Размах характеризует разброс контролируемой величины, он определяет ширину гистограммы.
2.Обрабатываем данные, разбив их на диапазоны с границами 13-17, 18-22 и т.д. (табл.2). По полученным данным строится гистограмма - столбчатая диаграмма, высота столбиков которой соответствует частоте (рис.1).
Таблица 2 – Диапазоны значений
Номер интервала, j |
Диапазон |
Частота mj |
|
Xi min |
Xi max |
||
1. |
13 |
17 |
6 |
2. |
18 |
22 |
1 |
3. |
23 |
27 |
7 |
4. |
28 |
32 |
8 |
5. |
33 |
37 |
6 |
6. |
38 |
42 |
2 |
7. |
43 |
47 |
10 |
8. |
48 |
52 |
4 |
9. |
53 |
57 |
6 |
10. |
58 |
62 |
6 |
11. |
63 |
67 |
5 |
12. |
68 |
72 |
5 |
13. |
73 |
77 |
3 |
14. |
78 |
82 |
3 |
3. Полезную информацию о возможном характере распределения можно получить, взглянув на рис.2 (а-ж). Формы, представленные на этом рисунке, типичны, и ими можно воспользоваться как образцами при анализе гистограмм.
Рис. 1 Гистограмма
а) Обычный тип (симметричный). Гистограмма с таким распределением встречается чаще всего. Она указывает на стабильность процесса. |
|
б) Гребенка (мультимодальный тип). Здесь классы через один имеют более низкие частоты. Такая форма встречается, когда число единичных наблюдений, попадающих в класс, колеблется от класса к классу или, когда действует определенное правило округления данных. |
|
в) Положительно (отрицательно) скошенное распределение. Среднее значение гистограммы локализуется слева (справа) от центра размаха. Частоты довольно резко спадают при движении влево (вправо) и, наоборот, медленно вправо (влево). Такая (асимметричная) форма встречается, когда невозможно получить значения ниже определенного, например для диаметра деталей и т.д. |
|
г) Распределение с обрывом слева (справа). Это одна из тех форм, которые часто встречаются при 100%-ном контроле изделий из-за плохой воспроизводимости процесса, а также когда, например, отобраны и исключены из партии все изделия с параметрами ниже контрольного нормативы (или выше, или и те и другие). |
|
д) Плато (равномерное и прямоугольное распределение). Такая гистограмма получается в случаях, когда объединяются несколько распределений, в которых средние значения имеют небольшую разницу между собой. Анализ такой гистограммы целесообразно проводить, используя метод расслоения. |
|
е) Двухпиковый тип (бимодальный тип). Такая форма встречается, когда смешиваются два распределения с далеко отстоящими средними значениями, например, в случае наличия разницы между двумя видами материалов, двумя операторами и т.д. В этом случае можно провести расслоение по двум видам фактора, исследовать причины различия и принять соответствующие меры для его устранения. |
|
ж) Распределение с изолированным пиком. Рядом с распределением обычного типа появляется маленький изолированный пик. Это форма появляется при наличии малых включений данных из другого распределения, появления ошибки измерения или просто включения данных из другого процесса. |
Рис. 2 Формы гистограмм
По результатам анализа гистограммы можно сделать вывод, что в нашем случае получился двухтипный тип (бимодальный тип). Такая форма встречается, когда смешиваются два распределения с далеко отстоящими средними значениями. Анализ такой гистограммы целесообразно проводить, используя метод расслоения по причинам возникновения травм у разных возрастных групп.
В качестве характеристик, получаемых в результате измерений значений исследуемого параметра, используют числовые характеристики, которые называются статистическими мерами (см. рис. 3). Статистические меры служат для описания и сравнения получаемых эмпирических распределений. Важнейшей и чаще всего применяемой на практике статистической характеристикой является мера положения, которая определяет положение центра группирования исследуемого параметра на числовой оси. Мера положения определяется средним значением параметра, описывающим одним числом результаты некоторого ряда измерений. Для статистических исследований на практике используют следующие средние значения: среднее арифметическое, медиана, мода и среднее геометрическое. Параметр, характеризующий ширину распределения исследуемого признака на числовой оси, называется мерой рассеяния. К мерам рассеяния эмпирического распределения относятся размах, дисперсия и среднеквадратическое отклонение. |
Рис. 3. Классификация статистических мер
4. Среднее арифметическое или математическое ожидание рассчитывается по формуле
где n- количество случайных величин
n= 6·12=72 (6-количество столбцов, 12- количество строк),
Xi – значения случайных величин (см табл.3).
Таблица 3 - Расчет суммы значений случайных величин
|
1. |
2. |
3. |
4. |
5. |
6. |
1. |
13 |
14 |
15 |
16 |
16 |
17 |
2. |
19 |
24 |
25 |
25 |
26 |
26 |
3. |
27 |
27 |
28 |
28 |
29 |
29 |
4. |
29 |
32 |
32 |
32 |
33 |
34 |
5. |
35 |
36 |
37 |
37 |
39 |
40 |
6. |
43 |
43 |
44 |
45 |
45 |
45 |
7. |
46 |
46 |
47 |
47 |
48 |
48 |
8. |
49 |
51 |
53 |
55 |
55 |
55 |
9. |
56 |
56 |
58 |
58 |
58 |
58 |
10. |
59 |
59 |
63 |
63 |
64 |
66 |
11. |
66 |
69 |
69 |
71 |
71 |
71 |
12. |
74 |
75 |
77 |
79 |
79 |
81 |
Сумма |
516 |
532 |
548 |
556 |
563 |
570 |
Общая сумма |
3285 |
5. Медиана - серединное значение.
Важной характеристикой эмпирического распределения для ряда измерений исследуемого параметра является медиана или срединное значение. Если имеется ряд измерений объемом n, то для вычисления медианы необходимо все значения результатов измерений расположить в порядке возрастания или убывания. Если число результатов измерений будет нечетным числом (n=2k+l), то медианой будет член упорядоченного ряда под номером: k+1, При четном числе результатов измерений (n=2k) медианой будет полусумма двух членов упорядоченного ряда под номерами k и k+1:
|
Таблица 4 - Нахождение медианы и моды
n i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
31 |
32 |
33 |
34 |
35 |
36 |
Х i |
13 |
14 |
15 |
16 |
16 |
17 |
19 |
24 |
25 |
25 |
26 |
26 |
27 |
27 |
28 |
28 |
29 |
29 |
29 |
32 |
32 |
32 |
33 |
34 |
35 |
36 |
37 |
37 |
39 |
40 |
43 |
43 |
44 |
45 |
45 |
45 |
|
|
|||||||||||||||||||||||||||||||||||
mj |
||||||||||||||||||||||||||||||||||||
n i |
37 |
38 |
39 |
40 |
41 |
42 |
43 |
44 |
45 |
46 |
47 |
48 |
49 |
50 |
51 |
52 |
53 |
54 |
55 |
56 |
57 |
58 |
59 |
60 |
61 |
62 |
63 |
64 |
65 |
66 |
67 |
68 |
69 |
70 |
71 |
72 |
Х i |
46 |
46 |
47 |
47 |
48 |
48 |
49 |
51 |
53 |
55 |
55 |
55 |
56 |
56 |
58 |
58 |
58 |
58 |
59 |
59 |
63 |
63 |
64 |
66 |
66 |
69 |
69 |
71 |
71 |
71 |
74 |
75 |
77 |
79 |
79 |
81 |
|
|
|||||||||||||||||||||||||||||||||||
mj |
В данном случае n= 6·12=72 – чётное число результатов наблюдений. При четном числе результатов измерений (n=2k) медианой будет полусумма двух членов упорядоченного ряда под номерами k и k+1:
где k= 72/2=36, а k+1=36+1=37 , соответственно Xk= X36=45, а Xk+1= X37=46 и
6. Мода М0 . это наиболее часто встречающееся значение случайной величины. Возможно, что среди полученных значений имеется не одна, а две или более мод. Такое распределение называют двумодальным или полимодальным. Возможно, что распределение не имеет моды, это равномерное распределение. По таблице 4 находим наиболее часто встречающееся значение дискретной случайной величины. М0=29, М0=32, М0=45, М0=55, М0=71, М0=55. Распределение полимодальное.
7. Дисперсия среднее значение квадратов отклонений
Среднеквадратическое отклонение - квадратный корень из дисперсии.