Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Гистограмма.docx
Скачиваний:
5
Добавлен:
05.08.2019
Размер:
304.87 Кб
Скачать

Гистогра́мма (от др.-греч. ἱστός — столб + γράμμα — черта, буква, написание) — способ графического представления табличных данных.

Количественные соотношения некоторого показателя представлены в виде прямоугольников, площади которых пропорциональны. Чаще всего для удобства восприятия ширину прямоугольников берут одинаковую, при этом их высота определяет соотношения отображаемого параметра.

Таким образом, гистограмма представляет собой графическое изображение зависимости частоты попадания элементов выборки от соответствующего интервала группировки

Гистограмму используют для изображения интервальных рядов. Для построения гистограммы по данным вариационного ряда с равными интервалами, как и для построения полигона, на оси абсцисс откладывают значения аргумента, а на оси ординат - значения частот или относительных частот. Далее строят прямоугольники, основаниями которых служат отрезки оси абсцисс, длины которых равны длинам интервалов, а высотами - отрезки, длины которых пропорциональны частотам или относительным частотам соответствующих интервалов.

В результате получают ступенчатую фигуру в виде сдвинутых друг к другу прямоугольников, площади которых пропорциональны частотам (или относительным частотам).

Если интервалы неравные, то на оси ординат следует откладывать в произвольно выбранном масштабе значения плотности распределения (абсолютной или относительной). Таким образом, высоты прямоугольников, которые мы строим, должны равняться плотностям соответствующих интервалов.

При графическом изображении вариационного ряда с помощью гистограммы плотность изображается так, как если бы она оставалась постоянной внутри каждого интервала. На самом деле, как правило, это не так. Если построить распределение по частям интервалов, то можно убедиться в том, что плотность распределения на различных участках интервала не остается постоянной. Плотность, полученная ранее, предствляла лишь некоторую среднюю плотность. Итак, гистограмма изображает не фактическое изменение плотности распределения, а лишь средние плотности распределения на каждом интервале.

Если построена гистограмма интервального распределения, то полигон того же распределения можно получить, если соединить прямолинейными отрезками середины верхних оснований прямоугольников --------________________________________

Описание

Гистограмма наглядно показывает распределение количественных данных. Она полезна для получения визуальной информации о процессе и помогает принять решение, на чем сосредоточить усилия по улучшению.

Эта информация отображается серией столбиков одинаковой ширины, но разной высоты. Так как ширина столбика представляет интервал в диапазоне наблюдений, столбики имеют одинаковую ширину. Высота столбика представляет количество исследований в рамках данного интервала. Поэтому высота пропорционально изменяется от столбика к столбику. При нормальных данных существует тенденция расположения многих результатов наблюдений к центру распределения (центральное значение) с постепенным уменьшением при движении от центра.

Критерии центрального значения включают:

Среднее значение — сумма всех измеренных и подсчитанных данных, деленная на общее количество экспериментальных точек.

Метод — группировка по наиболее общему значению или по интервалам.

Медиану — значение экспериментальной точки, которая имеет одинаковое количество точек выше и ниже нее, когда все экспериментальные точки располагаются в возрастающем или убывающем порядке. Если два значения попадают в середину (четное количество экспериментальных точек), то медиана является полусуммой этих срединных значений.

Процедура

1. Соберите данные; подсчитайте общее количество экспериментальных точек.

2. Расположите экспериментальные точки в порядке возрастания.

3. Определите размах полученных вами данных: вычтите наименьшую экспериментальную точку из наибольшей.

4. Определите количество столбиков в вашей гистограмме (от 6 до 12) и разделите размах (пункт 3) на количество столбиков, чтобы определить ширину каждой группировки интервала (столбика).

5. Расположите шкалу группировок интервалов по горизонтальной оси.

6. Расположите шкалу частот (количество или процент результатов наблюдений) по вертикальной оси.

7. Вычертите линию высоты каждого столбика с точкой на вертикальной оси, которая представляет количество экспериментальных точек, попадающих в пределы этого интервала. Помните, что ширина каждого столбика является одинаковой.

Ряды распределения

После определения группировочного признака, количества групп и интервалов группировки данные сводки и группировки представляются в виде рядов распределения и оформляются в виде статистических таблиц.

Ряд распределния является одним из видов группировок.

Ряд распределения — представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.

В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:

Атрибутивными — называют ряды распределения, построенные по качественными признакам.

Ряды распределения, построенные в порядке возрастания или убывания значений количественного признака называются вариационными.

Вариационный ряд распределения состоит из двух столбцов:

В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами и обозначаются . Дискретная варианта — выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд.

Во втором столбце содержится количество конкретных вариант, выраженное через частоты или частости:

Частоты — это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака, которые обозначают fi . Сумма всех частот равна должна быть равна численности единиц всей совокупности.

Частости ( wi) — это частоты выраженные в процентах к итогу. Сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.

Графическое изображение рядов распределения

Наглядно ряды распределения представляются при помощи графических изображений.

Ряды распределения изображаются в виде:Полигона-Гистограммы-Кумуляты-Огивы

ПолигонПри построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) — частоты или частости.Полигон на рис. 6.1 построен по данным микропереписи населения России в 1994 г.

Домохозяйства, состоящие из: одного человека двух человек трех человек 5 или более всего

Таблица/ Число домохозяйств в % 19,2 26,2 22,6 20,5 100,0

Условие: Приводятся данные о распределении 25 работников одного из предприятий по тарифным разрядам:

4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4

Задача: Построить дискретный вариационный ряд и изобразить его графически в виде полигона распределения.

Решение:

В данном примере вариантами является тарифный разряд работника. Для определения частот необходимо рассчитать число работников, имеющих соответствующий тарифный разряд.

тарифный

разряд Xi Число работников fi

1 3

2 5

3 4

4 6

5 3

6 4

Итого: 25

Полигон используется для дискретных вариационных рядов.

Для построения полигона распределения (рис 1) по оси абсцисс (X) откладываем количественные значения варьирующего признака — варианты, а по оси ординат — частоты или частости.

Если значения признака выражены в виде интервалов, то такой ряд называется интервальным.

Интервальные ряды распределения изображают графически в виде гистограммы, кумуляты или огивы.

Статистическая таблица

Условие: Приведены данные о размерах вкладов 20 физических лиц в одном банке (тыс.руб) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.

Задача: Построить интервальный вариационный ряд с равными интервалами.

Решение:

Исходная совокупность состоит из 20 единиц (N = 20).

По формуле Стерджесса определим необходимое количество используемых групп: n=1+3,322*lg20=5

Вычислим величину равного интервала: i=(152 — 2) /5 = 30 тыс.руб

Расчленим исходную совокупность на 5 групп с величиной интервала в 30 тыс.руб.

Результаты группировки представим в таблице:

Размер вкладов/

тыс.руб Xi /Число вкладов fi /Число вкладов в % к итогу Wi

2 — 32 11 55

32 — 62 4 20

62 — 92 2 10

92 — 122 1 5

122 — 152 2 10

Итого: 20 100

При такой записи непрерывного признака, когда одна и та же величина встречается дважды (как верхняя граница одного интервала и нижняя граница другого интервала), то эта величина относится к той группе, где эта величина выступает в роли верхней границы.