Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СМК Л5.Анализ данных.doc
Скачиваний:
1
Добавлен:
31.08.2019
Размер:
257.54 Кб
Скачать

Шкала порядка, шкала интервалов.

В этом случае обычно данные пред­ставляют в сгруппированном виде, так как иначе об­разуется очень много классов. Например, мы иссле­дуем возрастной состав той же группы из тридцати человек. Если она не однородна в этом отношении, данные окажутся «размазанными». Тогда мы их группируем, выбирая определенный шаг (обычно десять лет), и вносим в таблицу обобщен­ные данные. Шаг выбирается с учетом характера данных и задач анализа. Отметим, что группировка данных приводит к потере части информации. Но зато мы добиваемся ее лучшей обозримости. Таб­лица распределения, которая в результате получится, может выгля­деть так:

Таблица 2. Данные о возрастном составе группы авторов

Возрастная группа

Частоты

%

Накопленные частоты

Накопленные %

20-29

12

40,0

12

40,0

30-39

8

26,7

20

66,7

40-49

5

16,7

25

83,4

50-59

3

10,0

28

93,4

60-69

2

6,7

30

100,1

Всего

30

100,1

30

100,1

В первом столбце представлены возрастные интер­валы. Обратим внимание, что они не пересекаются, то есть мы берем интервалы 20 — 29, 30 — 39, а не 20 — 30, 30 — 40. Иначе неясно будет, куда относить ин­дивидов, попадающих на стык возрастных групп. Во втором и третьем столбцах представлены соответ­ственно частоты и проценты. Глядя на них, мы видим, что возрастной состав группы неоднородный: в ней преобладают молодые люди, а люди старших возрас­тов встречаются реже.

В четвертом и пятом столбцах частоты и проценты представлены в несколько иной форме, которая при­менима для упорядоченных категорий (шкал порядка или отношений). Частоты и проценты суммируются по всем предыдущим категориям. При такой форме представления данных хорошо видно, сколько человек или какая доля выборки находятся ниже (или выше) опре­деленного уровня. В нашем примере 25 человек из 30, или 83,4 %, моложе пятидесяти лет.

2) Данные о распределении переменной пред­ставляем в форме гра­фиков. Рассмотрим четыре типа графиков, которые чаще всего используются в случае одномерного распределения.

Для шкал наименований обычно применяют столбиковые диаграммы. Число столбиков соответствует числу категорий. Высота каждого стол­бика отражает частоту встречаемости данной катего­рии. Все столбики рисуются одинаковой ширины и не соприкасаются друг с другом. Порядок их расположе­ния на горизонтальной оси может быть любым. Для представления долей и процентов удобны круго­вые диаграммы. Весь круг соответствует единице или ста процентам, а величина каждого сектора отражает представительство соответствующей категории.

Рис. 1. Столбиковая диа- Рис. 2. Круговая диаграмма

грамма (Данные из Табл.1) (Данные из Табл. 1)

Для наглядного представления измеренных данных шкал равных интервалов используются так называ­емые гистограммы и полигоны. Гистограмма похожа на столбиковую диаграмму, только на горизонтальной оси в этом случае указываются границы интервалов. Столбики примыкают друг к другу. Высота столбика соответствует наблюдаемой частоте. Гистограмму лег­ко преобразовать в полигон. Для этого середины вер­шин каждого столбца соединяются между собой прямыми отрезками. Получается ломаная линия, повторя­ющая контур, образуемый столбиками. Гистограмма удобна для изображения особенностей одного распре­деления. Преимущество полигона заключается в том, что на одном графике можно представить несколько полигонов и затем сравнивать между собой разные выборки.

Возрастные группы Возрастные группы

Рис. 3. Гистограмма Рис. 4. Полигон