Кол. методы МБА 2012 / 1. Статистика / Книга по стат. методам / Книга
.pdfнаправо от интервала с максимальной частотой к интервалу с минимальным значением частоты. Для вывода такого графика необходимо дополнительно установить флажок у надписи «Парето (отсортированная гистограмма)».
При установке флажка у надписи «Интегральный процент» будет выведен график так называемой накопленной частоты. Содержательный смысл интегральной кривой состоит в том, что для каждого значения Y она показывает процент выборочных данных, принявших значение, меньшее, чем Y . Этот график выводится только совместно либо с гистограммой, либо с отсортированной гистограммой Парето.
Пример 2.2. Решение задачи группировки данных и построения гистограммы ряда распределения в Excel.
Информация, собранная владельцем магазина бытовой техники о дневных продажах холодильников за 7 недель (50 дней), приведена в таблице 2.5.
|
|
|
|
Таблица 2.5. |
|
|
|
|
|
25 |
29 |
18 |
27 |
21 |
21 |
22 |
27 |
23 |
34 |
24 |
26 |
20 |
23 |
22 |
20 |
21 |
17 |
28 |
31 |
19 |
23 |
22 |
21 |
28 |
29 |
18 |
19 |
30 |
22 |
25 |
28 |
21 |
25 |
23 |
24 |
25 |
23 |
16 |
25 |
20 |
24 |
23 |
32 |
23 |
25 |
26 |
25 |
23 |
28 |
Требуется
На основе имеющихся статистических данных
•Установить наиболее вероятные объемы дневных продаж и диапазон их возможных изменений.
•Оценить шансы того, что в течение дня будет продаваться не менее 25 холодильников.
Решение
Прежде всего, необходимо ввести имеющиеся данные в Excel и записать их в один столбец – рис. 2.10.
31
Для нахождения максимального и минимального значений выборочных данных удобно использовать стандартные функции
Excel – пункт меню Вставка ¾ Функция ¾ Категория Стати-
стические ¾ МАКС (…), МИН(…). Соответствующие формулы записаны в ячейках С48 и С49 на рабочем листе Excel – рис. 2.10.
Рис. 2.10.
В рассматриваемом примере максимальное число продаваемых холодильников по данным пятидесятидневной выборки составило 34, минимальное – 16 (рис. 2.10).
Диапазон изменения дневных объемов продаж от 16 до 34 на 7 интервалов (карманов) с шагом (шириной каждого интервала), равным трем и будем рассматривать следующие промежутки (объемы продаж) – до 16; от 16 до 19; от 19 до 22;...; от 31 до 34. Следует иметь в виду, что наблюдения, совпадающие с правой границей какого-либо интервала, Excel считает принадлежащими данному интервалу.
32
Значения границ интервалов 16; 19; 22; ...; 34 следует предварительно ввести в какие-либо ячейки рабочего листа, например, в
K2-K8 – рис. 2.11.
Рис. 2.11.
Для подсчета частот – количества данных выборки, попавших в тот или иной «карман» и графического представления ряда распределения необходимо вызвать инструмент «Гистограмма» из «Пакета анализа»: пункт меню Сервис ¾ Анализ данных ... ¾ Гистограмма. Ввод информации для решения рассматриваемой задачи показан на рис. 2.12.
Рис. 2.12.
33
После ввода информации и нажатии клавиши ОК в ячейках L1:M8 появится таблица (рис. 2.11) и на рабочий лист будет выведена гистограмма ряда распределения (рис. 2.13).
|
|
|
|
Гистограмма |
|
|||
Частота |
20 |
|
|
|
|
|
|
|
15 |
|
|
|
|
|
|
Частота |
|
|
10 |
|
|
|
|
|
|
|
|
5 |
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
16 |
19 |
22 |
25 |
28 |
31 |
34 |
Еще |
|
|
|
|
Карман |
|
|
|
|
|
|
|
|
Рис. 2.13. |
|
|
Инструмент «Гистограмма» подсчитывает только частоты – число наблюдений, попавших в тот или иной карман.
Для вычисления относительных частот (доли наблюдений в процентах) результирующую таблицу необходимо расширить, т.е. дополнить столбцом и ввести в нем соответствующие расчетные формулы (ячейки N2:N8 – рис. 2.11). На основе этих данных можно построить гистограмму относительных частот – рис. 2.13. Для этого используют пункт меню Вставка ¾ Диаграмма… ¾ Гистограмма. Во многих реальных задачах бизнеса гистограммы относительных частот являются более полезными и информативными, позволяющими, в частности, получить оценки вероятностей тех или иных событий.
Относительна частота
40% |
|
36% |
|
|
|
|
|||
|
|
|
|
|
|||||
|
|
|
|
|
|
||||
35% |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
30% |
|
24% |
|
|
|
|
|
||
|
|
|
|
|
|
||||
25% |
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
20% |
|
|
|
|
|
16% |
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
||
15% |
|
10% |
|
|
|
|
8% |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
||||
10% |
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
4% |
||
|
|
|
|
|
|
|
|||
5% |
|
2% |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
||
0% |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
до 16 16 - 19 19 - 22 22 - 25 25 - 28 28 - 31 более |
||||||||
|
|
||||||||
|
|
|
Объемы продаж холодильников |
31 |
|||||
|
|
|
|
|
Рис. 2.14.
34
Оценить, например, шансы того, что будет продано не менее 22 холодильников на основе гистограммы – рис. 2.13 не удастся. В то же время на основе гистограммы – рис. 2.14, эти оценки сделать достаточно просто. Так, частота продаж более 22 холодильников составляет 36%+16%+8%+4% = 64%, а наиболее вероятные объемы дневных продаж находятся в диапазоне от 22 до 25 холодильников – такое количество продается в 36% всех торговых дней.
Необходимо отметить, что гистограммы, выводимые Excel «по умолчанию» – рис. 2.13, как правило, требуют дополнительного редактирования и приведения к виду, удобному для анализа и «прочтения». Это можно сделать, выделив любой элемент диаграммы левой кнопкой мыши, с последующим вызовом контекстного меню правой кнопкой мыши и выбором соответствующей операции по преобразованию выделенного элемента (размеры, заливка, шрифт, подписи, заголовки и многое другое).
2.4. Области применения метода группировки данных
Группировать данные можно не только по количественному признаку (ценовым диапазонам, размеру ставок арендной платы, объему продаж, размеру выручки и т.д.). В качестве основы для группировки можно также использовать любые качественные и иные признаки, такие, например, как группы товаров, размеры одежды, классы офисов, месяцы в году, дни недели, пол сотрудников и многое другое. Это возможно в тех случаях, когда выборка содержит не только одномерный массив значений исследуемой величины, но и привязанные к этим данным значения соответствующего признака.
Пример. 2.3. Определение оптимальной структуры заказа для партии обуви.
Менеджеру по торговле одного из обувных магазинов дано поручение заказать и приобрести партию мужской обуви определенной модели в количестве 1000 пар. Информация, имеющаяся для принятия решения – данные о продажах за последние три месяца – табл. 2.6.
35
|
|
|
|
Таблица 2.6. |
|
|
|
|
|
|
|
Размер обуви |
|
Количество проданных пар |
|||
декабрь |
|
январь |
февраль |
|
|
|
|
|
|||
|
|
|
|
|
|
39 |
129 |
|
256 |
78 |
|
40 |
214 |
|
425 |
325 |
|
41 |
589 |
|
796 |
492 |
|
42 |
701 |
|
1012 |
965 |
|
43 |
451 |
|
730 |
531 |
|
44 |
234 |
|
453 |
233 |
|
45 |
98 |
|
162 |
136 |
|
Критерий выбора оптимальной структуры – по возможности полная реализация обуви всех размеров из закупленной партии в течение последующих трех месяцев.
Какова должна быть структура заказа, а именно: сколько пар каждого размера (от 39-го до 45-го) менеджер должен заказать и почему?
Решение
В данном примере данные, вообще говоря, уже сгруппированы. Признак, по которому произведена группировка – размер обуви. Однако переход к относительным частотам и построение гистограммы позволяет расширить возможности анализа. Для этого создаем в Excel расчетную таблицу и на основе имеющихся данных вычисляем доли (относительные частоты) продаж каждого размера. Результаты вычислений показаны в табл. 2.7. Характер распределения доли продаж в зависимости от размера обуви иллюстрирует гистограмма – рис. 2.15.
|
|
|
|
|
Таблица 2.7. |
|
|
|
|
|
|
|
|
Размер |
Количество проданных пар обуви |
Доля в об- |
||||
|
|
|
|
щем объеме |
||
обуви |
Декабрь |
Январь |
Февраль |
Всего |
||
продаж |
||||||
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
39 |
129 |
256 |
78 |
463 |
5,14% |
|
40 |
214 |
425 |
325 |
964 |
10,70% |
|
41 |
589 |
796 |
492 |
1877 |
20,83% |
|
42 |
701 |
1012 |
965 |
2678 |
29,72% |
|
43 |
451 |
730 |
531 |
1712 |
19,00% |
|
44 |
234 |
453 |
233 |
920 |
10,21% |
|
45 |
98 |
162 |
136 |
396 |
4,40% |
|
|
|
|
ИТОГО |
9 010 |
|
36
Доля продаж
Гистограмма распределения объемов продаж в зависимости от размера обуви
35% |
|
|
|
|
|
|
|
|
|
|
|
|
30% |
|
|
|
|
30% |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
25% |
|
|
|
|
|
|
|
|
|
|
|
21% |
|
19% |
|
|
|
20% |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
15% |
|
|
|
|
|
|
|
|
|
|
11% |
|
|
|
10% |
|
|
10% |
|
|
|
|
|
|
||
|
5% |
|
|
|
|
|
4% |
|
|
|
|
|
|
|
|
||
5% |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0% |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
39 |
40 |
41 |
42 |
43 |
44 |
45 |
Размер обуви
Рис. 2.15.
Анализируя гистограмму и результаты группировки выборочных данных можно сделать следующие выводы.
Количество пар обуви 39–го размера в закупаемой партии должно составлять 5,1%, т.е. (1000 х 5,1)/100 = 51 пару. Обуви 40 размера 10,7%, т.е. 107 пар. Аналогично определяется структура заказа и по другим размерам 41 размер – 208 пар; 42 размер – 298 пар; 43 размер – 190 пар; 44 размер – 102 пары; 45 размер – 44 пары.
Во многих ситуациях, связанных с обработкой данных, содержащих, например, разнородные объекты, метод группировки позволяет «структурировать» выборку с выяснением вопроса о том, насколько она репрезентативна с той или иной точки зрения.
Пример 2.4. Менеджер, занимающийся в риэлтерской фирме маркетинговыми исследованиями, решил выявить закономерности и особенности, присущие вторичному рынку однокомнатных квартир в одном из районов г. Москвы. Для этого он отобрал из базы данных 36 предложений о квартирах, выставленных на продажу этом в районе – табл. 2.8.
37
|
|
|
|
Таблица 2.8. |
|
|
|
|
|
|
|
Стоимость |
Общая |
Размер |
Размер |
Стоимость |
|
квартиры |
площадь |
комнаты |
кухни |
1 кв. м жилья |
|
(долл) |
(кв. м) |
(кв. м) |
(кв. м) |
(долл / кв.м) |
|
105 600 |
40 |
20 |
11 |
2 640 |
|
114 374 |
41 |
21 |
10 |
2 790 |
|
118 811 |
35 |
20 |
10 |
3 395 |
|
120 978 |
39 |
20 |
11 |
3 102 |
|
129 815 |
39 |
21 |
8,7 |
3 329 |
|
129 809 |
36 |
19 |
8 |
3 606 |
|
129 833 |
37 |
22 |
9 |
3 509 |
|
129 815 |
39 |
21 |
8,7 |
3 329 |
|
129 809 |
36 |
19 |
8 |
3 606 |
|
129 815 |
39 |
21 |
8,7 |
3 329 |
|
129 822 |
35 |
18 |
7 |
3 709 |
|
131 967 |
45 |
39 |
6 |
2 933 |
|
131 960 |
39 |
19 |
8,7 |
3 384 |
|
132 026 |
36 |
20 |
9,6 |
3 667 |
|
134 237 |
43 |
21 |
8,6 |
3 122 |
|
134 178 |
38 |
20 |
11 |
3 531 |
|
136 426 |
37 |
20 |
8,5 |
3 687 |
|
136 435 |
38 |
20 |
8 |
3 590 |
|
136 426 |
37 |
23 |
8,2 |
3 687 |
|
136 367 |
35 |
20 |
9,6 |
3 896 |
|
136 435 |
38 |
23 |
7,5 |
3 590 |
|
136 422 |
39 |
19 |
7,8 |
3 498 |
|
136 435 |
38 |
18 |
10,5 |
3 590 |
|
136 435 |
38 |
19 |
8,7 |
3 590 |
|
139 709 |
42 |
22 |
8,5 |
3 326 |
|
143 035 |
42 |
23 |
10 |
3 406 |
|
143 029 |
39 |
19 |
8,5 |
3 667 |
|
145 222 |
41 |
21 |
8 |
3 542 |
|
145 222 |
41 |
21 |
8,5 |
3 542 |
|
147 378 |
55 |
32 |
10 |
2 680 |
|
147 400 |
40 |
18 |
9,5 |
3 685 |
|
147 378 |
42 |
20 |
8,5 |
3 509 |
|
151 800 |
40 |
19 |
8,6 |
3 795 |
|
154 044 |
45 |
28 |
6,3 |
3 423 |
|
156 237 |
47 |
27 |
7 |
3 324 |
|
158 378 |
46 |
31 |
7 |
3 443 |
|
Решение
Группируя данные по различным признакам (столбцам таблицы 2.8) с использованием инструментов «Гистограмма» из пакета
38
анализа Excel и «Мастера диаграмм», получаем следующие распределения (рис. 2.16–2.20), отражающие основные особенности вторичного рынка однокомнатных квартир.
Гистограмма – рис. 2.16 показывает, что наибольшее число предложений находится в ценовом сегменте от 130 до 140 тысяч долларов (почти 40% предложений). А шансы найти на вторичном рынке квартиру дешевле, чем 120 тысяч долларов относительно невелики – только 8% из общего числа предложений. С ценовой точки зрения выборка свидетельствует о том, что вторичный рынок в основном предлагает однокомнатные квартиры стоимостью от 120 до 150 тысяч долларов (примерно 90% всех предложений – рис. 2.16).
Распределение предложений в зависимости от стоимости квартир
40% |
|
|
|
|
|
|
|
38% |
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
30% |
|
|
|
|
22% |
|
|
|
19% |
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||
20% |
|
|
|
8% |
|
|
|
|
|
|
11% |
|
|||||
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
||||||||
10% |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0% |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
До 120 |
120-130 |
130-140 |
140-150 |
150-160 |
|
|||||||||
|
|
|
|
|
Стоимость квартиры (тыс. $)
Рис. 2.16
Гистограмма 2.17, построенная на основе группировки данных по признаку «общая площадь», характеризует рынок с другой стороны. В частности, видно, что в наибольшей степени на нем представлены однокомнатные квартиры площадью от 35 до 41 квадратного метра.
Если сгруппировать данные по признаку «стоимость одного квадратного метра жилья» – рис. 2.18, то становится очевидным, что в основном на рынке предлагаются квартиры по цене от 3200 до 3800 долларов США за квадратный метр (почти 80% предложений). В то же время, сегмент, относительного «недорогого» жилья по цене менее, чем 3 000 долларов за квадратный метр, также представлен на рынке и его доля, по данным выборки, составляет около 11%.
39
Распределение квартир на вторичном рынке по размеру общей площади
40% |
|
|
|
|
30% |
35% |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
30% |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
20% |
|
|
|
8% |
|
|
|
|
|
|
11% |
|
|
|
11% |
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
10% |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3% |
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
0% |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
До 35 |
35-38 |
38-41 |
41-44 |
|
|
|
44-47 Более 47 |
|||||||||||
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
Общая площадь квартиры (кв.м) |
|
|
|
|
|
Рис. 2.17
Распределение предложений по стоимости 1 кв.м жилья
40% |
|
|
|
|
|
|
35% |
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
30% |
|
|
|
|
|
|
19% |
|
|
|
24% |
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
20% |
|
|
8% |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
10% |
|
|
3% |
5% |
|
|
|
|
|
|
|
|
|
3% |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
||||||||||||||||||
0% |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
До 2,8 2,8-3,0 |
|
|
3,0-3,2 3,2-3,4 3,4-3,6 3,6-3,8 Более |
|
||||||||||||||||
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
Стоимость 1 кв. м (тыс. $) |
3,8 |
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис. 2.18.
При необходимости проанализировать рынок с точки зрения предложения квартир с различными размерами комнат или кухонь, имеющиеся данные (табл. 2.8) следует сгруппировать на основе уже этих признаков и построить для них соответствующие гистограммы – рис. 2.19, 2.20. В частности, видно, что основная доля предложений, это квартиры с комнатами от 18 до 22 квадратных метров и с кухнями размером от 7,5 до 9 квадратных метров.
40