Скачиваний:
114
Добавлен:
08.04.2015
Размер:
3.32 Mб
Скачать

направо от интервала с максимальной частотой к интервалу с минимальным значением частоты. Для вывода такого графика необходимо дополнительно установить флажок у надписи «Парето (отсортированная гистограмма)».

При установке флажка у надписи «Интегральный процент» будет выведен график так называемой накопленной частоты. Содержательный смысл интегральной кривой состоит в том, что для каждого значения Y она показывает процент выборочных данных, принявших значение, меньшее, чем Y . Этот график выводится только совместно либо с гистограммой, либо с отсортированной гистограммой Парето.

Пример 2.2. Решение задачи группировки данных и построения гистограммы ряда распределения в Excel.

Информация, собранная владельцем магазина бытовой техники о дневных продажах холодильников за 7 недель (50 дней), приведена в таблице 2.5.

 

 

 

 

Таблица 2.5.

 

 

 

 

 

25

29

18

27

21

21

22

27

23

34

24

26

20

23

22

20

21

17

28

31

19

23

22

21

28

29

18

19

30

22

25

28

21

25

23

24

25

23

16

25

20

24

23

32

23

25

26

25

23

28

Требуется

На основе имеющихся статистических данных

Установить наиболее вероятные объемы дневных продаж и диапазон их возможных изменений.

Оценить шансы того, что в течение дня будет продаваться не менее 25 холодильников.

Решение

Прежде всего, необходимо ввести имеющиеся данные в Excel и записать их в один столбец – рис. 2.10.

31

Для нахождения максимального и минимального значений выборочных данных удобно использовать стандартные функции

Excel – пункт меню Вставка ¾ Функция ¾ Категория Стати-

стические ¾ МАКС (…), МИН(…). Соответствующие формулы записаны в ячейках С48 и С49 на рабочем листе Excel – рис. 2.10.

Рис. 2.10.

В рассматриваемом примере максимальное число продаваемых холодильников по данным пятидесятидневной выборки составило 34, минимальное – 16 (рис. 2.10).

Диапазон изменения дневных объемов продаж от 16 до 34 на 7 интервалов (карманов) с шагом (шириной каждого интервала), равным трем и будем рассматривать следующие промежутки (объемы продаж) – до 16; от 16 до 19; от 19 до 22;...; от 31 до 34. Следует иметь в виду, что наблюдения, совпадающие с правой границей какого-либо интервала, Excel считает принадлежащими данному интервалу.

32

Значения границ интервалов 16; 19; 22; ...; 34 следует предварительно ввести в какие-либо ячейки рабочего листа, например, в

K2-K8 – рис. 2.11.

Рис. 2.11.

Для подсчета частот – количества данных выборки, попавших в тот или иной «карман» и графического представления ряда распределения необходимо вызвать инструмент «Гистограмма» из «Пакета анализа»: пункт меню Сервис ¾ Анализ данных ... ¾ Гистограмма. Ввод информации для решения рассматриваемой задачи показан на рис. 2.12.

Рис. 2.12.

33

После ввода информации и нажатии клавиши ОК в ячейках L1:M8 появится таблица (рис. 2.11) и на рабочий лист будет выведена гистограмма ряда распределения (рис. 2.13).

 

 

 

 

Гистограмма

 

Частота

20

 

 

 

 

 

 

 

15

 

 

 

 

 

 

Частота

 

10

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

16

19

22

25

28

31

34

Еще

 

 

 

 

Карман

 

 

 

 

 

 

 

Рис. 2.13.

 

 

Инструмент «Гистограмма» подсчитывает только частоты – число наблюдений, попавших в тот или иной карман.

Для вычисления относительных частот (доли наблюдений в процентах) результирующую таблицу необходимо расширить, т.е. дополнить столбцом и ввести в нем соответствующие расчетные формулы (ячейки N2:N8 – рис. 2.11). На основе этих данных можно построить гистограмму относительных частот – рис. 2.13. Для этого используют пункт меню Вставка ¾ Диаграмма… ¾ Гистограмма. Во многих реальных задачах бизнеса гистограммы относительных частот являются более полезными и информативными, позволяющими, в частности, получить оценки вероятностей тех или иных событий.

Относительна частота

40%

 

36%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

35%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

30%

 

24%

 

 

 

 

 

 

 

 

 

 

 

25%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20%

 

 

 

 

 

16%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15%

 

10%

 

 

 

 

8%

 

 

 

 

 

 

 

 

 

 

 

 

 

10%

 

 

 

 

 

 

 

 

 

 

 

 

 

4%

 

 

 

 

 

 

 

5%

 

2%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

до 16 16 - 19 19 - 22 22 - 25 25 - 28 28 - 31 более

 

 

 

 

 

Объемы продаж холодильников

31

 

 

 

 

 

Рис. 2.14.

34

Оценить, например, шансы того, что будет продано не менее 22 холодильников на основе гистограммы – рис. 2.13 не удастся. В то же время на основе гистограммы – рис. 2.14, эти оценки сделать достаточно просто. Так, частота продаж более 22 холодильников составляет 36%+16%+8%+4% = 64%, а наиболее вероятные объемы дневных продаж находятся в диапазоне от 22 до 25 холодильников – такое количество продается в 36% всех торговых дней.

Необходимо отметить, что гистограммы, выводимые Excel «по умолчанию» – рис. 2.13, как правило, требуют дополнительного редактирования и приведения к виду, удобному для анализа и «прочтения». Это можно сделать, выделив любой элемент диаграммы левой кнопкой мыши, с последующим вызовом контекстного меню правой кнопкой мыши и выбором соответствующей операции по преобразованию выделенного элемента (размеры, заливка, шрифт, подписи, заголовки и многое другое).

2.4. Области применения метода группировки данных

Группировать данные можно не только по количественному признаку (ценовым диапазонам, размеру ставок арендной платы, объему продаж, размеру выручки и т.д.). В качестве основы для группировки можно также использовать любые качественные и иные признаки, такие, например, как группы товаров, размеры одежды, классы офисов, месяцы в году, дни недели, пол сотрудников и многое другое. Это возможно в тех случаях, когда выборка содержит не только одномерный массив значений исследуемой величины, но и привязанные к этим данным значения соответствующего признака.

Пример. 2.3. Определение оптимальной структуры заказа для партии обуви.

Менеджеру по торговле одного из обувных магазинов дано поручение заказать и приобрести партию мужской обуви определенной модели в количестве 1000 пар. Информация, имеющаяся для принятия решения – данные о продажах за последние три месяца – табл. 2.6.

35

 

 

 

 

Таблица 2.6.

 

 

 

 

 

 

Размер обуви

 

Количество проданных пар

декабрь

 

январь

февраль

 

 

 

 

 

 

 

 

 

39

129

 

256

78

 

40

214

 

425

325

 

41

589

 

796

492

 

42

701

 

1012

965

 

43

451

 

730

531

 

44

234

 

453

233

 

45

98

 

162

136

 

Критерий выбора оптимальной структуры – по возможности полная реализация обуви всех размеров из закупленной партии в течение последующих трех месяцев.

Какова должна быть структура заказа, а именно: сколько пар каждого размера (от 39-го до 45-го) менеджер должен заказать и почему?

Решение

В данном примере данные, вообще говоря, уже сгруппированы. Признак, по которому произведена группировка – размер обуви. Однако переход к относительным частотам и построение гистограммы позволяет расширить возможности анализа. Для этого создаем в Excel расчетную таблицу и на основе имеющихся данных вычисляем доли (относительные частоты) продаж каждого размера. Результаты вычислений показаны в табл. 2.7. Характер распределения доли продаж в зависимости от размера обуви иллюстрирует гистограмма – рис. 2.15.

 

 

 

 

 

Таблица 2.7.

 

 

 

 

 

 

Размер

Количество проданных пар обуви

Доля в об-

 

 

 

 

щем объеме

обуви

Декабрь

Январь

Февраль

Всего

продаж

 

 

 

 

 

 

 

 

 

 

 

 

 

39

129

256

78

463

5,14%

40

214

425

325

964

10,70%

41

589

796

492

1877

20,83%

42

701

1012

965

2678

29,72%

43

451

730

531

1712

19,00%

44

234

453

233

920

10,21%

45

98

162

136

396

4,40%

 

 

 

ИТОГО

9 010

 

36

Доля продаж

Гистограмма распределения объемов продаж в зависимости от размера обуви

35%

 

 

 

 

 

 

 

 

 

 

 

 

30%

 

 

 

30%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

25%

 

 

 

 

 

 

 

 

 

 

 

21%

 

19%

 

 

20%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15%

 

 

 

 

 

 

 

 

 

 

11%

 

 

 

10%

 

10%

 

 

 

 

 

 

 

5%

 

 

 

 

 

4%

 

 

 

 

 

 

 

5%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

39

40

41

42

43

44

45

Размер обуви

Рис. 2.15.

Анализируя гистограмму и результаты группировки выборочных данных можно сделать следующие выводы.

Количество пар обуви 39–го размера в закупаемой партии должно составлять 5,1%, т.е. (1000 х 5,1)/100 = 51 пару. Обуви 40 размера 10,7%, т.е. 107 пар. Аналогично определяется структура заказа и по другим размерам 41 размер – 208 пар; 42 размер – 298 пар; 43 размер – 190 пар; 44 размер – 102 пары; 45 размер – 44 пары.

Во многих ситуациях, связанных с обработкой данных, содержащих, например, разнородные объекты, метод группировки позволяет «структурировать» выборку с выяснением вопроса о том, насколько она репрезентативна с той или иной точки зрения.

Пример 2.4. Менеджер, занимающийся в риэлтерской фирме маркетинговыми исследованиями, решил выявить закономерности и особенности, присущие вторичному рынку однокомнатных квартир в одном из районов г. Москвы. Для этого он отобрал из базы данных 36 предложений о квартирах, выставленных на продажу этом в районе – табл. 2.8.

37

 

 

 

 

Таблица 2.8.

 

 

 

 

 

 

Стоимость

Общая

Размер

Размер

Стоимость

квартиры

площадь

комнаты

кухни

1 кв. м жилья

 

(долл)

(кв. м)

(кв. м)

(кв. м)

(долл / кв.м)

 

105 600

40

20

11

2 640

 

114 374

41

21

10

2 790

 

118 811

35

20

10

3 395

 

120 978

39

20

11

3 102

 

129 815

39

21

8,7

3 329

 

129 809

36

19

8

3 606

 

129 833

37

22

9

3 509

 

129 815

39

21

8,7

3 329

 

129 809

36

19

8

3 606

 

129 815

39

21

8,7

3 329

 

129 822

35

18

7

3 709

 

131 967

45

39

6

2 933

 

131 960

39

19

8,7

3 384

 

132 026

36

20

9,6

3 667

 

134 237

43

21

8,6

3 122

 

134 178

38

20

11

3 531

 

136 426

37

20

8,5

3 687

 

136 435

38

20

8

3 590

 

136 426

37

23

8,2

3 687

 

136 367

35

20

9,6

3 896

 

136 435

38

23

7,5

3 590

 

136 422

39

19

7,8

3 498

 

136 435

38

18

10,5

3 590

 

136 435

38

19

8,7

3 590

 

139 709

42

22

8,5

3 326

 

143 035

42

23

10

3 406

 

143 029

39

19

8,5

3 667

 

145 222

41

21

8

3 542

 

145 222

41

21

8,5

3 542

 

147 378

55

32

10

2 680

 

147 400

40

18

9,5

3 685

 

147 378

42

20

8,5

3 509

 

151 800

40

19

8,6

3 795

 

154 044

45

28

6,3

3 423

 

156 237

47

27

7

3 324

 

158 378

46

31

7

3 443

 

Решение

Группируя данные по различным признакам (столбцам таблицы 2.8) с использованием инструментов «Гистограмма» из пакета

38

анализа Excel и «Мастера диаграмм», получаем следующие распределения (рис. 2.16–2.20), отражающие основные особенности вторичного рынка однокомнатных квартир.

Гистограмма – рис. 2.16 показывает, что наибольшее число предложений находится в ценовом сегменте от 130 до 140 тысяч долларов (почти 40% предложений). А шансы найти на вторичном рынке квартиру дешевле, чем 120 тысяч долларов относительно невелики – только 8% из общего числа предложений. С ценовой точки зрения выборка свидетельствует о том, что вторичный рынок в основном предлагает однокомнатные квартиры стоимостью от 120 до 150 тысяч долларов (примерно 90% всех предложений – рис. 2.16).

Распределение предложений в зависимости от стоимости квартир

40%

 

 

 

 

 

 

 

38%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

30%

 

 

 

 

22%

 

 

 

19%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20%

 

 

 

8%

 

 

 

 

 

 

11%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

До 120

120-130

130-140

140-150

150-160

 

 

 

 

 

 

Стоимость квартиры (тыс. $)

Рис. 2.16

Гистограмма 2.17, построенная на основе группировки данных по признаку «общая площадь», характеризует рынок с другой стороны. В частности, видно, что в наибольшей степени на нем представлены однокомнатные квартиры площадью от 35 до 41 квадратного метра.

Если сгруппировать данные по признаку «стоимость одного квадратного метра жилья» – рис. 2.18, то становится очевидным, что в основном на рынке предлагаются квартиры по цене от 3200 до 3800 долларов США за квадратный метр (почти 80% предложений). В то же время, сегмент, относительного «недорогого» жилья по цене менее, чем 3 000 долларов за квадратный метр, также представлен на рынке и его доля, по данным выборки, составляет около 11%.

39

Распределение квартир на вторичном рынке по размеру общей площади

40%

 

 

 

 

30%

35%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

30%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20%

 

 

 

8%

 

 

 

 

 

 

11%

 

 

 

11%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

До 35

35-38

38-41

41-44

 

 

 

44-47 Более 47

 

 

 

 

 

 

 

 

 

 

 

 

Общая площадь квартиры (кв.м)

 

 

 

 

 

Рис. 2.17

Распределение предложений по стоимости 1 кв.м жилья

40%

 

 

 

 

 

 

35%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

30%

 

 

 

 

 

 

19%

 

 

 

24%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20%

 

 

8%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10%

 

 

3%

5%

 

 

 

 

 

 

 

 

 

3%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

До 2,8 2,8-3,0

 

 

3,0-3,2 3,2-3,4 3,4-3,6 3,6-3,8 Более

 

 

 

 

 

 

 

 

 

 

 

 

 

Стоимость 1 кв. м (тыс. $)

3,8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 2.18.

При необходимости проанализировать рынок с точки зрения предложения квартир с различными размерами комнат или кухонь, имеющиеся данные (табл. 2.8) следует сгруппировать на основе уже этих признаков и построить для них соответствующие гистограммы – рис. 2.19, 2.20. В частности, видно, что основная доля предложений, это квартиры с комнатами от 18 до 22 квадратных метров и с кухнями размером от 7,5 до 9 квадратных метров.

40