Скачиваний:
114
Добавлен:
08.04.2015
Размер:
3.32 Mб
Скачать

Какую полезную информацию несет собранный материал? Как обработать эти данные и установить существующие закономерности для того, чтобы в дальнейшем достаточно достоверно прогнозировать доходность? Как, например, используя эту статистику, оценить шансы того, что дневная выручка будет не ниже, чем 1300 тысяч рублей или не превысит 1570 тысяч рублей?

2. Менеджер, отвечающий в фирме за

 

Таблица 1.2.

рекламу, решил выяснить – насколько эф-

Объемы

 

 

 

Затраты

фективны затраты на рекламу и в какой

продаж

 

на рекламу

степени она влияет на объемы продаж. Для

Y

 

X

этого он собрал предысторию о рекламных

3420

 

3000

затратах фирмы и сопоставил их с достиг-

4200

3600

нутыми объемами продаж – количеством

 

 

5600

7200

проданных единиц техники (табл. 1.2). Как,

2900

3400

используя этот статистический материал,

...

...

оценить эффективность рекламных затрат?

 

 

6345

7500

Можно ли, используя имеющуюся информацию, получить расчетную прогнозную модель, связывающую за-

траты на рекламу (x) с объемами продаж (Y), для того, чтобы в дальнейшем можно было обоснованно рассчитывать и планировать рекламный бюджет?

3. Фирма, занимающаяся оценкой

 

 

Таблица 1.3.

бизнеса, получила заказ на подготовку

 

 

 

 

 

 

Аналоги (статистика)

заключения о стоимости складского

 

 

 

 

 

 

Аналоги

C

 

x1

x2

x3

помещения. Для получения расчетной

 

модели была собрана статистика по де-

 

 

 

 

 

1

16

22

2

4

сяти аналогичным складским помеще-

2

17

26

2

8

ниям (табл. 1.3).

3

26

45

3

7

Предварительный анализ показал,

4

24

37

4

0

5

22

28

4

2

что к числу ценообразующих факторов,

6

21

50

3

10

влияющих на стоимость одного квад-

7

32

56

6

8

ратного метра складского помещения C

8

18

34

3

8

(тыс. руб.), относятся:

9

30

60

5

2

число отдельных боксов x1;

 

 

 

 

 

10

20

40

3

6

количество погрузочно-разгру- зочных терминалов – x2;

удаленность от железнодорожных станций x3 (км).

11

Как, используя этот материал,

выявить (подтвердить) наличие или отсутствие взаимосвязи между перечисленными факторами и стоимостью склада?

построить на

основе имеющейся статистики модель

C = f (x1 , x2 , x3 )

для оценки стоимости склада, в зависи-

мости от его характеристик?

оценить точность расчетов по полученной модели?

определить стоимость склада с конкретными характеристиками, например, числом боксов x1 =25, числом терминалов для погрузки x2 =5 и удаленного от ж/д станции на

расстояние x3 = 8 км?

Качественно построенная статистическая модель предоставляет менеджеру и аналитику дополнительную информацию для принятия эффективных решений. Они могут использовать этот инструмент, как для прогнозирования, так и для оценок и корректировок своей текущей деятельности.

1.3. Типы статистических массивов

Реальную бизнес-статистику – статистические данные или наблюдения , с которыми обычно приходиться иметь дело менеджерам, можно условно разделить на два типа.

Одномерные массивы, содержащие данные только об одной

характеристике – объемах

дневных про-

 

Таблица 1.4.

даж, размерах эксплуатационных расхо-

 

 

 

дов, ставках арендной платы, стоимости

«Наблю-

Значения

акции,

ежедневном

числе

покупателей

дение»

исследуемой

торгового центра и т.д. В качестве исход-

величины

Y

ных статистических данных при анализе

 

1

y1

такой информации рассматривается только

один показатель, не связанный с фактора-

2

y2

 

 

 

 

 

 

ми, его обуславливающими, как это было в

M

M

 

 

i

yi

примере

1. из п.п.

1.2. Фиксировать и

M

M

представлять такого рода данные удобно в

N

yN

виде простых таблиц (табл. 1.4).

 

 

 

 

 

 

По терминологии, принятой в математической статистике, статистические данные, собранные для анализа, называют «наблюдениями».

12

Многомерные массивы статистических данных, содержащие в качестве каждого отдельного наблюдения, как исследуемую характеристику, так и значения тех факторов, для которых соответствующее значение Y было зафиксировано (примеры 2 и 3 из п.п.1.2). Фиксировать и представлять такие данные для дальнейшего анализа удобно в виде таблицы 1.5.

Первый тип статистической информации позволяет получить ответы на достаточно ограниченный круг вопросов. Во втором случае информация более содержательна и позволяет провести достаточно полное исследование, включая построение моделей.

 

 

 

 

 

Таблица 1.5.

 

 

 

 

 

 

 

 

Наблюдения

Значения

 

 

 

 

 

 

анализируемого

 

Значения факторов

 

(аналоги, периоды

 

 

предыстории)

показателя

 

 

 

 

 

 

Y

x1

 

x2

...

 

xn

 

 

 

1

y1

x11

 

x21

...

 

xn1

2

y2

x12

 

x22

...

 

xn2

M

M

M

 

M

M

 

M

i

yi

x1i

 

x2i

...

 

xni

M

M

M

 

M

M

 

M

N

yN

x1N

 

x2N

...

 

xnN

Процесс построения статистических моделей обычно можно разбить на следующие этапы.

1.Сбор статистических данных.

2.Первичная обработка, систематизация и классификация

данных.

3.Выявление факторов, влияющих на исследуемый экономический показатель. Отсев незначимых факторов.

4.Построение моделей и оценка их «качества».

5.Применение моделей для анализа взаимосвязей между переменными, для выполнения расчетов, получения необходимых оценок, в том числе – прогнозирования.

6.Оценка и анализ полученных результатов.

13

1.4. Типы статистических данных

Данные, как источники информации, могут быть представлены в различной форме.

Наиболее удобными для статистического анализа являются количественные данные, отражающие в единой шкале измерений некоторый признак – объем продаж, операционные расходы, число посетителей торгового центра и т.д. Количественные данные под-

разделяют на дискретные и непрерывные.

Дискретными называют величины, множество значений которых может быть перечислено или пронумеровано. Примерами подобных величин являются число проданных в течение дня холодильников, число посетителей кафе, количество заключенных фирмой контрактов и т.д. Соответствующие значения могут быть равными, например, 10, 12,…, 32, но не могут быть любым числом в диапазоне от 10 до 32, таким, например как 12,42; 14,854.

Непрерывными называют величины, которые могут принять любое значение из некоторого числового промежутка. К их числу можно, например, отнести время ожидания ответа на телефонный звонок, вес продуктовой покупки, расход электроэнергии и многое другое.

Иногда приходиться иметь дело с количественными данными, либо не имеющими содержательного смысла – почтовые индексы, номера телефонов, номера банковских счетов и т.д., либо не отражающими измерения признака в единой шкале – места, занятые участниками в конкурсе, числа, используемые для нумерации или кодировании чего-либо. Обработка подобной информации, хотя и требует определенной осторожности, игнорировать ее, как будет показано ниже, нецелесообразно.

Ряд данных, присутствующих во многих статистических массивах, может носить не количественный, а качественный характер. Они, как правило, регистрируют определенное качество, которым обладает объект. Например, класс офиса в статистическом массиве объектов недвижимости, расположение объекта, например, административный округ, пол сотрудников фирмы и т.д. Иногда для учета такого рода данных в виде количественно измеримых величин им просто присваивают определенные числовые значения, например, нумеруют.

14

1.5.Требования, предъявляемые

кстатистической выборке

Первый этап построения статистических моделей обычно связан с формированием выборки – той информации, на основе которой будут получены последующие выводы и заключения. Термин «выборка» подразумевает, что используемая (или собранная) информация в большинстве случаев представляет собой только часть данных из всего реально существующего материала об изучаемом объекте или явлении. Почти никогда нельзя быть уверенным в том, что собранная или имеющаяся в распоряжении аналитика или менеджера статистика – это абсолютно весь статистический материал, полностью представляющий данный объект или явление. Как правило, в реальном бизнесе приходится иметь дело только с выборочной частью данных, отобранных из некоторой «генеральной совокупности» (рис. 1.2).

Генеральная

Выборка

совокупность

объекты, данные,

множество всех

имеющиеся или выбранные

объектов или всех

из генеральной совокупности

данных

для анализа

Рис. 1.2. Генеральная совокупность и выборка

Если совокупность содержит все элементы, или все данные, соответствующие изучаемому явлению или объекту, то в этом случае используют термин «генеральная совокупность».

В качестве иллюстраций можно привести следующие примеры. 1. Менеджером собрана статистика о ежедневных объемах продаж за трехмесячный период. Эту информацию предполагается использовать для получения заключений и выводов о продажах

фирмы за год.

С позиций математической статистики информация, собранная менеджером – это выборка за трехмесячный период, на основании которой он намеревается получить заключение о генеральной совокупности – например, объемах продаж за год.

15

2. Для построения статистической модели, позволяющей оценить стоимость офисных помещений на основе их характеристик (класса, удаленности от центра, дальности до станции метро, этажности, общей площади), были собраны данные о 150 аналогах, выставленных на продажу. В данном примере выборка – это информация о 150 офисах, а генеральной совокупностью можно считать все офисы города.

В реальных бизнес ситуациях далеко не всегда понятно или точно известно «что попало в руки» аналитику и насколько полно имеющиеся данные характеризуют всю генеральную совокупность

(рис. 1.3).

Генеральная совокупность

Выборки из генеральной совокупности

A

B

C

Рис. 1.3. Различные выборки из генеральной совокупности.

16

Так, например, выводы и заключения, сделанные на основе выборок А и Б вряд ли будут справедливы для всей генеральной совокупности, поскольку ни в той, ни в другой не содержатся «представители» всех элементов генеральной совокупности. Понятно, что с большим доверием следует относится к заключениям, полученным на основе выборки С, поскольку в нее, по крайней мере, включены все элементы, характеризующие генеральную совокупность.

Часто анализ имеющейся выборки превращается в самостоятельный этап исследования с целью выявления особенностей, как ее структуры, так и содержащихся в ней данных.

Как правильно сформировать выборку, какие данные включить в нее, чтобы получить объективные и достоверные выводы обо всей генеральной совокупности? Примерами могут служить обработка данных переписи населения, обработка информации, собранной обо всех посетителях торгового центра за год и т.д. В прикладной статистике для этих целей разработаны специальные процедуры, среди которых чаще всего используют случайный, систематический или экспертный методы отбора – [4, 12].

При отборе данных или элементов в выборку полезно иметь в виду следующее

основная цель формирования выборки – эффективное использование ее состава в качестве исходной информации для получения правдоподобных (достоверных) выводов обо всех объектах генеральной совокупности.

основное требование при формировании выборки – репрезентативность (представительность). Выборка должна в максимальной степени (как в «капле воды») отражать свойства и структуру генеральной совокупности и ее объ-

ектов.

С точки зрения практических рекомендаций полезно придерживаться правила – число элементов выборки (N) должно составлять не менее 10% от объема генеральной совокупности. При этом крайне желательно, чтобы общее число элементов (число наблюдений) в выборке, было не менее 30 ( N 30 ).

Очевидно, что качество выводов и заключений, основанных на обработке выборочных данных, напрямую зависит от качества исходной информации.

17

ОСНОВНЫЕ ТЕРМИНЫ (ГЛОССАРИЙ)

Модель (от лат. modulus – образец, изображение, образ) – по-

добие реального объекта, как правило, упрощенное, но вместе с тем, отражающее его наиболее существенные черты и особенности.

Математическая модель – приближённое описание какоголибо класса явлений внешнего мира, выраженное с помощью математической символики.

Экономико-математические модели – модели, которые при-

меняют для исследования экономических закономерностей и анализа бизнес ситуаций.

Управляемые переменные – количественно измеримые величины и характеристики, с помощью которых лицо, принимающее решение, может осуществлять управление объектом.

Неуправляемые переменные – количественно измеримые величины и характеристики, влиять или изменять которые лицо, принимающее решение не в состоянии (параметры внешней среды, некоторые параметры самого объекта управления).

Статистические модели – математические модели, построенные на основе собранного и систематизированного статистического материала.

Наблюдения – статистические данные, собранные для анализа и обработки статистическими методами.

Количественные данные – данные, отражающие в единой шкале измерений некоторый признак. Количественные данные подразделяют на дискретные и непрерывные.

Дискретные количественные данные – величины, множест-

во значений которых может быть перечислено или пронумеровано.

Непрерывные количественные данные – величины, кото-

рые могут принять любое значение из некоторого числового промежутка.

Одномерный массив статистических данных – набор дан-

ных, содержащий информацию только об одной характеристике или показателе, не связанный с факторами, обуславливающими значение этого показателя.

18

Многомерный массив статистических данных – набор данных, содержащий в качестве каждого отдельного наблюдения, как исследуемую характеристику, так и значения тех факторов, для которых соответствующее значение характеристики было зафиксировано.

Генеральная совокупность – множество всех мыслимо воз-

можных наблюдений, которые могли бы быть сделаны при данном определенном комплексе условий; вся подлежащая изучению совокупность объектов.

Выборка (выборочная совокупность) – часть объектов генеральной совокупности.

Репрезентативность (представительность) выборки

свойство выборки, заключающееся в том, что она должна в максимальной степени отражать свойства и структуру генеральной совокупности и ее объектов.

19

2. ОБРАБОТКА И АНАЛИЗ СТАТИСТИЧЕСКОЙ ИНФОРМАЦИИ НА ОСНОВЕ ГРУППИРОВКИ ДАННЫХ

2.1. Постановка задачи

Одна из задач первичной обработки статистики формулируется следующим образом. Существует или собрана информация (выборка) – данные, характеризующие анализируемый объект или ситуацию. Рассмотрим вначале случай одномерных массивов, когда в распоряжении менеджера или аналитика имеются наблюдения только над одним показателем без привязки к факторам, его обуславливающим – табл. 2.1.

 

 

 

 

 

Таблица 2.1.

 

 

 

 

 

 

 

 

Номер «наблюдения» (N)

1

2

i

N

 

 

 

 

 

 

 

 

 

Значения исследуемого

Y1

Y2

Yi

YN

 

показателя (Y)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

К числу такого рода данных относятся, например, дневные объемы продаж, число посетителей торгового центра, месячные расходы электроэнергии, цены на объекты недвижимости, ставки арендной платы и многое, многое другое.

Требуется получить ответы на следующие вопросы.

Какую полезную информацию несет собранный материал?

Как обработать эти данные и установить существующие закономерности для того, чтобы в дальнейшем достаточно достоверно прогнозировать, например, доходность или размер эксплуатационных затрат?

Какие значения показателя являются наиболее типичными (ожидаемыми)?

20