Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Количественные методы анализа хозяйственной деятельности - Ричард Томас

.pdf
Скачиваний:
336
Добавлен:
24.05.2014
Размер:
7.39 Mб
Скачать

СВОДНАЯ СТАТИСТИКА

2 3

Пример 1

Недельный доход каждого из пяти работников составляет соответственно: 400, 350, 520, 440 и 490 ф. ст.

Средняя арифметическая этих значений получается путем деления суммы значений на их количество.

Таким образом,

 

средняя =

400+350+520+440+490

2200 ^.„

3

=—т—=44U.

Следовательно, средний недельный доход для данной группы работников составляет 440 ф. ст. В общем виде, при п значениях х среднее рассчитывается по формуле

x = Y, х/п.

X (буква феческого алфавита «сигма») означает «сумма». Таким образом, формула читается как сумма х, деленная на п.

Пример 2

Рассмотрим приведенную ниже таблицу частот, содержащую данные невы­ ходов на работу за последние 20 дней.

Количество

отсутствовавших:

1 2

 

3

4

5

Количество

дней отсутствия:

4

7

5

2

2

Среднее значение количества отсутствовавщих в день рассчитывается путем деления суммы значений на количество дней. В данной таблице отмечено 4 дня, когда бьшо только по одному отсутствовавшему, 7 дней — по 2 и т. д. Для получения среднего необходимо суммировать все эти значения и разделить их на число (20), как это показано ниже:

Средняя =

1 + 1 + 1 + 1 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 3 + 3 + 3 + 3 + 3 + 4 + 4 + 5 + 5

.

В упрощенном виде это будет выглядеть так:

4x1 + 7x2 + 5x3 + 2 x 4 + 2 x 5

4 + 14 + 15 + 8 + 10

51 ^ ^^

Средняя =

=

=20 = ^-^^-

Таким образом, в среднем, согласно значению средней арифметической, на предприятии отмечено 2.55 дня невыходов на работу в день.

Рассмотрим элементы данной формулы. У нас имеется следующая таблица частот:

Количество

отсутствовавших (х):

1

2

3

4

5

Количество

дней (/):

4

7

5

2

2

2 4 ГЛАВА 1

Переменная (количество отсутствовавших) обозначается х, а частота (ко­ личество дней) — /

Среднее /получается путем суммирования произведений значений/и со­ ответствующих значений х и последующего деления суммы на общее количе­ ство значений, получаемое путем суммирования значений частот.

Таким образом, при наличии таблицы частот средняя рассчитывается по следующей формуле:

If

Пример 3

Формула, приведенная в предыдущем примере, может быть использована для любых данных, сведенных в таблицу частот. Однако если в таблице указаны интервалы группировки, тогда необходимо брать срединные значения каждого интервала в качестве значений х. Рассмотрим следующую таблицу частот, со­ держащую доходы группы работников:

Недельный доход (ф. ст.):

300400- 500-

600

- 700800-

Количество работников:

2

5

9

12

8

4

Расчет среднего значения на основании этих данных обычно производится с помощью таблицы, как это показано ниже:

X

f

fx

(срединные значения)

350

2

700

450

5

2250

550

9

4950

650

12

7800

750

8

6000

850

4

3400

Итого:

Z / = 4 0

Х А = 25100

Получаем среднее: _ Е А 25100

Таким образом, средний доход данной группы работников составляет 627.5 ф. ст.

Данное значение можно использовать для различных целей. Во-первых, оно используется как средство описания данных. Так, ссылка на среднюю за­ работную плату может служить показателем доходов работников данного пред­ приятия. Во-вторых, это значение можно использовать при сравнении двух и более наборов данных. Например, средняя заработная плата на другом пред-

СВОДНАЯ СТАТИСТИКА

2 5

Приятии составляет 700 ф. ст., что позволяет нам некоторым образом судить об уровнях доходов работников, относящихся к разным предприятиям. Далее, та­ кого рода информация может, например, стать ориентиром и существенной отправной точкой при переговорах между работниками и администрацией по вопросу увеличения заработной платы. Однако средняя может быть искажена экстремальными значениями, и поэтому к ее использованию следует подходить с осторожностью. Например, если один работник из одной из названных фупп станет получать 2000 ф. ст. в неделю, тогда полученная средняя арифметическая существенно изменится.

1.5.2. Мода

Средняя набора значений может быть получена путем определения моды Моду можно коротко определить как значение, наиболее часто встречающе­ еся в наборе данных. Это наиболее «типичное» значение среди данных, и часто его считают более репрезентативным, т.е. более достоверным, нежели среднюю арифметическую. На последующих примерах мы рассмотрим поря­ док получения моды на основании данных, представленных в том или ином виде.

Т Определение. Мода это средняя, получаемая путем установления наи лее часто встречающегося значения в наборе данных.

Пример 1

Нижеприведенные значения показывают количество работников, отсут­ ствовавших на работе за период в 10 дней:

3, 5, 2, 1, 4, 3, 2, О, 3, 6 Здесь видно, что наиболее часто встречается цифра 3. Отсюда мода равня­

ется 3 работникам. Таким образом, среднее количество работников, отсутство­ вавших на работе, можно определить как равное 3.

Пример 2

В таблице приведено количество отсутствовавших на работе за последние три недели (21 день):

Количество

отсутствовавших:

0

1

2

 

3

4

Количество

дней:

2

8

 

6

3

2

Из таблицы частот следует, что чаше всего (8 дней) отсутствовало по одному работнику.

Таким образом, мода равняется 1 работнику. Как видно на примере такой простой таблицы частот, определение моды не представляет труда. Мы просто находим и соотносим ее со значением соответствующей пере­ менной. Однако если таблица частот содержит интервалы фуппировки, то процесс определения становится более сложным, что мы и увидим на сле­ дующем примере.

26

ГЛАВА 1

Пример 3

Рассмотрим недельные доходы фуппы из 40 работников, что мы уже де­ лали ранее:

Недельный доход (ф. ст.):

0 -

400 -

500-

600-

700-

800

Количество работников:

2

5

9

12

8

4

В процессе фуппировки значений в интервалы, как в данном примере, мы потеряли значительную часть исходной первичной информации. Например, невозможно точно определить наиболее часто встречающееся характерное зна­ чение. Может не быть двух работников, получающих одинаковую зарплату, отсюда — и единственной моды. Параллельно мода может оказаться в любом из интервалов фуппировки данной таблицы. Например, если два работника полу­ чают точно 300 ф. ст. и больще ни один работник не получает одинаковой с другим зарабртной платы, тогда, строго говоря, мода составляет 300 ф. ст. Но это даже и не близко к значению средней! Так как существенная часть инфор­ мации отсутствует, нам необходимо на основании имеющихся данных опреде­ лить наиболее вероятное значение моды. Из таблицы видно, что наиболее часто повторяется интервал 600—700 ф. ст. Отсюда естественно предположить, что мода находится в пределах данного интервала. Можно определить моду как срединное значение в данном интервале, т. е. 650 ф. ст. И хотя в этом есть резон, все же лучще определить среднее относительно значений частот по обе стороны наибольшего значения. Мы видим, что значение частот для интервала, меньшего 600—700, больше значения частот для интервала, большего 600—700. Поэтому более веро­ ятно, что мода находится в первой половине интервала фуппировки 600—700. Например, она может быть равна не 650 , а 640 ф. ст. или 630 ф. ст.

М(3да Недельный доход

Рис. 1.14. Гистограмма доходов

Один из принятых методов получения приемлемого значения моды состо­ ит в использовании гистофаммы, как это показано на рис. 1.14. Как это видно из рисунка, мода определяется следующим образом: проводим прямую линию от верхнего правого угла самого большого столбца к правому верхнему углу левого от него столбца, затем прямую линию от верхнего левого угла к верх-

СВОДНАЯ СТАТИСТИКА

2 7

нему левому углу правого от него столбца Из точки пересечения этих двух прямых проводим перпендикуляр к линии горизонтальной оси. Точка пересече­ ния перпендикуляра с линией горизонтальной оси дает значение моды.

Как это видно на графике, значение моды составляет 643 ф. ст.

Следует отметить, что в данном случае мы отошли от первоначального определения моды как наиболее частотного значения. Значения моды, получен­ ные вышеизложенным способом, вряд ли будут наиболее частотными по при­ чинам, которые мы уже осветили. Однако данный способ определения моды имеет право на существование, и во многих практических ситуациях он позво­ ляет лучше других методов, в том числе метода средней арифметической, ус­ тановить «среднее» значение.

1.5.3. Медиана

Еще один способ определения среднего значения набора данных заключа­ ется в получении медианы. В ряде случаев это наиболее приемлемый и очевид­ ный вариант выявления центрального значения. В буквальном смысле, медиана

— это срединное значение при условии, что данные выстроены в ранжирован­ ном порядке. На последующих примерах вы познакомитесь со способом опреде­ ления медианы.

Т Определение. Медиана — это среднее, полученное путем выявления «цент­ рального» значения в перечне данных, расположенных в ранжированном порядке.

Пример 1

Найдите медиану заработной платы на основании следующих данных: 500, 450, 290, 760, 375, 430, 410 ф. ст.

Для определения медианы эти данные необходимо расположить в ранжи­ рованном порядке (по возрастанию или убыванию):

290, 375, 410, 430, 450, 500, 760 ф. ст.

Срединное значение в данной последовательности — это значение чет­ вертое по счету, т. е. 430 ф. ст. Таким образом, медиана равна 430 ф. ст. Медиана — это значение, разделяющее единицы совокупности на две рав­ ные части. Поэтому обычно количество значений до и после медианы дол­ жно быть одинаковым. В данном примере имеется по три значения до и после медианы.

Имеет смысл рассмотреть общую формулу, которая определит место медианы в совокупности. Например, в данном примере медиана представле­ на четвертым значением из общей совокупности, состоящей из семи значе­ ний.

В общем виде, при наличии я значений медиана = [(л+1)/2]-й порядковый номер.

Таким образом, в перечне, состоящем из пяти значений, медиана = [(5+1)/2]-й порядковый номер = 3-й номер.

Аналогично, в последовательности из 10 значений медиана = [(10+1)/2]-й порядковый номер = [5'/2]-й (то есть номер, что находится посередине между 5-м и 6-м значениями).

2 8

ГЛАВА 1

Пример 2

Рассмотрим таблицу частот, отображающую количество невыходов на ра­ боту за период в три недели (21 день):

Количество отсутствовавших:

0

1

2

3

4

Количество дней:

2

8

6

3

2

Согласно данной таблице, обшее

количество дней

равно п = Х / ~ 21.

Отсюда медиана = \{п + 1)/2]-е или [(21 + 1)/2]-е = 11-е значение. Теперь необходимо из этих данных выбрать 11-е значение. Есть 2 дня, в

которые не отмечено невыходов; есть 8 дней, в которые отмечено по I невы­

ходу. Следовательно, первые десять значений —

это О или 1. Таким образом,

11-е значение — это 2. Итак, медиана равна 2-м

работникам.

Пример 3

Процесс первоначального определения медианы с целью получения сред­ него значения может быть распространен на таблицы частот, содержащие ин­ тервалы фуппировки, как это видно на следующем примере. Рассмотрим зара­ ботную плату фуппы работников, что мы уже делали ранее:

Недельный доход (ф. ст.):

300400-

500-

600

- 700-

800-

Количество работников:

2

5

9

12

8

4

В данной таблице сумма значений

равна п =

Х / ~

^0.

 

Отсюда, медиана = \{п + 1)/21-е или [(40 + 1)/21-е = (20.5)-е значение. Видно, что первые три интервала вк.лючают всего 16 работников; в следующем интервале (600 — 700 ф. ст.) находятся еще 12 работников. Та­ ким образом, (20.5)-е значение входит в данный интервал. Следовательно, медиана находится в интервале 600 — 700 ф. ст. Кроме выявления интервала группировки необходимо определить фактическое значение (20.5)-е значе­ ние. Это можно сделать с помощью интегратьной кривой распределения

(стрелки).

Т Определение. Стрелка это графическое отображение накопленной частоты.

Накопленная частота, приведенная ниже в таблице, определяется путем выявления частотности ниже определенного значения. Например, частота ниже 300 (т. е. количество работников, получающих менее 300 ф. ст.) равна нулю. Аналогично, частота ниже 400 равна 2. а частота ниже 500 — 7 (т. е., согласно таблице, имеется семь работников, зарабатыва­ ющих менее 500 ф. ст.). В полном виде таблица накопленной частоты приведена ниже:

 

СВОДНАЯ СТАТИСТИКА

29

Недельный доход

Накопленные частоты

 

(Ф. ст.)

(частотность ниже определенного значения)

 

300

О

 

400

2

 

500

7

 

600

16

 

700

28

 

800

36

 

900

40

 

Значения таблицы накопленных частот можно представить в виде фафика, как это показано на рис. 1.15.

300

400

500

600 I 700

800

900

 

 

 

Медиана

 

 

 

 

Недельный доход (ф. ст.)

 

 

Рис. 1 . 1 5 . Таблица

накопленной

частоты

 

 

Посредством вычерчивания кривой, соединяющей нанесенные точки, мы можем определить нетабличные значения. Как это показано на фафике, (20.5)-е значение определяется путем проведения от точки 20.5 на вертикальной оси прямой, параллельной горизонтальной оси, до ее пересечения с кривой и построения из точки пересечения перпендикуляра до его пересечения с гори­ зонтальной осью. Полученное значение есть значение медианы. Следует отме­ тить, что на практике, если точки накопленной частоты соединены прямыми линиями, тогда еще можно получить приемлемое значение медианы. Теорети­ чески же идеальная кривая, проходящая через отмеченные точки, позволяет получить оптимальное значение. Однако обычно этого трудно достичь с нобходимой точностью. График, представленный на рис. 1.15, определяет значение медианы, равное 638 ф. ст.

Таким образом, мы можем сказать, что «центральное» значение зара­ ботной платы составляет 638 ф. ст. Следовательно, половина работников зарабатывает менее 638 ф. ст. и другая половина — более 638 ф. ст. Данный способ определения средней может быть весьма полезен. Ведь для некоторых переменных, в том числе касающихся доходов, значение медианы считается наиболее реалистичным.

30

ГЛАВА 1

1.6. Сравнение средних

Три метода получения «средней», описанные в данном разделе, соверщенно равнозначны. У каждого метода есть достоинства и недостатки, которые сведены в таблицу, представленную на рис. 1.16.

Метод

Достоинства

Недостатки

Средняя

Рассчитывается по формуле

— Может быть искажено

арифметическая

Очевиден для большинства людей

экстремальными значениями

 

 

— Не всегда репрезентативен

 

 

с точки зрения данных

Мода

— Простота получения

— Определение на основе графика

 

— Оптимален с точки зрения

{хотя имеется математический

 

выявления «типичного» значен1/1я из

вариант)

 

совокупности данных

— Не подходит для «нестандартного»

 

 

распределения, т. е. включающего

 

 

два и более максимума

Медиана

— Фактическое «центральное» значение

— Определение на основе графика

 

— Обычно считается наиболее

или соответствующего математичес­

 

репрезентативным значением

кого метода

Рис. 1.16. сравнение методов определения «средних»

Метод, основанный на вычислении средней арифметической, или просто средней, обычно считается наиболее приемлемым. Он очевиден: просто сложи­ те имеющиеся значения и поделите сумму на их количество. Все просто, в том числе отработка данных таблиц частот. Однако, несмотря на всю эту простоту, зачастую этот метод наименее адекватен. Рассмотрим распределение заработной платы на рис. 1.17. Данная диафамма иллюстрирует типичное распределение доходов всех работников крупной организации. Это положительно асимметрич­ ное распределение, с областью больших отклонений в правой части диафаммы. Доходы основной массы работников представлены в левой части диафаммы. Только несколько работников имеют доходы, представленные у верхней фаницы диафаммы. Вот эти-то несколько работников и искажают значение средней, и «усредненное» значение, полученное путем расчета арифметической сред­ ней, превышает приемлемо репрезентативное значение. Значение моды соот­ ветствует максимальному значению частот, представленных в распределении. При такой форме распределения это значение находится в области нижних значений заработной платы и поэтому также не является полностью репрезен­ тативным. Значение медианы, как центральное значение, выступает в роли компромиссного решения и часто считается наилучшим показателем. На рис. 1.17 представлены значения средней, моды и медианы. Эти три показателя будут находиться в соответствии друг с другом, только если распределение данных симметрично. Если распределение отрицательно асимметрично, тогда последовательность значений меняется на обратную. Так, средняя будет наи­ меньшим значением, а мода — наибольшим. На рис. 1.18 представлены три типа распределения с соответствующими показателями трех «средних». Рисунки про­ сто отображают форму каждого распределения. Так, проведенные кривые очер­ чивают контуры соответствующей гистограммы. Например, на рис. 1.18 (i) ото­ бражена форма, представляющая такое же распределение, что мы видим и на рис. 1.17.

СВОДНАЯ СТАТИСТИКА

31

Мода

\

\

Доходы

Средняя

 

Медиана

 

Рис. 1.17. Распределение доходов

Мода Медиана Средняя

Средняя Медиана Мода

Мода

Медиана

Средняя

Рис. 1.18. Сравнение распределений

1.7. Упражнения: средние

1. (Е) В таблице приведены данные по отсутствовавшим на работе за пери­ од в 60 рабочих дней:

Количество

отсутствовавших:

О

1

2

3

4

5

6

Количество

дней:

12

16

11

6

8

3

4

Определите среднюю, медиану и моду по этим данным. Какой показатель, по вашему мнению, наиболее приемлем в данном случае?

2. (I) Имеются данные по кредитовым остаткам 50 клиентов банка:

Остаток (ф. ст.):

О- 200400- 600-

800-

1000-

Количество счетов:

12 18 10 6

3

1

Определите средний остаток путем вычисления:

3 2 ГЛАВА 1

а) средней; б) моды; в) медианы. Прокомментируйте разницу в полученных значениях.

3. (I) Найдите значения средней, медианы и моды на основании следую­ щих таблиц частот:

(i) Заработная плата (ф. ст.):

200--

300-

400-

500-

600-

 

Количество

работников:

 

4

7

6

5

 

3

 

(ii) Количество отработанных

 

 

 

 

 

 

 

 

сверхурочных часов:

0 -

2 -

4 -

6 -

8 -

10 -

12-

Количество

работников:

3

7

13

10

 

8

5

4

(iii) Недельная

прибыль

 

 

 

 

 

 

 

 

(тыс. ф. ст.):

 

 

0 -

5 -

1 0 -

1 5

-

2 0 -

2 5 -

Количество

недель:

 

13

!7

11

9

 

6

4

1.8. Понятие вариации

Средние, описанные в предыдущих разделах, являются важным средством характеристики данных, а также проведения сравнения наборов данных. Одна­ ко во многих случаях показатели средней недостаточны для проведения прием­ лемого различия между разными распределениями. Рассмотрим простой пример сравнения понедельной заработной платы всех работников двух предприятий (см. рис. 1.19). Предположим, что все другие показатели идентичны, то есть предприятия одинаковы по размеру, условиям работы и предоставляемым по­ собиям и льготам. Также следует отметить, что для получения средней на осно­ вании двух наборов данных по заработной плате использовался один и тот же метод расчета, в соответствии с которым приведенные значения — средние арифметические. Единственное реальное различие между предприятиями состо­ ит в уровне оплаты работников. Из таблицы видно, что средняя заработная плата на предприятии Б несколько выше, чем на предприятии А. Таким обра­ зом, при наличии выбора на основании данной информации многие из нас предпочли бы пойти работать на предприятие Б. Вместе с тем средние не дают нам всей картины в целом. Например, для проведения более качественного сравнения было бы полезно выяснить верхнюю и нижнюю планки заработной платы на двух предприятиях. Так, таблица, представленная на рис. 1.20, дает в сравнении дополнительную информацию по двум предприятиям. На основании этой дополнительной информации предприятие А предстает в более благопри­ ятном свете: мы видим, что минимальная заработная плата на двух предприя­ тиях аналогична, но на предприятии А гораздо выше максимальная заработная плата. Таким образом, хотя для многих работников предприятия Б средний уровень заработной платы выше, чем на предприятии А, на последнем значи­ тельно выше потенциал в том, что касается заработной платы. Все работники предприятия Б получают одинаковую заработную плату. Это означает, что прак­ тически отсутствуют условия для роста работника и стимулы к такого рода росту минимальны. Напротив, на предприятии А имеется существенный резерв для роста. Диапазон заработной платы здесь значительно шире, что свидетель­ ствует о существенном разбросе в уровне оплаты различных категорий работни­ ков, иначе говоря, в данной организации имеется существенный стимул для тех, кто ставит перед собой высокие цели. С учетом данной информации про-

Соседние файлы в предмете Экономика