Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛР2-2007Обобщающие показатели.doc
Скачиваний:
5
Добавлен:
18.07.2019
Размер:
243.2 Кб
Скачать

Использование инструмента анализа Ранг и персентиль

Персентили – это характеристики набора данных, которые определяют ранги элементов в виде процентов таким образом, что наименьшему значению элемента данных соответствует персентиль, равный 0%, наибольшему – 100%, медиане – 50% и т.д. Промежуточные значения имеют персентили, расположенные с шагом 100/(n–1). Персентиль выражается в тех же единицах, что и набор данных. Например, 60-й персентиль эффективности продаж равен $385000 и характеризует деятельность определенного агента по продажам. Это означает, что приблизительно 60% других агентов имеют результаты ниже, чем у данного агента, а 40% агентов имеют более высокие результаты.

Персентили играют важную роль в качестве опорных характеристик данных. Чтобы обобщить основные черты распределения, достаточно знать пять базовых значений персентилей.

  • Наименьшее значение данных (0-персентиль).

  • Нижний квартиль (25-й персентиль, расположенный на расстоянии одной четверти от наименьшего значения).

  • Медиана (50-персентиль).

  • Верхний квартиль (75-й персентиль, расположенный на расстоянии одной четверти от наибольшего значения).

  • Наибольшее значение данных (100-персентиль).

Нижний и верхний квартили определяют границы половины данных, расположенных в центре, а положение медианы относительно квартилей дает грубое представление о наличии или отсутствии ассиметрии. В инструменте Описательная статистика, как правило, опции К-ый наименьший задается ранг нижнего квартиля, а опции К-ый нибольший – ранг верхнего квартиля.

Задание 7.

Определить пять базовых показателей для набора данных о размерах выплат руководителям финансовых фирм.

В таблице 5 содержится список о размере выплат (заработная плата и премия) руководителям финансовых компаний (n=30).

Таблица 5. Выплаты руководителям финансовых компаний

Фирма

Зарплата и премия, дол.

Фирма

Зарплата и премия, дол.

Фирма

Зарплата и премия, дол.

1

1723000

11

1075000

21

1937000

2

1294000

12

1000000

22

3200000

3

1119000

13

901000

23

2063000

4

6910000

14

1936000

24

1726000

5

1960000

15

1458000

25

1393000

6

896000

16

3077000

26

1877000

7

746000

17

4840000

27

1674000

8

3273000

18

1190000

28

1537000

9

2101000

19

481000

29

743000

10

1384000

20

1040000

30

1242000

  1. В файле Описательная статистика.xlsx добавьте Лист5.

  2. На Листе5 в ячейке A1 задайте метку Выплаты, а в диапазон A2:A31 введите данные из Таблицы 5.

  3. Откройте на ленте вкладку Данные. В группе Анализ щелкните на кнопке Анализ данных. В диалоговом окне Анализ данных выберите инструмент Ранг и персентиль и щелкните на кнопке ОК.

  4. В открывшемся диалоговом окне задайте параметры как указано ниже на рисунке. Щелкните на кнопке ОК.

  1. В полученной таблице выделите столбец со значениями персентилей (диапазон F2:F31) и уменьшите разрядность до одного знака после запятой.

  2. Объедините диапазон ячеек H1:N1 и введите метку Базовые показатели.

  3. В ячейку H2 введите метку Наименьшее значение, а в ячейку H3 скопируйте значение из ячейки D31.

  4. В ячейку K2 введите метку Наибольшее значение, а в ячейку K3 скопируйте значение из ячейки D2.

  5. В ячейке N2 задайте метку Медиана. В ячейке N3, используя функцию СРЗНАЧ, вычислите медиану как среднее двух значений с рангами 15 и 16 (ячейки D16:D17).

  6. В ячейках H6 и L6 задайте метки Нижний квартиль и Верхний квартиль соответственно.

  7. В ячейку H7 скопируйте значение из ячейки D24, что соответствует нижнему 24,1-персентилю (это число самое близкое к 25%) с рангом 23.

  8. В ячейку L7 скопируйте значение из ячейки D9, что соответствует верхнему 75,8-персентилю (это число самое близкое к 75%) с рангом 8.

Чтобы сделать выводы о симметричности распределения, надо сравнить три значения: медиану и квартили. Проведем визуальное сравнение. Для этого построим для соответствующих значений точечную диаграмму.

  1. Выделите одновременно ячейки N3, H7, L7. Откройте на ленте вкладку Вставка и выберите тип диаграммы Точечная с маркерами. Теперь отформатируем полученную диаграмму.

  2. Откройте диалоговое окно Выбор источника данных. В левой области Элементы легенды (ряды) выделите Ряд1 и щелкните на кнопке Изменить. В открывшемся диалоговом окне Изменение ряда в текстовом поле Значения X: введите значение 0,5 (см. рисунок ниже). Щелкните на кнопке ОК.

  1. Аналогично выделите Ряд2, щелкните на кнопке Изменить и введите в текстовом поле Значения X: число 0,5. Щелкните на кнопке ОК.

  2. В диалоговом окне Выбор источника данных щелкните на кнопке Добавить. В открывшемся диалоговом окне Изменение ряда введите в текстовом поле Значения X: число 0,5, а в текстовом поле Значения Y: установите параметр =Лист5!$N$3 (этот параметр можно задать, если сначала щелкнуть в текстовом поле Значения Y:, а затем выделить ячейку с медианой N3).

  3. Закройте диалоговые окна, щелкнув на кнопке ОК. Проставьте Подписи данных справа от точек и удалите все надписи. Расположите диаграмму в диапазоне H10:N20. Вид полученной диаграммы показан на рисунке.

Как видим из диаграммы, значение медианы (1497500) находится приблизительно посередине между квартилями, что соответствует симметричному распределению данных.