Использование инструмента анализа Ранг и персентиль
Персентили – это характеристики набора данных, которые определяют ранги элементов в виде процентов таким образом, что наименьшему значению элемента данных соответствует персентиль, равный 0%, наибольшему – 100%, медиане – 50% и т.д. Промежуточные значения имеют персентили, расположенные с шагом 100/(n–1). Персентиль выражается в тех же единицах, что и набор данных. Например, 60-й персентиль эффективности продаж равен $385000 и характеризует деятельность определенного агента по продажам. Это означает, что приблизительно 60% других агентов имеют результаты ниже, чем у данного агента, а 40% агентов имеют более высокие результаты.
Персентили играют важную роль в качестве опорных характеристик данных. Чтобы обобщить основные черты распределения, достаточно знать пять базовых значений персентилей.
Наименьшее значение данных (0-персентиль).
Нижний квартиль (25-й персентиль, расположенный на расстоянии одной четверти от наименьшего значения).
Медиана (50-персентиль).
Верхний квартиль (75-й персентиль, расположенный на расстоянии одной четверти от наибольшего значения).
Наибольшее значение данных (100-персентиль).
Нижний и верхний квартили определяют границы половины данных, расположенных в центре, а положение медианы относительно квартилей дает грубое представление о наличии или отсутствии ассиметрии. В инструменте Описательная статистика, как правило, опции К-ый наименьший задается ранг нижнего квартиля, а опции К-ый нибольший – ранг верхнего квартиля.
Задание 7. |
Определить пять базовых показателей для набора данных о размерах выплат руководителям финансовых фирм. |
В таблице 5 содержится список о размере выплат (заработная плата и премия) руководителям финансовых компаний (n=30).
Таблица 5. Выплаты руководителям финансовых компаний
Фирма |
Зарплата и премия, дол. |
Фирма |
Зарплата и премия, дол. |
Фирма |
Зарплата и премия, дол. |
1 |
1723000 |
11 |
1075000 |
21 |
1937000 |
2 |
1294000 |
12 |
1000000 |
22 |
3200000 |
3 |
1119000 |
13 |
901000 |
23 |
2063000 |
4 |
6910000 |
14 |
1936000 |
24 |
1726000 |
5 |
1960000 |
15 |
1458000 |
25 |
1393000 |
6 |
896000 |
16 |
3077000 |
26 |
1877000 |
7 |
746000 |
17 |
4840000 |
27 |
1674000 |
8 |
3273000 |
18 |
1190000 |
28 |
1537000 |
9 |
2101000 |
19 |
481000 |
29 |
743000 |
10 |
1384000 |
20 |
1040000 |
30 |
1242000 |
В файле Описательная статистика.xlsx добавьте Лист5.
На Листе5 в ячейке A1 задайте метку Выплаты, а в диапазон A2:A31 введите данные из Таблицы 5.
Откройте на ленте вкладку Данные. В группе Анализ щелкните на кнопке Анализ данных. В диалоговом окне Анализ данных выберите инструмент Ранг и персентиль и щелкните на кнопке ОК.
В открывшемся диалоговом окне задайте параметры как указано ниже на рисунке. Щелкните на кнопке ОК.
В полученной таблице выделите столбец со значениями персентилей (диапазон F2:F31) и уменьшите разрядность до одного знака после запятой.
Объедините диапазон ячеек H1:N1 и введите метку Базовые показатели.
В ячейку H2 введите метку Наименьшее значение, а в ячейку H3 скопируйте значение из ячейки D31.
В ячейку K2 введите метку Наибольшее значение, а в ячейку K3 скопируйте значение из ячейки D2.
В ячейке N2 задайте метку Медиана. В ячейке N3, используя функцию СРЗНАЧ, вычислите медиану как среднее двух значений с рангами 15 и 16 (ячейки D16:D17).
В ячейках H6 и L6 задайте метки Нижний квартиль и Верхний квартиль соответственно.
В ячейку H7 скопируйте значение из ячейки D24, что соответствует нижнему 24,1-персентилю (это число самое близкое к 25%) с рангом 23.
В ячейку L7 скопируйте значение из ячейки D9, что соответствует верхнему 75,8-персентилю (это число самое близкое к 75%) с рангом 8.
Чтобы сделать выводы о симметричности распределения, надо сравнить три значения: медиану и квартили. Проведем визуальное сравнение. Для этого построим для соответствующих значений точечную диаграмму.
Выделите одновременно ячейки N3, H7, L7. Откройте на ленте вкладку Вставка и выберите тип диаграммы Точечная с маркерами. Теперь отформатируем полученную диаграмму.
Откройте диалоговое окно Выбор источника данных. В левой области Элементы легенды (ряды) выделите Ряд1 и щелкните на кнопке Изменить. В открывшемся диалоговом окне Изменение ряда в текстовом поле Значения X: введите значение 0,5 (см. рисунок ниже). Щелкните на кнопке ОК.
Аналогично выделите Ряд2, щелкните на кнопке Изменить и введите в текстовом поле Значения X: число 0,5. Щелкните на кнопке ОК.
В диалоговом окне Выбор источника данных щелкните на кнопке Добавить. В открывшемся диалоговом окне Изменение ряда введите в текстовом поле Значения X: число 0,5, а в текстовом поле Значения Y: установите параметр =Лист5!$N$3 (этот параметр можно задать, если сначала щелкнуть в текстовом поле Значения Y:, а затем выделить ячейку с медианой N3).
Закройте диалоговые окна, щелкнув на кнопке ОК. Проставьте Подписи данных справа от точек и удалите все надписи. Расположите диаграмму в диапазоне H10:N20. Вид полученной диаграммы показан на рисунке.
Как видим из диаграммы, значение медианы (1497500) находится приблизительно посередине между квартилями, что соответствует симметричному распределению данных.