Медиана: типическое значение для количественных и порядковых данных
Медиана располагается в центре данных и дает представление о списке значений. Чтобы найти медиану, надо предварительно упорядочить данные в порядке возрастания, а затем определить среднюю точку. Тогда половина элементов в наборе будет меньше значения в средней точке, а вторая половина – больше.
Медиану можно также определить, проставив соответствующие ранги. Ранги связывают номера (числа) 1, 2, 3, …, n со значениями данных таким образом, что наименьшее значение имеет ранг 1, следующее по величине значение – ранг 2 и т.д. до наибольшего значения, которое имеет ранг n.
Если все n значений были отсортированы и проставлены ранги, то при определении медианы возможны два варианта.
1). Если n – нечетное число, то медианой является значение с рангом (n+1)/2.
2). Если n – четное число, то медианой является среднее двух значений, расположенных в середине ряда и имеющих ранги (n/2) и (n/2+1).
Поясним отличие медианы от среднего. При нормальном распределении данных значения медианы и среднего близки между собой, поскольку нормальное распределение симметрично и имеет четко выраженную среднюю точку. Однако для реальных нормально распределенных данных, поскольку всегда присутствует некоторая случайность, медиана и среднее несколько отличаются друг от друга, так как определяются по-разному. Для нормально распределенных данных наиболее эффективной характеристикой является среднее.
Если набор данных имеет ассиметричное распределение или выбросы, то медиана и среднее могут существенно различаться. Обычно среднее по отношению к медиане сдвинуто в направлении более длинного хвоста или в направлении выброса, так как среднее учитывает такие экстремальные наблюдения, в то время как для медианы важно, по какую сторону от нее лежит то или иное значение. Медиана является хорошей характеристикой ассиметричного распределения и при наличии выбросов, поскольку она устойчива к их влиянию.
Задание 5. |
Определить медиану процентного изменения стоимости акций на момент открытия торгов в день обвала фондового рынка. |
В таблице 3 приведены данные о падении стоимости акций 29 промышленных компаний в первый день кризиса биржи в октябре 1987 года.
Таблица 3. Падение акций при открытии торгов
Фирма |
Изменение стоимости, % |
Фирма |
Изменение стоимости, % |
Фирма |
Изменение стоимости, % |
1 |
-4,1 |
11 |
-0,9 |
21 |
-15,7 |
2 |
-5,1 |
12 |
-3,5 |
22 |
-12,3 |
3 |
-4,5 |
13 |
-10,5 |
23 |
-9,6 |
4 |
-5,4 |
14 |
-7,2 |
24 |
-12,0 |
5 |
-4,0 |
15 |
-8,9 |
25 |
-12,4 |
6 |
-11,6 |
16 |
-6,8 |
26 |
-8,6 |
7 |
-4,0 |
17 |
-2,1 |
27 |
-11,4 |
8 |
-3,0 |
18 |
-17,2 |
28 |
-10,8 |
9 |
-4,4 |
19 |
-15,7 |
29 |
-8,6 |
10 |
-9,3 |
20 |
-8,9 |
|
|
В файле Описательная статистика.xlsx на Листе3 в ячейке A1 задайте метку Изменение стоимости. В диапазон A2:A30 введите данные Таблицы 3. Увеличьте ширину столбца A, дважды щелкнув на правой границе его заголовка.
Щелкните внутри диапазона A1:A30 и выполните упорядочивание данных. Для этого на ленте откройте вкладку Данные, в группе Сортировка и фильтр щелкните на кнопке Сортировка от минимального к максимальному.
В ячейку B1 введите метку Ранг, в ячейку B2 введите число 1, а в ячейку B3 – число 2. Выделите ячейки B2:B3 и дважды щелкните на маркере заполнения. Ранги будут проставлены для всех значений входного диапазона.
Теперь определите значение медианы. Для этого сначала ячейке B30 присвойте имя переменной n. В ячейке D1 задайте метку Ранг медианы, а в ячейку D2 введите формулу =(n+1)/2.
В ячейке D5 задайте метку Медиана. В ячейку D6 скопируйте из столбца Изменение стоимости значение, соответствующее вычисленному рангу медианы.
Постройте гистограмму процентных изменений стоимости акций для диапазона данных A1:A30, включая метку. Величину кармана задайте явно равной 2. Нижнюю границу интервала карманов примите равной (–20), а верхнюю границу равной 0. Значения карманов вместе с меткой Карман расположите в ячейках F1:F12. Выведите гистограмму вместе с таблицей распределения частот в область H1:Р20.
Проанализируйте гистограмму и ответьте на следующий вопрос.
Можно ли считать, что распределение данных близко к нормальному?
В ячейке D9 задайте метку Среднее, а в ячейке D10 рассчитайте среднее значение процентного изменения. Уменьшите разрядность полученного значения до одного знака после запятой.
Ответьте на следующий вопрос.
Существенно ли отличаются друг от друга значения Среднего и Медианы?
Задание 6. |
Определить медиану и среднее для служащих сферы общественного питания. |
В таблице 4 содержатся данные о количестве служащих в 10 фирмах общественного питания.
Таблица 4. Количество служащих в фирмах общественного питания
Фирма |
Количество служащих |
Фирма |
Количество служащих |
1 |
471000 |
6 |
33000 |
2 |
183000 |
7 |
30000 |
3 |
133000 |
8 |
51700 |
4 |
90000 |
9 |
26170 |
5 |
44000 |
10 |
38000 |
В файле Описательная статистика.xlsx добавьте Лист4.
На Листе4 в ячейке A1 задайте метку Количество служащих, а в диапазон A2:A11 введите данные из Таблицы 4.
Постройте гистограмму для диапазона данных A1:A11, включая метку. Задайте карман равным 20000. Нижнюю границу интервала карманов примите равной 26000, а верхнюю границу равной 486000. Значения карманов вместе с меткой Карман расположите в ячейках D1:D25. Расположите таблицу распределения частот в диапазоне F1:G26, а гистограмму – в диапазоне I1:M20.
Проанализируйте гистограмму и ответьте на следующий вопрос.
Какой характер распределения имеют данные?
В ячейку J25 введите метку Медиана. В ячейке J26 вычислите медиану, используя статистическую функцию МЕДИАНА.
В ячейку L25 введите метку Среднее. В ячейке L26 вычислите среднее, используя статистическую функцию СРЗНАЧ.
Ответьте на следующий вопрос.
Как объяснить существенное различие значений Медианы и Среднего.