Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛР2-2007Обобщающие показатели.doc
Скачиваний:
5
Добавлен:
18.07.2019
Размер:
243.2 Кб
Скачать

Медиана: типическое значение для количественных и порядковых данных

Медиана располагается в центре данных и дает представление о списке значений. Чтобы найти медиану, надо предварительно упорядочить данные в порядке возрастания, а затем определить среднюю точку. Тогда половина элементов в наборе будет меньше значения в средней точке, а вторая половина – больше.

Медиану можно также определить, проставив соответствующие ранги. Ранги связывают номера (числа) 1, 2, 3, …, n со значениями данных таким образом, что наименьшее значение имеет ранг 1, следующее по величине значение – ранг 2 и т.д. до наибольшего значения, которое имеет ранг n.

Если все n значений были отсортированы и проставлены ранги, то при определении медианы возможны два варианта.

1). Если n – нечетное число, то медианой является значение с рангом (n+1)/2.

2). Если n – четное число, то медианой является среднее двух значений, расположенных в середине ряда и имеющих ранги (n/2) и (n/2+1).

Поясним отличие медианы от среднего. При нормальном распределении данных значения медианы и среднего близки между собой, поскольку нормальное распределение симметрично и имеет четко выраженную среднюю точку. Однако для реальных нормально распределенных данных, поскольку всегда присутствует некоторая случайность, медиана и среднее несколько отличаются друг от друга, так как определяются по-разному. Для нормально распределенных данных наиболее эффективной характеристикой является среднее.

Если набор данных имеет ассиметричное распределение или выбросы, то медиана и среднее могут существенно различаться. Обычно среднее по отношению к медиане сдвинуто в направлении более длинного хвоста или в направлении выброса, так как среднее учитывает такие экстремальные наблюдения, в то время как для медианы важно, по какую сторону от нее лежит то или иное значение. Медиана является хорошей характеристикой ассиметричного распределения и при наличии выбросов, поскольку она устойчива к их влиянию.

Задание 5.

Определить медиану процентного изменения стоимости акций на момент открытия торгов в день обвала фондового рынка.

В таблице 3 приведены данные о падении стоимости акций 29 промышленных компаний в первый день кризиса биржи в октябре 1987 года.

Таблица 3. Падение акций при открытии торгов

Фирма

Изменение стоимости, %

Фирма

Изменение стоимости, %

Фирма

Изменение стоимости, %

1

-4,1

11

-0,9

21

-15,7

2

-5,1

12

-3,5

22

-12,3

3

-4,5

13

-10,5

23

-9,6

4

-5,4

14

-7,2

24

-12,0

5

-4,0

15

-8,9

25

-12,4

6

-11,6

16

-6,8

26

-8,6

7

-4,0

17

-2,1

27

-11,4

8

-3,0

18

-17,2

28

-10,8

9

-4,4

19

-15,7

29

-8,6

10

-9,3

20

-8,9

  1. В файле Описательная статистика.xlsx на Листе3 в ячейке A1 задайте метку Изменение стоимости. В диапазон A2:A30 введите данные Таблицы 3. Увеличьте ширину столбца A, дважды щелкнув на правой границе его заголовка.

  2. Щелкните внутри диапазона A1:A30 и выполните упорядочивание данных. Для этого на ленте откройте вкладку Данные, в группе Сортировка и фильтр щелкните на кнопке Сортировка от минимального к максимальному.

  3. В ячейку B1 введите метку Ранг, в ячейку B2 введите число 1, а в ячейку B3 – число 2. Выделите ячейки B2:B3 и дважды щелкните на маркере заполнения. Ранги будут проставлены для всех значений входного диапазона.

  4. Теперь определите значение медианы. Для этого сначала ячейке B30 присвойте имя переменной n. В ячейке D1 задайте метку Ранг медианы, а в ячейку D2 введите формулу =(n+1)/2.

  5. В ячейке D5 задайте метку Медиана. В ячейку D6 скопируйте из столбца Изменение стоимости значение, соответствующее вычисленному рангу медианы.

  6. Постройте гистограмму процентных изменений стоимости акций для диапазона данных A1:A30, включая метку. Величину кармана задайте явно равной 2. Нижнюю границу интервала карманов примите равной (20), а верхнюю границу равной 0. Значения карманов вместе с меткой Карман расположите в ячейках F1:F12. Выведите гистограмму вместе с таблицей распределения частот в область H1:Р20.

  7. Проанализируйте гистограмму и ответьте на следующий вопрос.

  • Можно ли считать, что распределение данных близко к нормальному?

  1. В ячейке D9 задайте метку Среднее, а в ячейке D10 рассчитайте среднее значение процентного изменения. Уменьшите разрядность полученного значения до одного знака после запятой.

  2. Ответьте на следующий вопрос.

  • Существенно ли отличаются друг от друга значения Среднего и Медианы?

Задание 6.

Определить медиану и среднее для служащих сферы общественного питания.

В таблице 4 содержатся данные о количестве служащих в 10 фирмах общественного питания.

Таблица 4. Количество служащих в фирмах общественного питания

Фирма

Количество служащих

Фирма

Количество служащих

1

471000

6

33000

2

183000

7

30000

3

133000

8

51700

4

90000

9

26170

5

44000

10

38000

  1. В файле Описательная статистика.xlsx добавьте Лист4.

  2. На Листе4 в ячейке A1 задайте метку Количество служащих, а в диапазон A2:A11 введите данные из Таблицы 4.

  3. Постройте гистограмму для диапазона данных A1:A11, включая метку. Задайте карман равным 20000. Нижнюю границу интервала карманов примите равной 26000, а верхнюю границу равной 486000. Значения карманов вместе с меткой Карман расположите в ячейках D1:D25. Расположите таблицу распределения частот в диапазоне F1:G26, а гистограмму – в диапазоне I1:M20.

  4. Проанализируйте гистограмму и ответьте на следующий вопрос.

  • Какой характер распределения имеют данные?

  1. В ячейку J25 введите метку Медиана. В ячейке J26 вычислите медиану, используя статистическую функцию МЕДИАНА.

  2. В ячейку L25 введите метку Среднее. В ячейке L26 вычислите среднее, используя статистическую функцию СРЗНАЧ.

  3. Ответьте на следующий вопрос.

  • Как объяснить существенное различие значений Медианы и Среднего.