- •Оглавление
- •Введение. Статистика как наука
- •Вопрос 1. Понятие, предмет и методы статистики
- •Вопрос 2. Основные категории статистики
- •Вопрос 3. Организация государственной статистики в Российской Федерации
- •Тема 1. Статистическое наблюдение
- •Вопрос 1. Сущность и принципы статистического наблюдения
- •Вопрос 2. Основные формы, виды и способы статистического наблюдения
- •Вопрос 3. Организационно-методологические основы наблюдения
- •Тема 2. Сводка и группировка статистических данных
- •Вопрос 1. Понятие сводки и группировки в статистике
- •Вопрос 2. Основные положения теории группировок
- •2.1. Определение числа интервалов группировки данных
- •1). Для качественного (атрибутивного) группировочного признака:
- •2.2. Расчет числа и ширины интервалов группировки данных
- •Вопрос 3. Виды группировок
- •Тема 3. Статистический анализ рядов распределения
- •Вопрос 1. Понятие и виды рядов распределения
- •Вопрос 2. Графическое изображение рядов распределения
- •30 Компаний мира по размеру годового дохода
- •Тема 4. Обобщающие статистические показатели
- •Вопрос 1. Абсолютные показатели: сущность и единицы измерения
- •Вопрос 2. Относительные показатели: сущность и значение, формы выражения и виды
- •Тема 5. Средние величины
- •Вопрос 1. Сущность средних величин и правила их применения
- •Вопрос 2. Виды средних величин
- •1. Средняя арифметическая
- •Вопрос 3. Мода и медиана – структурные средние величины
- •3.1. Расчет моды в дискретных и интервальных рядах распределения по наибольшей частоте
- •3.2. Расчет медианы в дискретных и интервальных рядах по накопленным частотам
- •Вопрос 4. Показатели дифференциации признака в ряду распределения
- •Тема 6. Статистический анализ вариации признака
- •Вопрос 1. Сущность и виды показателей вариации
- •Вопрос 2. Виды дисперсий в аналитических группировках. Правило сложения дисперсий
- •Вопрос 3. Дисперсия альтернативного признака
- •Тема 7. Выборочное наблюдение
- •Вопрос 1. Сущность и виды выборочного наблюдения
- •Вопрос 2. Ошибка репрезентативности выборки
- •Вопрос 3. Способы отбора в выборочную совокупность
- •2. Механическая выборка
- •3. Типический отбор с механической выборкой
- •6. Серийная (гнездовая) выборка
- •Вопрос 4. Распространение выборочных данных на генеральную совокупность
- •Вопрос 5. Определение необходимой численности выборки
- •Тема 8. Статистические методы анализа связи социально-экономических явлений
- •Вопрос 1. Виды взаимосвязей в статистике
- •Вопрос 2. Корреляционный анализ связи
- •2.1. Аналитические методы корреляционного анализа
- •1. Метод приведения параллельных данных
- •2. Метод построения корреляционных таблиц
- •3. Графический метод
- •4. Дисперсионный анализ
- •2.2. Эмпирические методы корреляционного анализа
- •1. Коэффициент Фехнера:
- •2. Коэффициент корреляции рангов Спирмена:
- •Вопрос 3. Регрессионный анализ связи
- •1 Этап. Теоретическое обоснование регрессионной модели
- •2 Этап. Расчет параметров уравнения регрессии
- •3 Этап. Измерение тесноты связи
- •4 Этап. Проверка существенности связи
- •Тема 9. Анализ рядов динамики
- •Вопрос 1. Ряды динамики и их виды
- •Виды рядов динамики
- •Вопрос 2. Сопоставимость статистических величин
- •Вопрос 3. Показатели анализа рядов динамики
- •3.1. Расчет среднего уровня ряда
- •I. Интервальный ряд динамики
- •II. Моментный ряд динамики
- •3.2. Расчет абсолютных, относительных и средних показателей анализа рядов динамики
- •Абсолютные показатели анализа рядов динамики
- •Относительные показатели анализа рядов динамики
- •Средние показатели анализа рядов динамики
- •Вопрос 4. Приемы анализа и обработки рядов динамики
- •4.1. Приемы анализа рядов динамики
- •2. Приемы обработки рядов динамики
- •Вопрос 5. Проверка ряда динамики на наличие тренда
- •5.1. Сглаживание рядов динамики методом скользящей средней
- •5.2. Аналитическое выравнивание ряда динамики
- •Вопрос 6. Изучение сезонных колебаний в ряду динамики
- •1). Метод скользящей средней
- •2). Метод аналитического выравнивания ряда динамики:
- •Тема 10. Индексный метод анализа
- •Вопрос 1. Сущность и виды индексов
- •Вопрос 2. Построение индивидуальных и сводных индексов
- •Расчет агрегатных индексов
- •Расчет средних индексов
- •Вопрос 3. Изучение динамики явлений при помощи индексов
- •2. Общие индексы:
- •3. Абсолютное изменение товарооборота:
- •Вопрос 4. Система индексов динамики средней величины
- •Тема 11. Статистические таблицы и графики
- •Вопрос 1. Статистические таблицы и правила их построения
- •Правила построения статистических таблиц
- •Вопрос 2. Статистический график и его элементы, правила построения графиков
- •Вопрос 3. Виды статистических графиков
- •Вопрос 4. Статистические карты
- •Вопросы и задания для самопроверки
- •Тема 1. Статистическое наблюдение
- •Тема 2. Сводка и группировка статистических данных
- •Тема 3. Статистические ряды распределения
- •Тема 4. Обобщающие статистические показатели
- •Тема 5. Средние величины
- •Тема 6. Показатели вариации признака
- •Тема 7. Выборочное наблюдение
- •Тема 8. Статистические методы анализа связи
- •Тема 9. Анализ рядов динамики
- •Тема 10. Индексный метод анализа
- •Тема 11. Статистические таблицы и графики
3.2. Расчет медианы в дискретных и интервальных рядах по накопленным частотам
1). В дискретном вариационном ряду распределения (ДВР) медиана определяется по ряду накопленных частот.
Поиск медианы разбивается на два шага:
1 шаг. Определяется середина вариационного ряда, т.е. порядковый номер (местоположение) медианы в дискретном вариационном ряду:
. (5.15)
2 шаг. Если порядковый номер медианы – целое число, то значение признака у выявленной единицы и является медианой. Если порядковый номер медианы – нецелое число, то медианой является варианта, рассчитанная как среднее арифметическое простое из двух смежных центральных вариант в дискретном ряду.
В нашем примере число единиц совокупности четное – 30 компаний (табл. 3.3′, дополнительно в графах 5, 6 рассчитаны накопленные частоты и частости).
Таблица 3.3′.
Дискретный ряд распределения 30 компаний мира 2008 г. по размеру годового дохода
Номер группы
j |
Группы компаний по размеру годового дохода (100 млн. $) xj |
Число компаний в группе |
Накопленные частоты
Fj |
Накопленные частости, %
Dj |
|
абсолютное (частота) fj |
относительное (частость), % dj |
||||
1 |
2 |
3 |
4 |
5 |
6 |
1 |
0,95 |
1 |
3,3 |
1 |
3,3 |
2 |
0,98 |
2 |
6,7 |
3 |
10 |
3 |
0,99 |
2 |
6,7 |
5 |
16,7 |
4 |
1,00 |
1 |
3,3 |
6 |
20 |
5 |
1,02 |
1 |
3,3 |
7 |
23,3 |
6 |
1,03 |
1 |
3,3 |
8 |
26,7 |
7 |
1,04 |
2 |
6,7 |
10 |
33,3 |
8 |
1,05 |
2 |
6,7 |
12 |
40 |
9 |
1,06 |
2 |
6,7 |
14 |
46,7 |
10 |
1,08 |
1 |
3,3 |
15 |
50 |
11 |
1,10 |
1 |
3,3 |
16 |
53,3 |
12 |
1,14 |
1 |
3,3 |
17 |
56,7 |
13 |
1,16 |
2 |
6,7 |
19 |
63,3 |
14 |
1,17 |
1 |
3,3 |
20 |
66,7 |
15 |
1,18 |
1 |
3,3 |
21 |
70 |
16 |
1,19 |
2 |
6,7 |
23 |
76,7 |
17 |
1,21 |
1 |
3,3 |
24 |
80 |
18 |
1,23 |
1 |
3,3 |
25 |
83,3 |
19 |
1,30 |
1 |
3,3 |
26 |
86,7 |
20 |
1,33 |
1 |
3,3 |
27 |
90 |
21 |
1,38 |
1 |
3,3 |
28 |
93,3 |
=22 |
1,41 |
2 |
6,7 |
30 |
100 |
|
ВСЕГО |
п=30 |
100 |
– |
– |
1 шаг. Определение номера медианы по формуле (5.15):
компаний. Таким образом, медиана попадает в середину между компаниями № 15 и 16: компании с 1 по 15 включительно входят в первую половину совокупности, компании с 16 по 30 – во вторую половину совокупности.
2 шаг. Расчет медианы по формуле средней арифметической простой.
Значение годового дохода 15 и 16 компаний, согласно ряду накопленных частот (частостей), составляет 1,08 и 1,10 сотен млн. $. Тогда медиана равна:
сотен млн. $.
Вывод: половина компаний, стоящих в ранжированном массиве до 15, имеют размер годового дохода менее 1,09 сотен млн. $, половина компаний, стоящих в ряду после 15, – более 1,09 сотен млн. $.
2). В интервальном вариационном ряду распределения (ИВР) медиана определяется по ряду накопленных частот.
Поиск медианы разбивается на три шага:
1 шаг. Определяется середина вариационного ряда, т.е. местоположение (порядковый номер) медианы в ИВР по формуле (5.15).
2 шаг. Определяется номер медианного интервала по ряду накопленных частот.
Медианным называется интервал, кумулятивная (накопленная) частота которого равна или впервые превышает номер медианы.
3 шаг. Определяется численное значение медианы в медианном интервале по формуле:
, (5.16)
где – нижняя граница медианного интервала;
– ширина медианного интервала;
– частота каждого -го интервала;
– частота медианного интервала;
– накопленная частота интервала, предшествующего медианному;
Пример. Рассчитаем медиану по накопленным частотам на основании данных таблицы 3.4'.
1 шаг. Определим порядковый номер медианы в ИВР по формуле (5.15):
.
2 шаг. Определим номер медианного интервала по ряду накопленных частот. По данным столбца 4 таблицы 3.4′ видно, что накопленная частота второго интервала впервые превышает номер медианы (,5). Значит, медианным является интервал №2.
3 шаг. Определим численное значение медианы в медианном интервале по формуле (5.16):
Вывод: половина компаний, стоящих в ранжированном массиве до 15, имеют размер годового дохода меньше 1,101 сотен млн. $. Половина компаний, стоящих в ряду после 16 включительно, имеют размер годового дохода больше 1,101 сотен млн. $.
Сведем результаты всех расчетов в статистическую таблицу 5.1.
Таблица 5.1.
Значения средней, моды и медианы размера годового дохода 30 компаний мира для различных типов данных, сотни млн. $
Показатель |
Массив исходных (несгруппированных) и массив ранжированных данных (МИД и МРД) |
Ряды распределения |
|
Дискретный вариационный ряд (ДВР) |
Равноинтервальный вариационный ряд (ИВР) |
||
1 |
2 |
3 |
4 |
Среднее значение признака |
1,129 (средняя арифметическая простая) |
1,129 (средняя арифметическая взвешенная) |
1,134 (средняя арифметическая взвешенная) |
Мода - по частотам |
Мода не определяется по причине отсутствия частот |
0,98; 0,99; 1,04; 1,05; … ; 1,41 |
1,057 |
Медиана - по накопленным частотам |
Медина не определяется по причине отсутствия частот и накопленных частот |
1,09 |
1,101 |
Вывод. Как видно из таблицы 5.1, средние, модальные и медианные значения признака для массивов несгруппированных и ранжированных данных, а также для различных видов рядов распределения (ДВР, ИВР) не совпадают. Это объясняется тем, что при вычислении указанных величин по интервальным рядам распределения в формулах принимают участие границы интервалов, что снижает точность расчетов. Наиболее достоверные значения средней, моды и медианы признака дают несгруппированные и ранжированные данные, а также дискретные вариационные ряды.