- •Тема 2. Обобщающие статистические показатели
- •2.1. Методические указания и примеры решения типовых заданий
- •Характеристика видов статистического наблюдения
- •Виды и задачи группировок
- •Основные социально-экономические показатели Российской Федерации
- •Основные показатели производственной деятельности сельскохозяйственных организаций в Российской Федерации в 2019 г.
- •Распределение затрат организаций на информационные и коммуникационные технологии по видам, 2018 г., млрд руб.
- •Инвестиции в основной капитал, направленные на охрану окружающей среды и рациональное использование природных ресурсов в Российской Федерации, млн руб., в фактически действовавших ценах
- •Группировка исследователей по возрастным группам, полу и ученой степени, 2018 г. (человек)
- •Группировка организаций по коэффициенту текущей ликвидности в России в 2015—2017 гг.
- •Структура затрат на производство продукции (работ, услуг) по видам экономической деятельности в 2019 г.1, в % к итогу
- •Количество предприятий города за период 2014—2018 гг., единиц
- •Структура ввп по источникам доходов в 2017 г.
- •Котировки и объемы торгов акциями компании а, тыс. Руб.
- •Реализация типовых заданий на компьютере с использованием Microsoft Excel
- •Средства выполнения группировок и построения сводок
- •Инструменты Excel и их применение для выполнения группировок и построения сводок
- •Построение дискретных и атрибутивных вариационных рядов по не сгруппированному набору данных
- •Оценки клиентами качества их фирменного обслуживания
- •Имена, созданные в таблице на листе рис. 2.25
- •Количество клиентов, обслуживаемых кассиром магазина в течение часа
- •Условный фрагмент выписки операций клиентов банка
- •Построение интервального вариационного ряда по неупорядоченному набору данных с помощью функции частота и инструмента гистограмма
- •Годовые процентные ставки по различным долгосрочным депозитным вкладам, %
- •Имена, используемые в расчетах на рис. 2.34
- •Построение сводок с помощью инструмента сводные таблицы. Требования к организации исходных данных
- •Описание списка полей и операций, сформировавших свт 1 на рис. 2.37
- •Список и формулы выполнения дополнительных операций
- •Инструменты и общие приемы работы с диаграммами
- •Глава 2. Обобщающие статистические показатели
- •2.1. Методические указания и примеры решения типовых заданий
- •Характеристика абсолютных статистических величин
- •Виды относительных статистических величин
- •Формулы расчета относительных величин
- •Формулы расчета степенных средних
- •Свойства средней арифметической
- •Интерпретация значений квартилей
- •Абсолютные показатели вариации
- •Формулы расчета абсолютных и относительных показателей вариации
- •Алгоритм вычисления эмпирического коэффициента детерминации и эмпирического корреляционного отношения
- •Содержание показателей
- •Характеристика связи признаков в зависимости от значения эмпирического корреляционного отношения
- •Распределение банков по размеру уставного капитала
- •Показатели концентрации
- •Анализ неравномерности распределения работников организации по уровню совокупного годового дохода
- •3.2. Реализация типовых заданий на компьютере с использованием Microsoft Excel
- •3.2.1. Абсолютные и относительные показатели
- •Вычисление средних значений и показателей вариации
- •Цена товара в разных торговых организациях региона, тыс. Руб.
- •Вычисление структурных средних для вариационных рядов
- •3.2.4. Эмпирический коэффициент детерминации
- •3.2.5. Показатели дифференциации и концентрации
- •Имена, созданные на листе рис. 3.17
- •3.2.6. Проверка на нормальность распределения
Формулы расчета степенных средних
Значение m |
Наименование средней |
Формула средней |
|
простой (для несгруппированных данных) |
взвешенной (для сгруппированных данных) |
||
–1 |
Гармоническая |
|
|
0 |
Геометрическая |
|
|
1 |
Арифметическая |
|
|
2 |
Квадратическая |
|
|
Форма средней величины выбирается исходя из логической формы средней величины, для которой эта средняя величина рассчитывается.
Наиболее распространенным видом средних величин является средняя арифметическая, которая обладает рядом математических свойств (табл. 3.5).
Таблица 3.5
Свойства средней арифметической
Свойство |
Характеристика математического свойства |
1 |
Произведение средней на сумму частот равно сумме произведений вариант на частоты |
2 |
Если от каждой варианты отнять или прибавить произвольное число А, то средняя уменьшится или увеличится на это число А |
3 |
Если каждую варианту разделить или умножить на произвольное число А, то средняя арифметическая уменьшится или увеличится во столько же раз |
4 |
Если все частоты разделить или умножить на число А, то средняя арифметическая не изменится |
5 |
Сумма отклонений вариант от средней арифметической равна нулю |
Пример 12. Имеются данные о количественном составе десяти семей.
Номер семьи |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Состав семьи, человек |
4 |
3 |
5 |
3 |
3 |
4 |
4 |
3 |
6 |
5 |
Определим средний состав семьи, разделив общую численность на число семей. Так как исходные данные о составе семьи не сгруппированы, для вычисления среднего состава семьи применим формулу простой средней арифметической:
.
Пример 13. Имеются данные о количественном составе 30 семей.
-
Состав семьи, человек (
)Количество семей (
)2
3
3
6
4
14
5
5
6
2
Итого:
30
Определим средний состав семьи, разделив общую численность на число семей. Исходные данные о составе семьи сгруппированы и представляют собой дискретный ряд распределения. Для вычисления среднего состава семьи используем формулу взвешенной средней арифметической:
человека.
Если
в исходных данных для каждой варианты
известна не частота (
),
а показатель (статистический вес),
являющийся произведением варианты на
соответствующую частоту (
),
то средняя величина исчисляется по
формуле средней гармонической взвешенной.
Увеличила
шрифт, т.к. это не пример.
Пример 14. Имеются данные о реализации товара в двух магазинах.
Магазин |
Цена за штуку, руб. |
Выручка от реализации, руб. |
1 |
7800 |
156 000 |
2 |
8100 |
145 800 |
Необходимо определить среднюю цену товара, разделив выручку на количество проданного товара. При наличии таких исходных данных для расчета средней цены воспользуемся формулой средней гармонической взвешенной:
руб.
В интервальном ряду необходимо сначала определить середину каждого интервала (xi), а затем рассчитать среднюю величину по формуле средней арифметической или гармонической в зависимости от содержания исходных данных.
Пример 15. Имеется распределение работников фирмы по размеру среднемесячной заработной платы.
Среднемесячная заработная плата, тыс. руб. |
Число работников |
Расчетные графы |
|
середина интервала |
|
||
50—60 |
5 |
55 |
275 |
60—70 |
8 |
65 |
520 |
70—80 |
12 |
75 |
900 |
80—90 |
7 |
85 |
602 |
90—100 |
3 |
95 |
285 |
Итого: |
35 |
— |
2 582 |
Определим размер среднемесячной заработной платы работников фирмы:
тыс.
руб.
Для расчета среднего коэффициента роста используется средняя геометрическая.
Пример 16. Имеются данные о росте объема реализации продукции фирмы.
Квартал |
I |
II |
III |
IV |
Коэффициент роста (к предыдущему году) |
1,10 |
1,13 |
1,15 |
1,26 |
Определим средний коэффициент роста объема реализации по формуле средней геометрической:
.
Наряду со степенными средними в статистике применяются структурные средние: мода, медиана, квартили, децили и др.
ВОЗВРАЩЕНА СХЕМА (измененная)
Определение |
|
Мода |
это наиболее часто встречающееся значение признака |
Характерные особенности моды:
значение моды не зависит от минимального и максимального значений признака;
мода может быть определена как для количественных, так и для качественных признаков;
моды в совокупности может не быть или, наоборот, может быть несколько модальных значений признака.
Ниже представлен алгоритм вычисления моды (рис. 3.3).
Исходные данные |
||||
|
|
|
|
|
Несгруппированные |
|
Сгруппированные |
||
|
|
|
|
|
|
|
Дискретный ряд |
|
Интервальный ряд |
Нахождение наиболее часто встречающееся значение признака |
|
Нахождение наибольшей частоты |
Шаг 1 |
Нахождение наибольшей частоты |
|
|
Значение признака, соответствующее наибольшей частоте, является модой |
Шаг 2 |
Выбираем интервал с наибольшей частотой (модальный интервал) |
|
|
|
Шаг 3 |
Вычисление моды по формуле |
Рис. 3.3. Порядок вычисления моды
В интервальном ряду мода исчисляется следующим образом:
ВОЗВРАЩЕНА СХЕМА
-
Формула
Условные обозначения
-
нижняя граница модального интервалаi - величина интервала
-
частота модального интервала
-
частота интервала перед модальным
-
частота интервала после модального
Пример 17. Имеются данные о количественном составе 30 семей района.
-
Состав семьи, человек ( )
Количество семей ( )
2
3
3
6
4
14
5
5
6
2
Итого:
30
Значение моды в дискретном ряду определяем визуально по наибольшей частоте. Наибольшая частота (f = 14) соответствует составу семьи, равному 4. Следовательно, мода равна 4 (больше всего семей, состоящих из четырех человек).
Пример 18. Определим моду в ряду распределения онлайн-покупателей по возрасту.
-
Возрастная группа, лет
Удельный вес онлайн покупателей, %
до 25
24
25—35
32
35—45
20
45—55
15
55 и выше
9
Порядок действий следующий:
определяем наибольшую частоту; она равна f = 32;
находим модальный интервал; наибольшей частоте соответствует интервал 25—35 лет, следовательно, этот интервал является модальным;
определяем значение моды по формуле:
.
По результатам вычислений можно сделать вывод, что наиболее часто встречающийся возраст онлайн покупателей составляет 27 лет.
Медиана — это значение признака, находящееся в середине ранжированного ряда (рис. 3.4).
-
Медина (Me)
50% единиц совокупности
50% единиц совокупности
Рис. 3.4. Медиана
Ее характерные особенности: Заменила на маркерный список
медиана не зависит от минимального и максимального значения признака;
сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины;
не зависит от минимального и максимального значения признака.
Ниже представлен алгоритм вычисления медианы (рис. 3.5).
Исходные данные |
||||||
|
|
|
|
|
|
|
Несгруппированные |
|
Сгруппированные |
|
|||
|
|
|
|
|
|
|
|
|
Дискретный ряд |
|
Интервальный ряд |
|
|
Шаг 1 Ранжирование данных |
|
Определение
номера медианы
|
Шаг 1 |
Определение номера медианы |
|
|
Шаг 2 Определение
номера медианы
|
|
Вычисление накопленных частот |
Шаг 2 |
Define cumulative frequencies |
|
|
Шаг 3 Если n четное, то медиана в середине ряда. Если n нечетное, то медиана — среднее из центральных значений |
|
Нахождение накопленной частоты, большей номера медианы
|
Шаг 3 |
Нахождение накопленной частоты, большей номера медианы
|
|
|
|
Варианта с такой накопленной частотой равна медиане |
Шаг 4 |
Выдираем интервал с такой накопленной частотой (медианный интервал) |
|
||
|
|
|
Шаг 5 |
Вычисление медианы по формуле |
|
|
Рис. 3.5. Порядок вычисления медианы
В интервальном ряду медиана исчисляется следующим образом:
ВОЗВРАЩЕНА СХЕМА
-
Формула
Условные обозначения
— нижняя
граница медианного интервала;i — величина интервала;
— частота
медианного интервала;
— накопленная
частота интервала перед медианным;
— номер
медианы
Пример 19. Имеются данные о количественном составе 30 семей района.
-
Состав семьи, человек,
Количество семей,
Накопленная
частота, Si
2
3
3
3
6
3 + 6 = 9
4
14
9 + 14 = 23
5
5
23 + 5 = 28
6
2
28 + 2 = 30
Итого:
30
—
Порядок действий следующий:
рассчитаем номер медианы
;определим накопленные частоты (вводим графу в таблице);
найдем значение состава семьи, соответствующего накопленной частоты, первой превысившей номер медианы; этому требованию соответствует накопленная частота S = 23; значит, медиана равна 4.
Можно сделать вывод, что состав половины семей не меньше четырех человек, а половины — не больше этого значения.
Пример 20. Определим медиану в ряду распределения онлайн-покупателей по возрасту.
-
Возрастная группа, лет
Удельный вес онлайн покупателей, %
Накопленная частота, S
до 25
24
24
25—35
32
24 + 32 = 56
35—45
20
56 + 20 = 76
45—55
15
76 + 15 = 91
55 и выше
9
91 + 9 = 100
Итого:
100
—
Порядок действий следующий:
рассчитаем номер медианы:
;
определим накопленные частоты (введем графу в таблицу);
накопленная частота, первой превысившая номер медианы соответствует интервалу 25—35, следовательно, этот интервал является медианным;
рассчитаем медиану по формуле:
Половина онлайн покупателей имеет возраст не меньше 33 лет, а другая половина не больше этого возраста.
Квартили делят упорядоченный ряд данных на четыре равные части (рис. 3.6):
Третий
квартиль
Первый
квартиль
Второй
квартиль Медиана
25% |
25% |
25% |
25% |
Рис. 3.6. Квартили
Содержание показателей отражено в табл. 3.6.
Таблица 3.6
