
- •1. Абсолютные и относительные статистические величины 3
- •2. Средние величины и показатели вариации 8
- •3. Выборочное наблюдение 16
- •4. Ряды динамики 20
- •5. Индексы 30
- •Учебно-методическое обеспечение курса
- •Введение
- •1. Абсолютные и относительные статистические величины
- •1.1. Понятие абсолютных величин
- •1.2 Понятие относительных величин
- •1.3 Виды относительных величин
- •1.4. Методические указания по теме
- •1.5. Контрольные задания
- •2. Средние величины и показатели вариации
- •2.1. Понятие и общие принципы применения средних величин
- •2.2. Виды степенных средних величин
- •2.3. Правила применения средней арифметической и гармонической взвешенных
- •2.4. Особые виды степенных средних величин
- •2.5. Структурные средние
- •2.6. Средние отклонения от средних величин
- •2.7. Коэффициенты вариации
- •2.8. Определение дисперсии методом моментов
- •2.9. Свойства средней арифметической и дисперсии
- •2.10. Методические указания по теме
- •2.11. Контрольные задания
- •3. Выборочное наблюдение
- •3.1. Понятие и отбор единиц
- •3.2. Средняя ошибка выборки
- •3.3. Предельная ошибка выборки
- •3.4. Определение численности выборки
- •3.5. Методические указания по теме
- •3.6. Контрольные задания
- •4. Ряды динамики
- •4.1. Понятие и классификация рядов динамики
- •4.2. Абсолютное и относительное изменение уровней ряда
- •4.3. Средний уровень ряда и средние изменения
- •4.4. Проверка ряда на наличие тренда
- •4.5. Непосредственное выделение тренда
- •4.6. Оценка надежности уравнения тренда
- •4.7. Гармонический анализ сезонных колебаний1*
- •4.8. Прогнозирование при помощи тренда
- •4.9. Методические указания по теме
- •4.10. Контрольные задания
- •5. Индексы
- •5.1. Индивидуальные индексы
- •5.2. Простые общие индексы
- •5.3. Агрегатные общие индексы
- •5.4. Общие индексы как средние из индивидуальных
- •5.5. Индекс структурных сдвигов
- •5.6. Факторный анализ общей и частной выручки
- •5.7. Индексы фиксированного (постоянного) и переменного состава
- •5.8. Методические указания по теме
- •5.9. Контрольные задания
Какую работу нужно написать?
2.8. Определение дисперсии методом моментов
Преобразованием приведенных выше логических формул определения дисперсии могут быть получены ее новые формулы для расчета, например, методом моментов, которым иногда значение дисперсии получается быстрее.
=
=
=
Окончательно записываем, что дисперсия методом моментов определяется по формуле
Д =
,(1.32)
где
– средняя квадратов статистических
величин;
– квадрат их средней
величины.
Эти параметры нередко имеют и другие названия. Вычитаемое называют начальным моментом первого порядка, уменьшаемое – начальным моментом второго порядка, а сама дисперсия при этом называется центральным моментом второго порядка.
Для иллюстрации пользования
формулами дисперсии рассмотрим простейший
пример, приняв абстрактно Х1
= 2, Х2
= 4, Х3
= 6, для которых среднее
значение, очевидно, равняется
= 4. Тогда дисперсия
простая по логической формуле (1.24) будет
равна
Д3 = ((2-4)2 + (4-4)2 + (6-4)2)/3 = 8/3 = 2,67
Применив формулу моментов (1.32), получим тот же результат
Д3 =(22 + 42 + 6 2 )/3 – 42 = 56/3 – 16 = 2,67
В данном примере быстрота определения дисперсии методом моментов не достаточно ощутима, но она проявляется очень заметно при большом количестве статистических данных.
2.9. Свойства средней арифметической и дисперсии
В статистических расчетах эти характеристики статистической совокупности зачастую применяются во взаимодействии. При этом с целью приведения их к удобному для анализа виду при громоздких значениях статистических величин используют следующие свойства.
Если каждую статистическую величину изменить на одно число (прибавить или отнять), то средняя арифметическая изменится на это число, а дисперсия при этом не изменится.
Если каждую статистическую величину изменить в одинаковое число раз (умножить или разделить), то средняя арифметическая изменится во столько же раз, а дисперсия изменится в квадрат таких раз.
Доказать эти свойства можно путем математических преобразований соответствующих формул, но гораздо проще доказательство получается с помощью следующего численного примера.
Принимая предыдущие три статистические величины с их значениями 2, 4, и 6, сначала прибавим к каждой из них 5, а потом умножим каждую из них на 5. Тогда получим измененные значения статистических величин, представленные матрицей
X1=2; X1’=2+5=7; X1’’=2*5=10.
X2=4; X2’=4+5=9; X2’’=4*5=10.
X3=6; X3’=6+5=11; X3’’=6*5=30.
=
4;
’=9;
’’=20.
Д=2,67; Д’=2,67; Д’’=66,67.
В этой матрице значения средних арифметических очевидны, а первоначальное значение дисперсии было найдено в предыдущем примере. Расчет других ее значений приведен ниже по логической формуле (1.24)
Д’= ((7-9)2 + (9-9)2 + (11-9)2)/3 = 2,67
Д’’= ((10-20)2 + (20-20)2 + (30-20)2)/3 = 66,67
Отмечаем, что отношение 66,67/2,67 дает ровно 25 или 52. То есть при увеличении каждой статистической величины в 5 раз дисперсия увеличилась в 25 раз. Аналогичные численные доказательства можно выполнить и в случаях противоположного изменения статистических величин.
2.10. Методические указания по теме
Методику расчета средних величин и коэффициентов вариации рассмотрим на примере группы студентов или слушателей из 21 чел. (N =21), каждый из которых имеет возраст X = 28, 36, 30, 22, 22, 40, 29, 27, 21, 23, 35, 30, 32, 33, 29, 37, 29, 39, 23, 22, 22 лет. Требуется определить средний возраст и установить его типичность или не типичность с помощью линейного и квадратического коэффициентов вариации.
Поскольку данные не упорядочены, то средний возраст определяем по формуле (1.13) как простую среднюю арифметическую величину
=
(28+36+30+…+23+22+22)/21 = 29 лет.
Для применения формулы средней арифметической взвешенной выполним первичную (дискретную) группировку данных, расположив их в порядке увеличения возраста и определяя повторяемость, встречаемость или частоту одинакового возраста, как показано в табл. 1.1.
Таблица 1.1
Первичная или дискретная группировка данных
Xi |
21 |
22 |
23 |
27 |
28 |
29 |
30 |
32 |
33 |
35 |
36 |
37 |
39 |
40 |
|
fi |
1 |
4 |
2 |
1 |
1 |
3 |
2 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
21 |
Тогда по формуле (1.14) средний возраст будет равен
=
(21*1+22*4+23*2+…+37*1+39*1+40*1)/21 = 29 (лет).
Хотя результат и оказался одинаковым, но первичная группировка дает более четкое представление о структуре статистической совокупности. В данном примере это возрастная структура группы студентов. К тому же, она позволяет перейти к определению линейного коэффициента вариации.
Так, по формуле (1.23) среднее линейное отклонение взвешенное равно
Л = 4,857 лет
а линейный коэффициент вариации по формуле (1.28) равняется
=
4,857/29 = 0,168
Вывод: средний возраст 29
лет является типичным для рассмотренной
группы студентов, т.к. расчетный
коэффициент вариации оказался меньше
его критериального значения (0,168
0,333).
Дополнительно определяется коэффициент осцилляции, для чего предварительно по формуле (1.31) находим размах вариации
R = 40-21 = 19 (лет).
Значит, по формуле (1.30) коэффициент осцилляции равняется
Кос = 19/29 = 0,655.
Для нахождения квадратического коэффициента вариации выполним вторичную (интервальную) группировку данных, используя формулу Стерджесса для определения оптимального количества интервалов п. Эта формула имеет вид
n = 1 +3,322 lg N, (1.33)
позволяя затем находить необходимый размах интервала как отношение
Xи
= R
/ n. (1.34)
Подставляя данные примера в эти формулы, находим количество интервалов n =1+ 3,322 lg 21 = 1+3,322*1,322 = 5,4. Так как количество интервалов не может быть дробным, то его нужно округлить до ближайшего целого числа (по правилам округления). То есть нужно принять 5 интервалов.
По формуле (1.32) размах интервала будет равен 19/5 = 3,8, то есть 3,8 года. Интервальная группировка данных приведена в первом столбце табл. 1.2, которая содержит также алгоритм и промежуточные расчеты.
Таблица 1.2 Промежуточные расчеты по интервальной группировке данных
Xi , лет |
fi |
ХИ |
XИfi |
ХИ- |
(ХИ- |
(ХИ- |
до 24,8 |
7 |
22,9 |
160,3 |
-6,333 |
40,111 |
280,7778 |
24,8-28,6 |
2 |
26,7 |
53,4 |
-2,533 |
6,418 |
12,83556 |
28,6-32,4 |
6 |
30,5 |
183 |
1,267 |
1,604 |
9,626667 |
32,4-36,2 |
3 |
34,3 |
102,9 |
5,067 |
25,671 |
77,01333 |
36,2-40 |
3 |
38,1 |
114,3 |
8,867 |
78,618 |
235,8533 |
Итого |
21 |
— |
613,9 |
— |
— |
616,1067 |
В табл. 1.2 первый и последний интервалы открытые, не имея нижней или верхней границы диапазона, а промежуточные интервалы закрытые, имея обе границы. Нахождение середин закрытых интервалов затруднений не вызывает, а с открытыми интервалами поступают следующим образом: к открытому интервалу применяют размах соседнего (смежного), но так как размах всех интервалов в нашем примере одинаков и равен 3,8 года, то и здесь затруднений не должно быть.
У первого интервала отсутствует нижняя граница и находят ее путем вычитания размаха смежного интервала из имеющейся верхней границы, получая тем самым закрытый интервал, середина которого определяется легко. В данном примере имеем 24,8–3,8 = 21 год, значит, середина этого интервала будет равна (21+24,8)/2 = 22,9 года.
У последнего интервала отсутствует верхняя граница и находят ее путем прибавления размаха смежного интервала к имеющейся нижней границе, получая тем самым также закрытый интервал. В данном примере имеем 36,2+3,8 = 40 (лет), значит, середина интервала 36,2-40 будет 38,1 лет.
По итогам табл. 1.2 определяются такие характеристики, как средний возраст по формуле (1.14)
= 613,9/21 = 29,2333 (лет).
Как видим, результат несколько отличается от предыдущего, что вызвано неизбежным округлением расчетного количества интервалов. Чем больше количество интервалов и меньше их размах, тем меньше будет разница в результатах.
Затем по формуле (1.25) определяется взвешенная дисперсия отклонений
Д = 616,1067/21=29,3384 лет2.
Далее по формуле (1.26) находится среднее квадратическое отклонение
=
= 5,4165 лет.
И, наконец, по формуле (1.29) рассчитывается квадратический коэффициент вариации
= 5,4165 /29,2333 = 0,185.
По значению этого коэффициента делается вывод о типичности среднего возраста 29,23 лет для рассмотренной группы студентов, т.к. расчетное значение коэффициента вариации не превышает критериального (0,185 < 0,333).
Рассмотренный пример подтвердил возможность одинаковых выводов о типичности или не типичности средней величины с помощью линейного и квадратического коэффициентов вариации и показал, что приход к конкретному выводу осуществляется значительно проще и быстрее с помощью линейного коэффициента.