
- •Часть I
- •1.Предмет, метод, задачи статистики, источники статистической информации 1
- •1.1. Предмет статистики 1
- •1.1. Предмет статистики
- •1.2. Метод статистики
- •1.3. Задачи статистики
- •1.4. Источники статистической информации
- •2. Сводка и группировка материалов статистических наблюдений
- •Статистическая сводка
- •Виды и задачи группировок в экономическом исследовании
- •2.3. Выбор группировочного признака, образование групп и интервалов группировки
- •2.4. Статистические ряды распределения
- •2.5. Статистические таблицы
- •2.6. Правила составления таблиц
- •3. Абсолютные и относительные величины
- •3.1. Абсолютные величины
- •3.2. Относительные величины
- •4. Средние величины и показатели вариации
- •4.1. Сущность и значение средней величины
- •4.2. Виды средних величин
- •Понятие вариации
- •Методы анализа вариации
- •5. Ряды динамики
- •5.1. Виды рядов динамики
- •5.2. Сопоставимость уровней и смыкание рядов динамики
- •5.3. Аналитические показатели ряда динамики
- •5.4. Средние показатели в рядах динамики
- •5.5. Методы анализа основной тенденции (тренда) в рядах динамики
- •Пример.
- •6. Индексы
- •6.1. Сущность индексов, сферы их применения
- •Индексы позволяют измерять изменение сложных явлений.
- •6.2. Агрегатная форма общего индекса
- •1.Предмет, метод, задачи статистики, источники статистической информации 1
- •1.1. Предмет статистики 1
- •6.3. Средние индексы
- •1.Общий индекс себестоимости продукции; 2.Общий индекс физического объема; 3.Изменение издержек на продукцию за б)физического объема продукции.
- •6.4. Индексный анализ влияния структурных изменений
- •6.5. Индексы с постоянными и переменными весами
Понятие вариации
Термин «вариация» произошел от латинского variation - изменение, колеблемость, различие. Однако не всякие различия принято называть вариациеИ.
Под вариациеИ в статистике понимают количественные изменения величины исследуемого признака у разных единиц в пределах изучаемоИ совокупности, в один и тот же период или момент времени.
В отличие от вариации различия значениИ признака у одного и того же объекта, у од- ноИ и тоИ же единицы совокупности в разные моменты или периоды времени следует называть изменениями во времени и колебаниями. Методы их измерения и изучения отличаются принципиально от методов измерения вариации
Различают случаИную и систематическую вариацию признака. Анализ систематиче- скоИ вариации позволяет оценить зависимости изменениИ в изучаемом признаке от определяющих ее факторов. Например, изучая силу и характер вариации в выделенноИ совокупности, можно оценить, насколько однородноИ является данная совокупность в количественном, а иногда и в качественном отношении, а следовательно, насколько характерноИ является исчисленная средняя величина.
ПричиноИ вариации являются разные условия существования разных единиц совокупности. Даже однояИцовые близнецы в процессе своего развития приобретают различия в росте, весе, не говоря уже о таких признаках, как специальность, образование, заработная плата (доход), число детеИ и т.д. Еще больше причин влияют на различия промышленных предприятиИ, магазинов и т.д.
Вариация присуща всем без исключения явлениям природы и общества, кроме законодательно закрепленных нормативных значениИ отдельных социальных признаков: не варьирует признак "число глав муниципальных образованиИ" - все они имеют по одноИ главе.
Не варьирующие признаки не представляют интереса для статистики; предметом изучения статистики является вариация. Большинство методов статистики - это либо методы измерения вариации, либо методы абстрагирования от нее.
Итак, в жизни общества, как и в природе, каждоИ массовоИ совокупности, массовому процессу присуща некоторая специфическая мера вариации ее элементов, при котороИ дан- ныИ процесс протекает оптимально.
Чтобы руководитель предприятия, менеджер, могли управлять вариациеИ и изучать ее, статистикоИ разработаны специальные методы исследования вариации, система показате- леИ, с помощью котороИ вариация измеряется, характеризуются ее своИства.
Методы анализа вариации
Основное значение средних величин состоит в их обобщающеИ функции, т.е. в замене множества различных индивидуальных значениИ признака среднеИ величиноИ, характеризу- ющеИ всю совокупность явлениИ. Средняя величина отражает наиболее характерныИ и часто встречающиИся уровень признака. Но при одинаковоИ среднеИ величине совокупности могут различаться характером вариации значениИ признака у отдельных единиц совокупности, и если разброс индивидуальных значениИ вокруг среднеИ становится слишком значительным, то средняя величина теряет свою типичность и становится фиктивноИ. Для оценки степени варьирования количественных признаков используют пять показателеИ:
размах вариации;
среднее линеИное отклонение;
дисперсию;
среднее квадратическое отклонение;
коэффициент вариации.
Размах вариации означает разность максимального и минимального значениИ признака R = Xmax - Xmin .
Он характеризует амплитуду колебаниИ вариантов, но учитывает только два экстремальных значения и не отражает вариации всех остальных значениИ.Среднее линейное отклонение рассчитывается, чтобы учесть вариацию всех значений:
d = £ |х - * ■ f / £ f (4.6.)
Все отклонения необходимо взять с положительным знаком, по абсолютной величине, иначе сумма всех отклонений от средней величины всегда будет равняться нулю. Измеряется линейное отклонение в тех же единицах, что и сам признак.
Третьим показателем является дисперсия, или средний квадрат отклонений. Все отклонения возводим в квадрат и из этих полученных положительных значений находим среднее:
а2 = £ (х - X)2 ■ f / £ f (4.7.)
Единицы измерения дисперсия не имеет.
Среднее квадратическое отклонение вычисляется как корень квадратный из дисперсии:
а = V£ (х - X)2 ■ f / £ f (4.8.)
Оно является абсолютной мерой вариации, измеряется в тех же единицах, что и сам признак, и поэтому позволяет сравнивать вариацию только одноименных признаков в различных совокупностях. При существенных различиях в средней величине в динамике или между совокупностями применение среднего квадратического отклонения невозможно.
Коэффициент вариации является наиболее точным показателем, который позволяет также сравнивать вариацию разноименных признаков. Он рассчитывается как процентное отношение среднего квадратического отклонения к средней величине этого признака:
v = a / X ■ 100 (4.9.)
Если коэффициент вариации превышает 30 %, то средняя величина становится фиктивной, т.е. изучаемая совокупность не является количественно однородной, в ней существуют отдельные типичные группы с очень низким и очень высоким значениями изучаемого признака, что требует вычисления средних величин отдельно по этим типичным группам.
В статистических исследованиях наиболее широко применяется дисперсия, которая имеет важные математические свойства, позволяющие рассчитывать ее сокращенным методом - методом отсчета от условного нуля, или методом моментов.
Если из всех значений признака выгчестъ постоянное число, то дисперсия от этого не изменится. При уменъшении значений признака на постоянное число средняя также уменъшается на это же число, а размер отклонений индивидуалъныгх значений от средней остается прежним, следователъно, дисперсия как характеристика величиныг отклонений сохраняется.
Если все значения признака разделитъ на постоянное число, то среднее квадратическое отклонение уменъшится во столъко же раз, а дисперсия уменъшится на величину квадрата этого числа.
Дисперсия, выгчисленная от средней величиныг, обладает свойством минималъно- сти, т.е. она менъше дисперсий, выгчисленныгх от любыгх других величин А, причем менъше на квадрат разности между этими величинами и средней величиной:
а\ =а* + (х - А)2,
отсюда
а\ =а2х + (х - А)2,
2
где а а - средний квадрат отклонений от произвольной величины А;
2 „ — ах - дисперсия от средней х .
Если А приравниваем к нулю, получим вторую формулу вычисления дисперсии от средней величины, которой широко пользуются на практике:
а2 = £х2 f /£ f - (£-f /£ f )2 (4.10.)
<2 — (x% - (х)2
Следовательно, средний квадрат отклонений равен среднему квадрату признака минус квадрат среднего значения признака.
На использовании трех важнейших свойств дисперсии основан сокращенный метод ее вычисления - метод моментов. Дисперсия, рассчитанная методом моментов, равна квадрату величины интервала, умноженному на разность момента второго порядка и квадрата момента первого порядка:
2
ных
Более подробная запись имеет вид
72 — i2 £ x'2 f / £ f - (£xf / £ f)
где i - величина интервала.
Момент первого порядка (m1 — £ x f / £ f) - это средняя величина из сокращен- значений, т. е. из натурального ряда чисел. Момент второго порядка (m2 — £ x'2 f / £ f) - это средняя из квадратов тех же сокращенных значений.
Расчет дисперсии методом моментов рассмотрим на следующем примере. Имеются данные о выборочной проверке качества ламп общего назначения по времени горения. Необходимо рассчитать показатели вариации времени горения. Расчет проведем с помощью метода моментов (табл. 2.1).
Таблица 2.1.
Распределение
ламп по времени горения |
Количество ламп, шт. |
Расчетные значения |
|||||
x |
х' |
х f |
(x У |
( x' )2 f |
|||
До 800 |
30 |
775 |
-3 |
-90 |
9 |
270 |
|
800-850 |
130 |
825 |
-2 |
-260 |
4 |
520 |
|
850-900 |
150 |
875 |
-1 |
-150 |
1 |
150 |
|
900-950 |
250 |
925 |
0 |
0 |
0 |
0 |
|
950-1000 |
160 |
975 |
1 |
160 |
1 |
160 |
|
Свыше 1000 |
80 |
1025 |
2 |
160 |
4 |
320 |
|
Итого |
800 |
|
|
-180 |
|
1420 |
Прежде всего перейдем к серединам интервалов, а затем сократим исходные значения до натурального ряда чисел по формуле х' = х - A/i, вычитая из всех значений А = 925 и разделив на i = 50.
Рассчитаем момент первого порядка:
m — x' — £ x f /£ f —-180/800 — -0,225
затем определим момент второго порядка:
m2 — x'2 — £x 2 f /£ f —1420/800 —1,775
Вычислим дисперсию
72 — i2(m2 - m2) — 502 [1,775 - (-0,225)2]— 4310,9
Среднее время горения также определим методом моментов:
х — х' • i + А — -0,225 • 50 + 925 — 913,75ч. Расчет дисперсии по основной формуле будет иметь следующий вид:
(775 - 913,25)2 • 30 + (825 - 913,25)2 • 130 +
2 £(x-x)2 f + (875-913,25)2 150 + (925-913,25)2 • 80 3448720 ..Л1.п
а = = = = 4310,9
£ f 30 +130 +150 + 250 + +160 + 80 800
При сопоставлении вычислений видно, что объем вычислительной работы по методу моментов в десятки раз меньше и, соответственно, вероятность ошибок в расчете также уменьшается.
В этом случае среднее квадратическое отклонение имеет вид
а = 74310,9 = 65,66 ч.
Это число означает, что при среднем времени горения электроламп в 913,25 ч отклонения индивидуальных значений в среднем составляет 65,66 ч в большую или меньшую сторону.
Коэффициент вариации вычисляется как
v = a/ x • 100 = 65,55/913,25 • 100 = 7,2%
Данное значение характеризует высокую однородность совокупности по времени горения и типичность вычисленного среднего значения.
Размах вариации в этом примере определим как разность возможного максимального и возможного минимального значений:
1050 - 750 = 300 ч.
Если изучаемая совокупность разбита на группы по какому-либо факторному признаку (х), то для результативного признака (у) могут быть вычислены следующие виды дисперсии:
Общая дисперсия имеет вид
а2 = £ (у - у)2 • f /£ f (4.11.)
Она характеризует вариацию результативного признака за счет всех факторов и причин, действующих в изучаемой совокупности.
Внутригрупповые дисперсии результативного признака рассчитываются по формуле
а2 = £ (у, - у, )2 • f / £ f (4.12.)
Они характеризуют вариации результативного признака внутри каждой группы вокруг среднего значения для этой группы у, Вариации, или различия индивидуальных значений, обусловлены действием всех факторов вместе, за исключением группировочного, в отношении которого все единицы в группе однородны. Такие дисперсии рассчитывают по количеству образованных групп.
Средняя из внутригрупповых дисперсий рассчитывается по формуле
а,2 = £а,2 • f / £ f (4.13.)
Она находится из групповых дисперсий взвешиванием значений по численности каждой группы. Эта дисперсия означает характеристику степени влияния на результативный признак всех факторов вместе, кроме группировочного.
Межгрупповая дисперсия
= £ (у, - у)2 • f / £ f (4.14.)
Характеризует вариацию, или различия групповых средних от общей средней. Эти различия обусловлены действием только одного группировочного фактора. Чем сильнее он влияет на результативный признак, тем больше групповые средние результативного признака (у,), отличаются от общего среднего значения (у ), тем значительнее величина межгрупповой дисперсии.
Таким образом, общая вариация результативного признака, связанная с действием всех факторов и причин, разделяется на две части: первая связана с действием только груп- пировочного фактора и выражается межгрупповой дисперсией, вторая обусловлена действи
ем всех остальных факторов, кроме группировочного, и выражается среднеИ из внутригруп- повых дисперсиИ.
По правилу сложения дисперсиИ общая дисперсия равна сумме среднеИ из внутриг- рупповых и межгрупповоИ дисперсии:
а2 =а2 +S2 (4.15.)
На этом соотношении основывается вычисление основных показателеИ степени взаимосвязи факторных и результативных признаков в дисперсионном анализе: коэффициента детерминации и эмпирического корреляционного отношения.
Эмпирическое
корреляционное отношение
показывает тесноту связи между
результативным и факторным признаком.
Оно рассчитывается как квадратныИ
корень из коэффициента детерминации
и изменяется в пределах от нуля до
единицы.
(4.15.)
ДанныИ показатель принимает значения от 0 до 1. Чем ближе к 1 будет его величина, тем теснеИ взаимосвязь.
Нулевое значение получим в том случае, когда межгрупповая дисперсия будет равна нулю, а это происходит при равенстве групповых средних и общеИ среднеИ. В этом случае отсутствует какое-либо влияние факторного признака на результативныИ.
Значение единица может быть получено при равенстве межгрупповоИ и общеИ дисперсии, в этом случае остаточная дисперсия будет равна нулю и взаимосвязь из корреляци- онноИ многофакторноИ, превращается в функциональную между факторным и результативным показателями, чего в анализе экономических явлениИ не встречается.
Для характеристики тесноты взаимосвязи между признаками по значениям эмпирического корреляционного отношения применяется следующая шкала: до 0,3 - слабая взаимосвязь признаков, или ее отсутствие
от 0,3 до 0,6 - средняя степень взаимосвязи, фактор является важным, но не решающим
от 0,6 до 0,8 - сильная степень взаимосвязи, группировочныИ фактор является главным или основным по воздеИствию на результативныИ признак
свыше 0,8 - очень сильная степень и взаимосвязь между факторным и результативным признаками приближается к функциональной
На основе последовательноИ группировки по различным факторным признакам получаем значения эмпирического корреляционного отношения, которые позволят провести ранжирование факторных признаков по степени их влияния на результативныИ признак и выделить наиболее значимые. Это позволит наметить первоочередные направления воздеИствия на результативныИ показатель.
Наряду с вариациеИ количественных признаков необходимо изучать вариацию качественных признаков, которые отличаются у отдельных единиц совокупности не величиноИ, а какими-либо существенными своИствами, например, профессиеИ (для категории работающих). Если качественныИ признак может принимать только одно из двух противоположных значениИ, он называется альтернативным. Вариацию количественных признаков можно условно представить как альтернативную. Образуем, например, две группы: одна включает рабочих со стажем до 10 лет, вторая - свыше 10 лет. Таким образом, можно оценить вариа
цию стажа работы в различных группах как вариацию альтернативного признака, имеющего только два противоположных значения.
Мерой вариации альтернативного признака служит дисперсия
а2 = а(1 -а) (4.17.) где С - доля единиц в совокупности, обладающих одним из двух противоположных значений альтернативного признака.