Статистика. Методичка
.pdf11
ции является для предприятия вторичным признаком, поскольку рассчитывается как отношение общих затрат на выпуск продукцию к количеству произведённой продукции. Аналогично вторичным признаком для предприятия будет и выработка продукции на 1 работника, рассчитываемая как отношение общего объёма продукции к численности работников на нём.
Для несгруппированных данных средние значения первичных при-
знаков определяются по формуле средней арифметической простой пу-
тем деления итогового подсчета по характеризуемому признаку на перечневой подсчет, т.е. числитель такого отношения представляет собой общую сумму значений осредняемого признака у всех единиц совокупности (∑xi), а знаменатель – общее число единиц изучаемой совокупности (n):
x xi . n
Базой расчета средних значений вторичного признака является исходное соотношение признаков, определяющих логическую формулу осредняемого вторичного признака. Например, если имеются данные об урожайности (у) и посевной площади (П) по отдельным сельхозпредприятиям, для определения средней урожайности будет использоваться сред-
няя арифметическая взвешенная:
ууП .
П
Если в условии даны данные об урожайности (у) и валовом сборе (В), то для расчета средней урожайности применяется средняя гармониче-
ская взвешенная:
уВ .
Ву
Если имеются данные о валовом сборе и посевных площадях, средняя урожайность определяется на основе неявной (агрегатной) средней:
уВ .
П
12
Как видим, во всех трех случаях в основе расчета лежит исходное соотношение, определяющее порядок расчета урожайности:
урожайность |
валовой сбор |
|
|
посевная площадь |
Аналогичный подход используется при выборе формулы расчета всех вторичных признаков.
Задание 4
Расчет средней величины признака в вариационном ряду осуществляется по формуле средней арифметической взвешенной:
xx j ' f j ,
f j
где x 'j – значение признака в j-й группе (в интервальном вариационном
ряду – середины интервалов в j-й группе); f j – частоты или частости j-й группы.
Структурными средним вариационного ряда являются мода и медиана. Мода представляет собой значение изучаемого признака, повторяющееся с наибольшей частотой. В интервальном вариационном ряду мода рассчитывается по формуле:
Mо xMо iMо |
|
|
|
f Мо f Mо 1 |
|
|
|
, |
||
( f |
Мо |
f |
Mо 1 |
) ( f |
Mо |
f |
Mо 1 |
) |
||
|
|
|
|
|
|
|
где хМо – нижняя граница модального интервала; iМо – величина модального интервала;
f Мо , f Мо 1 , |
f Мо 1 – частоты (частости), соответственно, модального, |
домодального и послемодального интервалов.
Медианой называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности, определяемое по формуле:
|
1 |
f |
SMе 1 |
||
2 |
|||||
Mе xMе iMе |
|
|
|
, |
|
|
|
|
|||
|
|
|
f Me |
13
где xМе – нижняя граница медианного интервала; iМе – величина медианного интервала;
Σf – общая сумма частот (частостей) вариационного ряда; f Ме – частота (частость) медианного интервала;
SМе 1 – сумма накопленных частот (частостей) в домедианном интервале.
По соотношению x , Мо, Ме можно сделать вывод о характере распределения.
К абсолютным показателям вариации относятся:
-размах вариации – разность между максимальным и минимальным значением признака в совокупности;
-среднее линейное отклонение:
|
|
k |
|
|
|
|
|
|
|
|
|
|
x j |
x |
f j |
|
|
|
|||
а |
|
j 1 |
|
|
|
|
|
|
|
|
|
|
k |
; |
|
|
|
||||
|
|
|
|
|
|
|||||
|
|
|
f j |
|
|
|
||||
|
|
|
j 1 |
|
|
|
|
|
|
|
- дисперсия: |
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
(x j |
х)2 f j |
|
|
|
||||
2 |
|
j 1 |
|
. |
|
|
|
|||
|
|
k |
|
; |
|
|
||||
|
|
|
f j |
|
|
|
||||
|
|
|
j 1 |
|
|
|
||||
|
|
|
|
|||||||
- среднее квадратическое отклонение |
2 , |
где x j – значение признака в j-й группе (дня интервальных вариационных
рядов – середина j-го интервала – x 'j );
x – средняя величина признака в совокупности; f j – частота (частость) j-й группы;
k – число групп.
Для оценки интенсивности вариации рассчитывают коэффициент вариации: х 100%. Если коэффициент вариации менее 30%, совокуп-
ность считается однородной. Среднее значение может рассматриваться как типическая характеристика признака в совокупности.
14
Асимметрия и эксцесс являются характеристиками формы распределения.
Моментный коэффициент асимметрии определяется по формуле:
Аs 3 .3
где 3 – центральный момент третьего порядка, который по вариационному ряду рассчитывается по формуле:
|
|
|
k |
|
|
|
|
|
(x j |
x)3 f j |
|
|
|
|
j 1 |
|
. |
3 |
k |
||||
|
|
|
f j |
|
j 1
Если As < 0, то это левосторонняя асимметрия, при правосторонней асимметрии As>0.
Структурный коэффициент асимметрии, предложенный англий-
ским статистиком К. Пирсоном, определяют по формуле:
АsП x M 0 .
Под эксцессом понимают островершинность или плосковершинность распределения по сравнению с нормальным распределением при той же силе вариации. Эксцесс определяется только для симметричных и умеренно асимметричных распределений. Эксцесс оценивается с помо-
щью следующего показателя:
Ex 4 3,
4
где 4 – центральный момент четвертого порядка, который по вариационному ряду рассчитывается по формуле:
|
|
k |
|
|
|
|
|
(x j |
x)4 f j |
||
4 |
|
j 1 |
|
|
. |
|
k |
|
|||
|
|
|
f j |
j 1
Распределения более островершинные, чем нормальные, обладают положительным эксцессом (Ех > 0), более плосковершинные – отрицательным (Ех<0).
15
Задание 5
Расхождение между значениями показателей, полученных по выборке, и соответствующими параметрами генеральной совокупности называется ошибкой репрезентативности. В табл. 1 приведены обозначения основных параметров генеральной и выборочной совокупности.
Таблица 1
Параметры генеральной и выборочной совокупности
Характеристики |
Генеральная |
Выборочная |
|||||||
совокупность |
совокупность |
||||||||
|
|||||||||
Объем совокупности |
N |
n |
|||||||
(численность единиц) |
|||||||||
|
|
|
|
|
|
|
|
||
Численность единиц, |
|
|
|
|
|
|
|
|
|
обладающих обследуемым |
M |
m |
|||||||
качеством (признаком) |
|
|
|
|
|
|
|
|
|
Доля единиц, обладающих |
|
|
|
M |
|
|
m |
|
|
обследуемым качеством |
p |
|
|
w |
|
||||
|
N |
n |
|||||||
(признаком), выборочная доля |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
||
Среднее значение признака |
|
|
|
|
|
~ |
|
|
|
|
x |
|
|
||||||
|
x |
Расчет средней ошибки выборки при случайном отборе осуществляется по формулам, приведенным в табл. 2.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 2 |
||||
|
|
|
|
|
|
|
Определение ошибки выборки |
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
Формулы расчета средней ошибки выборки |
|
|
|
|
|
|
|
|||||||||||||
|
|
|
повторный отбор |
|
|
|
|
|
|
|
бесповторный отбор |
|
|
|
|
|
|||||||||
для средней |
для доли |
|
для средней |
|
для доли |
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x2 |
w |
w(1 w) |
|
|
|
x2 |
(1 |
n |
) |
w |
|
w(1 w) |
(1 |
n |
) |
|||||||
x |
|
|
|
x |
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
n |
|
|
n |
|
|
n |
|
N |
|
|
n |
|
|
N |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
Предельная ошибка выборки ( ), определяется по формуле:
t ,
где t – коэффициент доверия, определяемый в зависимости от уровня вероятности Р(t) по таблице интегральной функции Лапласа.
Наиболее часто употребляемые уровни доверительной вероятности и соответствующие им значения t приведены в табл. 3:
16
Таблица 3
Р(t) |
0,683 |
0,950 |
0,954 |
0,990 |
0,997 |
t |
1,00 |
1,96 |
2,00 |
2,58 |
3,00 |
Зная величину выборочной средней ( ~ ) или доли ( ), а также пре-
x
дельную ошибку выборки ( ), можно определить доверительные интервалы, в которых находятся значения генеральных параметров:
~ |
|
|
~ |
, |
|
||||
x |
x x |
p .
Формулы расчета численности выборки при собственно-случайном способе отбора указаны в табл. 4.
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 4 |
||
|
Определение численности выборки |
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
||||||
Способ отбора |
|
Формулы расчета численности выборки |
|||||||||||||
|
для средней |
|
|
для доли |
|||||||||||
|
|
|
|
||||||||||||
Повторный |
|
|
n |
t 2 2 |
|
|
n |
t 2 w(1 w) |
|
||||||
|
|
|
2 |
|
|
2 |
|||||||||
|
|
|
|
|
|
|
|
|
|
||||||
Бесповторный |
|
n |
|
t 2 2 N |
|
n |
|
t 2 Nw(1 w) |
|
||||||
|
|
N 2 |
t 2 2 |
|
N 2 |
t 2 w(1 w) |
|||||||||
|
|
|
|
|
|
Задание 6
Основными характеристиками связи являются:
-направление связи (прямая или обратная);
-форма связи (линейная или нелинейная);
-теснота связи;
-сила связи.
Общая дисперсия признака-результата характеризует вариацию под влиянием всех факторов и условий, вызывающих эту вариацию. Рассчитать общую дисперсию можно по несгруппированным данным по формуле:
2 ( yi y)2 , n
где yi – значение результативного признака у i-й единицы совокупности; y – среднее значение результативного признака в совокупности;
n – число единиц совокупности.
17
Межгрупповая дисперсия по данным аналитической группировки определяется по формуле:
2 ( y j y)2 f j ,
f j
где y j – среднее значение результативного признака в j-й группе;
y – среднее значение результативного признака в совокупности; fi – число единиц в группе.
Для каждой группы внутригрупповую дисперсию рассчитывают по несгруппированным данным по формуле:
2 |
|
yi y j |
|
j |
f j |
. |
|
|
|
|
Обобщенное значение внутригрупповой колеблемости находят, оп-
ределив среднюю величину внутригрупповых дисперсий:
|
|
2 |
|
2j f j |
|
|
|
|
|||||
j |
|
|
|
|||
f j |
. |
|||||
|
|
|
|
|||
|
|
|
|
|
Общая дисперсия согласно правилу сложения дисперсий равна сумме межгрупповой дисперсии и средней из внутригрупповых дисперсий:
2 2 J2
Тесноту связи между факторным (группировочным) и результатив-
ным признаком характеризует эмпирическое корреляционное отношение,
которое представляет собой квадратный корень из коэффициента детерминации:
|
|
|
2 |
|
|
2 |
|
||
2 |
||||
|
|
|
При условии, что признак-фактор, положенный в основание группировки имеет количественное выражение, возможен расчет показателей
силы связи:
- для каждой группы: byx |
y j y j 1 |
; |
|
||
|
ix |
18
- средней силы связи для совокупности в целом (для линейных связей):
byx ym y1 . xm x1
При статистическом изучении корреляционных связей одной из основных задач является построение модели связи. Если результативный признак (у) с увеличением факторного признака (х) равномерно возрастает или убывает, то такая зависимость является линейной и выражается уравнением прямой у=a+bх.
Для нахождения параметров уравнения необходимо решить систему нормальных уравнений, полученных методом наименьших квадратов:
an b х y a х b х2 yх
Параметры уравнения можно так же определить по формулам:
a y х2 yх х n х2 х х
b n yх y х
n х2 х х
Линейный коэффициент корреляции применяется для измерения тесноты связи и рассчитывается по формуле:
|
|
|
|
|
|
|
|
|
|
r |
|
|
|
xy x y |
|||||
yx |
|
||||||||
|
|
|
x y |
||||||
|
|
|
|
Если известно значение линейного коэффициента корреляции, параметры регрессии можно найти по формулам:
bryx y
x
a y bx
Параметр а экономического смысла не имеет. Параметр b называется коэффициентом регрессии и показывает, как в среднем изменяется результативный признак при изменении факторного признака на одну единицу.
Коэффициент детерминации представляет собой отношение объясненной вариации к общей вариации:
19
2 ( y€i y)2
( yi y)2
Значимость уравнения регрессии можно проверить через критерий Фишера (F-критерий):
|
|
|
|
|
|
|
2 |
|
|
2 |
|
|
|
|
|
|
|
F |
yx |
|
: |
y yx |
|
|
|
|
|
m |
|
n m |
|||||
|
|
|
|
|
|
|
1 |
||||
|
|
( y€i |
|
|
|
|
|
|
|
|
|
2 |
|
y)2 |
|
|
|
|
|
||||
где y |
|
|
|
|
– факторная (объясненная) дисперсия, которая характе- |
||||||
|
x |
|
n |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
ризует вариацию результативного признака под влиянием признака фактора, включенного в модель;
|
2 |
|
( yi y€i |
)2 |
y yx |
n |
– остаточная дисперсия, характеризующая вариацию |
||
|
|
|
||
|
|
|
|
результативного признака под влиянием прочих неучтенных факторов; m – число параметров уравнения;
n – число единиц наблюдения.
Расчетное значение критерия Фишера сравнивается с табличным с уровнем значимости 0,01 или 0,05 и числом степеней свободы (m-1),(n-m). Если расчетное значение оказывается больше, чем табличное, уравнение признается значимым.
Задание 7
Ряд динамики (динамический, временной ряд) – ряд, расположенных в хронологической последовательности значений того или иного показателя: у1, у2,……уn-1,уn. Для характеристики динамики рассчитывают систему показателей динамики, формулы которых приведены в табл. 5.
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 5 |
|||
|
Показатели динамики |
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Показатель динамики |
|
|
|
|
|
|
Формулы расчета |
|
|
|
|
|
|
||
|
на цепной основе |
на базисной основе |
|||||||||||||
|
|
||||||||||||||
Абсолютный прирост (+), |
|
ц yi |
yi 1 |
б yi |
y1 |
||||||||||
сокращение (-) |
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициент роста |
|
Крц |
|
|
yi |
|
Крб |
|
yi |
|
|||||
|
yi 1 |
y1 |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||
Темп роста |
|
Tрц |
|
|
yi |
|
100% |
Трб |
|
|
yi |
100% |
|||
|
|
|
|
|
|
||||||||||
|
|
|
|
|
yi 1 |
|
|
|
y1 |
|
|
||||
Темп прироста |
|
Тпрц |
Трц |
|
100% |
Тпрб |
Трб |
100% |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Абсолютное значение |
|
А1% 0,01уi 1 |
|
|
|
- |
|
|
|
||||||
одного процента прироста |
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
20
Между цепными и базисными показателями динамики существуют взаимосвязи:
-сумма цепных абсолютных приростов равна базисному абсолютному приросту;
-произведение цепных коэффициентов роста равно базисному коэффициенту роста.
Для обобщающей характеристики динамики используются:
-средние уровни ряда;
-средние показатели изменения уровней ряда.
Средний уровень интервального ряда рассчитывается по формуле:
у уi . n
Средний уровень моментного ряда рассчитывается по формуле
|
|
|
|
|
|
|
1 |
|
у |
y |
|
... y |
|
|
1 |
|
y |
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
n 1 |
|
n |
|
|
|
|
|
|
|||||||||||
средней хронологической: |
|
|
|
2 |
1 |
|
2 |
|
|
|
|
2 |
|
|
. |
|
|
|
||||||||||||||
|
у |
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
n 1 |
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Средний абсолютный прирост (снижения) рассчитывается как: |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
yn |
y1 |
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
или |
. |
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
n 1 |
|
|
|
n |
1 |
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
Средний коэффициент роста (снижения): |
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
yn |
. |
||
|
|
|
|
|
|
|
Kр2 |
... Kрn , или Kр n 1 |
|
|||||||||||||||||||||||
Кр n Kр1 |
||||||||||||||||||||||||||||||||
|
|
|
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
Средний темп роста (снижения): Тр Кр *100% .
Средний темп прироста (снижения): Тпр Тр 100% .
Аналитическое выравнивание на основе линейного тренда предполагает построение уравнения у = a+bt.
Для нахождения параметров уравнения необходимо решить систему уравнений, в которой фактор времени t принимает значения от 1 до n: t=1,2,3,…..,n.
an b t y a t b t 2 yt