Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистика методичка

.pdf
Скачиваний:
59
Добавлен:
10.08.2019
Размер:
1.03 Mб
Скачать

vk.com/club152685050 | vk.com/id446425943

11

ции является для предприятия вторичным признаком, поскольку рассчитывается как отношение общих затрат на выпуск продукцию к количеству произведённой продукции. Аналогично вторичным признаком для предприятия будет и выработка продукции на 1 работника, рассчитываемая как отношение общего объёма продукции к численности работников на нём.

Для несгруппированных данных средние значения первичных при-

знаков определяются по формуле средней арифметической простой пу-

тем деления итогового подсчета по характеризуемому признаку на перечневой подсчет, т.е. числитель такого отношения представляет собой общую сумму значений осредняемого признака у всех единиц совокупности (∑xi), а знаменатель – общее число единиц изучаемой совокупности (n):

x xi . n

Базой расчета средних значений вторичного признака является исходное соотношение признаков, определяющих логическую формулу осредняемого вторичного признака. Например, если имеются данные об урожайности (у) и посевной площади (П) по отдельным сельхозпредприятиям, для определения средней урожайности будет использоваться сред-

няя арифметическая взвешенная:

ууП .

П

Если в условии даны данные об урожайности (у) и валовом сборе (В), то для расчета средней урожайности применяется средняя гармониче-

ская взвешенная:

уВ .

Ву

Если имеются данные о валовом сборе и посевных площадях, средняя урожайность определяется на основе неявной (агрегатной) средней:

уВ .

П

vk.com/club152685050 | vk.com/id446425943

12

Как видим, во всех трех случаях в основе расчета лежит исходное соотношение, определяющее порядок расчета урожайности:

урожайность

валовой сбор

 

посевная площадь

Аналогичный подход используется при выборе формулы расчета всех вторичных признаков.

Задание 4

Расчет средней величины признака в вариационном ряду осуществляется по формуле средней арифметической взвешенной:

xx j ' f j ,

f j

где x 'j значение признака в j-й группе (в интервальном вариационном

ряду – середины интервалов в j-й группе); f j – частоты или частости j-й группы.

Структурными средним вариационного ряда являются мода и медиана. Мода представляет собой значение изучаемого признака, повторяющееся с наибольшей частотой. В интервальном вариационном ряду мода рассчитывается по формуле:

Mо xi

 

 

 

f Мо f 1

 

 

 

,

( f

Мо

f

1

) ( f

f

1

)

 

 

 

 

 

 

 

где хМо – нижняя граница модального интервала; iМо – величина модального интервала;

f Мо , f Мо 1 ,

f Мо 1 – частоты (частости), соответственно, модального,

домодального и послемодального интервалов.

Медианой называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности, определяемое по формуле:

 

1

f

S1

2

Mе xi

 

 

 

,

 

 

 

 

 

 

f Me

vk.com/club152685050 | vk.com/id446425943

13

где xМе нижняя граница медианного интервала; iМе – величина медианного интервала;

Σf общая сумма частот (частостей) вариационного ряда; f Ме – частота (частость) медианного интервала;

SМе 1 сумма накопленных частот (частостей) в домедианном интервале.

По соотношению x , Мо, Ме можно сделать вывод о характере распределения.

К абсолютным показателям вариации относятся:

-размах вариации – разность между максимальным и минимальным значением признака в совокупности;

-среднее линейное отклонение:

 

 

k

 

 

 

 

 

 

 

 

 

 

x j

x

f j

 

 

 

а

 

j 1

 

 

 

 

 

 

 

 

 

 

k

;

 

 

 

 

 

 

 

 

 

 

 

 

f j

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

- дисперсия:

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

(x j

х)2 f j

 

 

 

2

 

j 1

 

.

 

 

 

 

 

k

 

;

 

 

 

 

 

f j

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

- среднее квадратическое отклонение

2 ,

где x j – значение признака в j-й группе (дня интервальных вариационных

рядов – середина j-го интервала – x 'j );

x – средняя величина признака в совокупности; f j – частота (частость) j-й группы;

k – число групп.

Для оценки интенсивности вариации рассчитывают коэффициент вариации: х 100%. Если коэффициент вариации менее 30%, совокуп-

ность считается однородной. Среднее значение может рассматриваться как типическая характеристика признака в совокупности.

vk.com/club152685050 | vk.com/id446425943

14

Асимметрия и эксцесс являются характеристиками формы распределения.

Моментный коэффициент асимметрии определяется по формуле:

Аs 3 .3

где 3 – центральный момент третьего порядка, который по вариационному ряду рассчитывается по формуле:

 

 

 

k

 

 

 

 

 

(x j

x)3 f j

 

 

 

 

j 1

 

.

3

k

 

 

 

f j

 

j 1

Если As < 0, то это левосторонняя асимметрия, при правосторонней асимметрии As>0.

Структурный коэффициент асимметрии, предложенный англий-

ским статистиком К. Пирсоном, определяют по формуле:

АsП x M 0 .

Под эксцессом понимают островершинность или плосковершинность распределения по сравнению с нормальным распределением при той же силе вариации. Эксцесс определяется только для симметричных и умеренно асимметричных распределений. Эксцесс оценивается с помо-

щью следующего показателя:

Ex 4 3,

4

где 4 центральный момент четвертого порядка, который по вариационному ряду рассчитывается по формуле:

 

 

k

 

 

 

 

 

(x j

x)4 f j

4

 

j 1

 

 

.

 

k

 

 

 

 

f j

j 1

Распределения более островершинные, чем нормальные, обладают положительным эксцессом (Ех > 0), более плосковершинные – отрицательным (Ех<0).

vk.com/club152685050 | vk.com/id446425943

15

Задание 5

Расхождение между значениями показателей, полученных по выборке, и соответствующими параметрами генеральной совокупности называется ошибкой репрезентативности. В табл. 1 приведены обозначения основных параметров генеральной и выборочной совокупности.

Таблица 1

Параметры генеральной и выборочной совокупности

Характеристики

Генеральная

Выборочная

совокупность

совокупность

 

Объем совокупности

N

n

(численность единиц)

 

 

 

 

 

 

 

 

Численность единиц,

 

 

 

 

 

 

 

 

обладающих обследуемым

M

m

качеством (признаком)

 

 

 

 

 

 

 

 

Доля единиц, обладающих

 

 

 

M

 

 

m

 

обследуемым качеством

p

 

 

w

 

 

N

n

(признаком), выборочная доля

 

 

 

 

 

 

 

 

 

 

 

 

Среднее значение признака

 

 

 

 

 

~

 

 

 

x

 

 

 

x

Расчет средней ошибки выборки при случайном отборе осуществляется по формулам, приведенным в табл. 2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2

 

 

 

 

 

 

 

Определение ошибки выборки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Формулы расчета средней ошибки выборки

 

 

 

 

 

 

 

 

 

 

повторный отбор

 

 

 

 

 

 

 

бесповторный отбор

 

 

 

 

 

для средней

для доли

 

для средней

 

для доли

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2

w

w(1 w)

 

 

 

x2

(1

n

)

w

 

w(1 w)

(1

n

)

x

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

n

 

 

n

 

N

 

 

n

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

Предельная ошибка выборки ( ), определяется по формуле:

t ,

где t – коэффициент доверия, определяемый в зависимости от уровня вероятности Р(t) по таблице интегральной функции Лапласа.

Наиболее часто употребляемые уровни доверительной вероятности и соответствующие им значения t приведены в табл. 3:

vk.com/club152685050 | vk.com/id446425943

16

Таблица 3

Р(t)

0,683

0,950

0,954

0,990

0,997

t

1,00

1,96

2,00

2,58

3,00

Зная величину выборочной средней ( ~ ) или доли ( ), а также пре-

x

дельную ошибку выборки ( ), можно определить доверительные интервалы, в которых находятся значения генеральных параметров:

~

 

 

~

,

 

x

x x

p .

Формулы расчета численности выборки при собственно-случайном способе отбора указаны в табл. 4.

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 4

 

Определение численности выборки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Способ отбора

 

Формулы расчета численности выборки

 

для средней

 

 

для доли

 

 

 

 

Повторный

 

 

n

t 2 2

 

 

n

t 2 w(1 w)

 

 

 

 

2

 

 

2

 

 

 

 

 

 

 

 

 

 

Бесповторный

 

n

 

t 2 2 N

 

n

 

t 2 Nw(1 w)

 

 

 

N 2

t 2 2

 

N 2

t 2 w(1 w)

 

 

 

 

 

 

Задание 6

Основными характеристиками связи являются:

-направление связи (прямая или обратная);

-форма связи (линейная или нелинейная);

-теснота связи;

-сила связи.

Общая дисперсия признака-результата характеризует вариацию под влиянием всех факторов и условий, вызывающих эту вариацию. Рассчитать общую дисперсию можно по несгруппированным данным по формуле:

2 ( yi y)2 , n

где yi – значение результативного признака у i-й единицы совокупности; y – среднее значение результативного признака в совокупности;

n – число единиц совокупности.

vk.com/club152685050 | vk.com/id446425943

17

Межгрупповая дисперсия по данным аналитической группировки определяется по формуле:

2 ( y j y)2 f j ,

f j

где y j – среднее значение результативного признака в j-й группе;

y – среднее значение результативного признака в совокупности; fi число единиц в группе.

Для каждой группы внутригрупповую дисперсию рассчитывают по несгруппированным данным по формуле:

2

 

yi y j

 

j

f j

.

 

 

 

Обобщенное значение внутригрупповой колеблемости находят, оп-

ределив среднюю величину внутригрупповых дисперсий:

 

 

2

 

2j f j

 

 

 

j

 

 

 

f j

.

 

 

 

 

 

 

 

 

 

Общая дисперсия согласно правилу сложения дисперсий равна сумме межгрупповой дисперсии и средней из внутригрупповых дисперсий:

2 2 J2

Тесноту связи между факторным (группировочным) и результатив-

ным признаком характеризует эмпирическое корреляционное отношение,

которое представляет собой квадратный корень из коэффициента детерминации:

 

 

 

2

 

2

 

2

 

 

 

При условии, что признак-фактор, положенный в основание группировки имеет количественное выражение, возможен расчет показателей

силы связи:

- для каждой группы: byx

y j y j 1

;

 

 

ix

vk.com/club152685050 | vk.com/id446425943

18

- средней силы связи для совокупности в целом (для линейных связей):

byx ym y1 . xm x1

При статистическом изучении корреляционных связей одной из основных задач является построение модели связи. Если результативный признак (у) с увеличением факторного признака (х) равномерно возрастает или убывает, то такая зависимость является линейной и выражается уравнением прямой у=a+bх.

Для нахождения параметров уравнения необходимо решить систему нормальных уравнений, полученных методом наименьших квадратов:

an b х y a х b х2

Параметры уравнения можно так же определить по формулам:

a y х2 yх х n х2 х х

b n yх y х

n х2 х х

Линейный коэффициент корреляции применяется для измерения тесноты связи и рассчитывается по формуле:

 

 

 

 

 

 

 

 

 

 

r

 

 

 

xy x y

yx

 

 

 

 

x y

 

 

 

 

Если известно значение линейного коэффициента корреляции, параметры регрессии можно найти по формулам:

bryx y

x

a y bx

Параметр а экономического смысла не имеет. Параметр b называется коэффициентом регрессии и показывает, как в среднем изменяется результативный признак при изменении факторного признака на одну единицу.

Коэффициент детерминации представляет собой отношение объясненной вариации к общей вариации:

vk.com/club152685050 | vk.com/id446425943

19

2 ( yi y)2

( yi y)2

Значимость уравнения регрессии можно проверить через критерий Фишера (F-критерий):

 

 

 

 

 

 

 

2

 

 

2

 

 

 

 

 

 

F

yx

 

:

y yx

 

 

 

 

 

m

 

n m

 

 

 

 

 

 

 

1

 

 

( yi

 

 

 

 

 

 

 

 

2

 

y)2

 

 

 

 

 

где y

 

 

 

 

– факторная (объясненная) дисперсия, которая характе-

 

x

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

ризует вариацию результативного признака под влиянием признака фактора, включенного в модель;

 

2

 

( yi yi

)2

y yx

n

– остаточная дисперсия, характеризующая вариацию

 

 

 

 

 

 

 

результативного признака под влиянием прочих неучтенных факторов; m – число параметров уравнения;

n – число единиц наблюдения.

Расчетное значение критерия Фишера сравнивается с табличным с уровнем значимости 0,01 или 0,05 и числом степеней свободы (m-1),(n-m). Если расчетное значение оказывается больше, чем табличное, уравнение признается значимым.

Задание 7

Ряд динамики (динамический, временной ряд) – ряд, расположенных в хронологической последовательности значений того или иного показателя: у1, у2,……уn-1n. Для характеристики динамики рассчитывают систему показателей динамики, формулы которых приведены в табл. 5.

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 5

 

Показатели динамики

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Показатель динамики

 

 

 

 

 

 

Формулы расчета

 

 

 

 

 

 

 

на цепной основе

на базисной основе

 

 

Абсолютный прирост (+),

 

ц yi

yi 1

б yi

y1

сокращение (-)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент роста

 

Крц

 

 

yi

 

Крб

 

yi

 

 

yi 1

y1

 

 

 

 

 

 

 

 

 

 

 

Темп роста

 

ц

 

 

yi

 

100%

Трб

 

 

yi

100%

 

 

 

 

 

 

 

 

 

 

 

yi 1

 

 

 

y1

 

 

Темп прироста

 

Тпрц

Трц

 

100%

Тпрб

Трб

100%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Абсолютное значение

 

А1% 0,01уi 1

 

 

 

-

 

 

 

одного процента прироста

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

vk.com/club152685050 | vk.com/id446425943

20

Между цепными и базисными показателями динамики существуют взаимосвязи:

-сумма цепных абсолютных приростов равна базисному абсолютному приросту;

-произведение цепных коэффициентов роста равно базисному коэффициенту роста.

Для обобщающей характеристики динамики используются:

-средние уровни ряда;

-средние показатели изменения уровней ряда.

Средний уровень интервального ряда рассчитывается по формуле:

у уi . n

Средний уровень моментного ряда рассчитывается по формуле

 

 

 

 

 

 

 

1

 

у

y

 

... y

 

 

1

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

n

 

 

 

 

 

 

средней хронологической:

 

 

 

2

1

 

2

 

 

 

 

2

 

 

.

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Средний абсолютный прирост (снижения) рассчитывается как:

 

 

 

 

 

 

w

 

 

 

 

 

 

 

yn

y1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или

.

 

 

 

 

 

 

 

 

 

 

n 1

 

 

 

n

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Средний коэффициент роста (снижения):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yn

.

 

 

 

 

 

 

 

2

... n , или n 1

 

Кр n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

Средний темп роста (снижения): Тр Кр *100% .

Средний темп прироста (снижения): Тпр Тр 100% .

Аналитическое выравнивание на основе линейного тренда предполагает построение уравнения у = a+bt.

Для нахождения параметров уравнения необходимо решить систему уравнений, в которой фактор времени t принимает значения от 1 до n: t=1,2,3,…..,n.

an b t y a t b t 2 yt