Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистика практикум - Т.В. Ивашина

.pdf
Скачиваний:
83
Добавлен:
24.05.2014
Размер:
352.38 Кб
Скачать

— межгрупповая дисперсия, r — число серий в выборочной совокупности;

Задачи и упражнения

1.Из приведенных выборочных обследований определите данные, которые содержат систематическую ошибку регистрации,

àтакже данные, имеющие систематическую ошибку репрезентативности, в следующих случаях: а) при изучении производительности труда из совокупности заведомо были исключены рабочие со стажем менее одного года; б) при обследовании состояния животноводства в фермерских хозяйствах из-за небрежности счетчи- ков в некоторых хозяйствах не полностью был учтен молодняк скота; в) при наблюдении с целью выявить количество смежных специальностей, которыми владеют рабочие завода, не учитывалось количество учеников; г) при обследовании бюджета времени работающих, как оказалось впоследствии, затраты времени на пра- чечную и химчистку вместо статьи '' Покупка товаров и получе- ние услуг'' были включены в статью ''Работа на дому''.

2.Что произойдет с величиной предельной ошибки выборки, если вероятность, гарантирующую результат: а) увели- чить с 0,954 до 0,997; б) уменьшить с 0,954 до 0,683; в) увели- чить с 0,683 до 0,954; г) уменьшить с 0,997 до 0,954; д) увели- чить с 0,683 до 0,997?

3.Определите, как изменится средняя ошибка случайной выборки, если необходимую численность выборочной совокупности: а) уменьшить в 2,5 раза; на 40%; б) увеличить в 1,5 раза; на 20%. Как нужно применить необходимую численность выборки, чтобы средняя ошибка уменьшилась в 2 раза; на 50%; на 30%?

4.В каком соотношении находятся при прочих равных условиях ошибки собственно-случайной бесповторной и повторной выборок при 1%-ном, 5%-ном, 10%-ном и 20%-ном отборе?

5.Какой должна быть необходимая численность выборки при механическом отборе, чтобы установить генеральную долю с ошибкой не более 2%, если дисперсия доли неизвестна, а отбор производится из совокупности, включающей: а) 1000 единиц; б) 10 000 единиц; в) 100 000 единиц? Вероятность, гарантирующая результаты выборочного наблюдения, равна 0,954.

6.Каким должен быть объем случайной бесповторной выборки из генеральной совокупности численностью 10 000

4 1

единиц при среднем квадратическом отклонении не более 20, предельной ошибке, не превышающей 5%, и вероятности 0,997?

7.Из партии импортируемой продукции на посту таможни было взято в порядке случайной повторной выборки 20 проб продукта А. В результате проверки установлена средняя влажность продукта А в выборке, которая оказалась равной 6% при среднем квадратическом отклонении 1%. С вероятностью 0,683 определите пределы средней влажности продукта во всей партии импортируемой продукции.

8.С целью определения средних затрат времени при поездках на работу населением города планируется выборочное наблюдение на основе случайного повторного отбора. Сколько людей должны быть обследованы, чтобы с вероятностью 0,954 ошибка выборочной средней не превышала 1 мин. при среднем квадратическом отклонении 15 мин.?

9.В одном из лесничеств методом случайной выборки обследовано 1000 деревьев с целью установления их среднего диаметра, который оказался равным 210 мм при s = 126,5 мм.

Ñвероятностью 0,683 определите пределы среднего диаметра деревьев в генеральной совокупности.

10.Для определения срока службы металлорежущих станков было проведено 10%-ное выборочное обследование по методу случайного бесповторного отбора, в результате которого получены следующие данные:

Срок службы

 

 

Число станков, шт.

 

 

 

 

 

 

 

 

 

станков, лет

вариант 1-й

вариант 2-й

 

вариант 3-й

вариант 4-й

âàðè

 

 

 

 

 

 

 

Äî 4

11

6

 

18

15

 

4—6

24

23

 

36

32

 

6—8

35

38

 

26

27

 

8—10

25

26

 

11

18

 

Свыше 10

5

7

 

9

8

 

 

 

 

 

 

 

 

Итого

100

100

 

100

100

 

 

 

 

 

 

 

 

Определите для каждого варианта: 1) с вероятностью 0,997 предельную ошибку выборки и пределы, в которых ожидается средний срок службы металлорежущих станков; 2) с вероятностью 0,954 предельную ошибку репрезентативности для доли и пределы удельного веса станков со сроком службы свыше 8 лет.

11. По данным 2%-ного выборочного обследования (n = 100) средняя урожайность зерновых культур равна 32 ц га при дисперсии, равной 6,15. Определите ошибку выборки и воз-

4 2

можные пределы средней урожайности зерновых культур со всей посевной площади с вероятностью: а) 0,954; б) 0,997.

12. С целью определения среднего стажа работы рабочих завода произведена 20%-ная типическая пропорциональная выборка (внутри групп применялся метод случайного бесповторного отбора). Результаты обследования характеризуются следующими данными:

 

 

Группы рабочих по стажу, лет

 

 

 

 

 

 

 

 

Группы рабочих

äî 5

5—10

10—15

15—20

20 è âûøå

Итого

ïî ïîëó

 

 

 

 

 

 

 

 

 

 

 

 

 

Мужчины

10

50

50

30

15

125

Женщины

15

18

27

10

5

75

 

 

 

 

 

 

 

Итого

25

38

77

40

20

200

 

 

 

 

 

 

 

Определите с вероятностью 0,954 ошибку выборки и пределы, в которых будет находиться: а) средний стаж работы всех рабочих; б) удельный вес рабочих со стажем до 5 лет.

13.Партия готовых деталей упакована в 500 ящиков по пять штук в каждом. Для определения средней массы деталей обследовано пять ящиков. Результаты проверки показали, что средняя масса обследуемых деталей составляет 2 кг, межсерийная дисперсия равна 0,025. Определите с вероятностью 0,954 ошибку выборки и пределы, в которых будет находиться средняя масса деталей, поступивших на склад.

14.В результате исследования 20 проб молока, поступившего из колхоза на молокозавод, определили, что средняя жирность молока 3,6% при среднеквадратическом отклонении 0,5%. Какова вероятность того, что возможная ошибка средней жирности поступившего молока не более 0,3%?

СТАТИСТИчЕСКОЕ ИЗУчЕНИЕ ВЗАИМОСВŸЗИ СОЦИАЛЬНО-ЭКОНОМИчЕСКИХ ŸВЛЕНИЙ

Методические указания

Социально-экономические явления представляют собой результат одновременного воздействия большого числа при- чин. При изучении этих явлений необходимо выявлять главные, основные причины, абстрагируясь от второстепенных. В

4 3

основе первого этапа статистического изучения связей лежит качественный анализ явления, связанный с анализом его природы методами экономической теории, социологии, конкретной экономики.

Второй этап — построение модели связи. Он базируется на методах статистики: группировки, средних величин, таблиц

èт.д. Третий, последний этап — интерпретация результатов, вновь связан с качественными особенностями изучаемого явления. Статистика разработала множество методов изучения связей, выбор конкретного из которых зависит от цели исследования и от поставленной задачи. Связи между признаками

èявлениями, ввиду их большого разнообразия, классифицируются по ряду оснований. Признаки по их значению для изуче- ния взаимосвязи делятся на два класса. Признаки, обусловливающие изменение других, связанных с ними признаков, называют факторными, или просто факторами. Признаки, изменяющиеся под действием факторных признаков, называют результативными. Связи между явлениями и их признаками классифицируются по степени тесноты, по направлению

èпо аналитическому выражению.

Âстатистике различают функциональную связь и стохасти- ческую зависимость. Функциональной называют такую связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака.

Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений, то такая зависимость называется стохастической. Частным случаем стохастической связи является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.

По направлению выделяют связь прямую и обратную. При прямой связи с увеличением или уменьшением значений факторного признака происходит увеличение или уменьшение зна- чений результативного. Например, увеличение степени механизации труда способствует росту рентабельности строительного производства. В случае обратной связи значения результативного признака изменяются в противоположном направлении по сравнению с изменением факторного признака. Так, с увеличением уровня фондоотдачи снижается себестоимость единицы производимой продукции.

По аналитическому выражению выделяют связи прямолинейные (или просто линейные) и нелинейные (криволиней-

4 4

ные). Если статистическая связь между явлениями приближенно выражена уравнением прямой линии, то ее называют линейной связью; если же она выражена уравнением какойлибо кривой линии (параболы, гиперболы: степенной, показательной, экспоненциальной и т.д.), то такую связь называют нелинейной, или криволинейной.

Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описывается уравнениями:

прямой yx = ao+ a1 x ,

параболы yx = ao+ a1 x+ a2 x2 ,

1

гиперболы yx = ao+ a1 x .

Определить тип уравнения можно, исследуя зависимость графически. Однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, примерно в арифметической прогрессии, то это свидетельствует о наличии линейной связи между ними, а при обратной связи — гиперболической. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная функции.

Оценка параметров уравнения регрессии а0, a1 2 — в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели (а0 è à1), при котором минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по уравнению регрессии:

S = (y−

 

 

) 2

min.

y

x

 

 

 

 

Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:

4 5

nao + a1

x=

y ,

a0 x + a1

x2 =

xy,

где n — объем исследуемой совокупности (число единиц наблюдения).

В уравнениях регрессии параметр а0 показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр a1 (а в уравнении параболы и а2) — коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при изменении факторного на единицу его собственного измерения.

Множественная (многофакторная) регрессия. Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии, описываемой функцией вида:

Υ 1,2,...,k = f (x1 , x2 ,..., xk ).

Построение моделей множественной регрессии включает этапы:

1)выбор формы связи (уравнения регрессии);

2)отбор факторных признаков;

3)обеспечение достаточного объема совокупности для получения несмещенных оценок.

Выбор типа уравнения затрудняется тем, что для любой формы зависимости можно выбрать ряд уравнений, которые в определенной степени будут описывать эти связи. Поскольку уравнение регрессии строится главным образом для объяснения и количественного выражения взаимосвязей, оно должно хорошо отражать сложившиеся между исследуемыми факторами фактические связи.

Практика построения многофакторных моделей взаимосвязи показывает, что все реально существующие зависимости между социально-экономическими явлениями можно описать, используя пять типов моделей:

1)

линейная:

y

1,2,...,k =

a0+

a1 x+1

a2 x+ 2

+ ...

 

ak xk ;

 

 

 

 

 

= a

 

xa1

xa2

... xak

 

 

 

 

2) степенная: y

1,2,...,k

 

0

;

 

 

 

 

 

 

 

 

 

 

1

 

2

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

a

+ a x +

a

x+

+... a

x

 

 

3)

показательная: y

 

 

 

e

 

;

1,2,...,k

0

 

1 1

2

2

k

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4 6

4) параболическая: y1,2,...,k = a0+ a1 x12+

a

5) гиперболическая: y1,2,...,k = a0+ x1+

1

a2 x+ 22 + ... ak xk2 ;

a+2 + ... ak . x2 xk

Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации. Нелинейные формы зависимости приводятся к линейным путем линеаризации.

Важным этапом построения уже выбранного уравнения множественной регрессии являются отбор и последующее включение факторных признаков.

Проблема отбора факторных признаков для построения моделей взаимосвязи может быть решена на основе эвристи- ческих (интуитивно-логических) или многомерных статисти- ческих методов анализа.

Оценка существенности связи. Принятие решений на основе уравнения регрессии. Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии.

Значимость коэффициента регрессии осуществляется с помощью t-критерия Стьюдента:

t p

=

ai

 

 

σ

 

,

 

 

a

i

ãäå σ 2 — дисперсия коэффициента регрессии.

ai

Параметр модели признается статистически значимым,

åñëè tp > tkp (a; v = n - ê - 1), ãäå a — уровень значимости, v = n - ê - 1 — число степеней свободы.

Величина сг ц. может быть определена по выражению

σ a2 =

σ y2

,

k

i

 

 

 

ãäå σ y2 — дисперсия результативного признака; k — число факторных признаков в уравнении.

4 7

Более точную оценку величины дисперсии можно полу- чить по формуле

σ ai =

 

σ y

1

R2

σ x

 

n

1 R2 ,

 

 

i

 

 

ãäå Ri — величина множественного коэффициента корреляции по фактору хi с остальными факторами.

Проверка адекватности всей модели осуществляется с помощью расчета F-критерия и величины средней ошибки апп-

роксимации (ε ).

Значение средней ошибки аппроксимации, определяемой по формуле

 

 

=

1

 

y −

y

1,2,...,k

 

100,

ε

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

1,2,...,k

не должно превышать 12-15%.

Интерпретация моделей регрессий осуществляется методами той отрасли знаний, к которой относятся исследуемые явления. Но всякая интерпретация начинается со статистической оценки уравнения регрессии в целом и оценки зависимости входящих в модель факторных признаков, т.е. с выяснения, как они влияют на величину результативного признака. Чем больше величина коэффициента регрессии, тем значительнее влияние данного признака на моделируемый. Особое значение при этом имеет знак перед коэффициентом регрессии. Знаки коэффициентов регрессии говорят о характере влияния на результативный признак. Если факторный признак имеет знак плюс, то с увеличением данного фактора результативный признак возрастает. Если факторный признак имеет знак минус, то с его увеличением результативный признак уменьшается. Анализ модели свидетельствует о том, что увеличение кредитных вложений и собственного капитала влечет рост стоимости активов коммерческих банков.

С целью расширения возможностей экономического анализа используются частные коэффициенты эластичности, определяемые по формуле

Ýx

 

= ai

xi

 

,

 

 

 

 

i

y

 

 

 

 

 

 

4 8

ãäå xi ñреднее значение соответствующего факторного признака; y — среднее значение результативного признака; аi — коэффициент регрессии при соответствующем факторном признаке.

Коэффициент эластичности показывает, на сколько процентов в среднем изменится значение результативного признака при изменении факторного признака на 1%.

Собственно-корреляционные параметрические методы изу- чения связи. Оценка существенности корреляции. Изменение тесноты и направления связи является важной задачей изуче- ния и количественного измерения взаимосвязи социально-эко- номических явлений.

Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции.

В статистической теории разработаны и на практике применяются различные модификации формул расчета данного коэффициента:

r =

 

 

 

 

 

 

yx

y x

 

 

α αx

.

yx

 

 

y

Производя расчет по итоговым значениям исходных переменных, линейный коэффициент корреляции можно вычислить по формуле:

rxy =

n

xy −

x

y

 

[nx2 (

x) 2 ]

[n

y2(

y) 2 ] .

Линейный коэффициент корреляции может быть также выражен через дисперсии слагаемых:

 

 

σ x

+σ

y σ

x− y

 

 

2

2

2

 

rxy

=

 

 

 

 

.

 

2σ

σx

 

 

 

 

y

4 9

Между линейным коэффициентом корреляции и коэффициентом регрессии существует определенная зависимость, которую можно выразить следующей формулой:

r = ai

σ

x

 

i

σ

 

,

 

y

ãäå ai — коэффициент регрессии в уравнении связи;σ xi — среднее квадратическое отклонение соответствующего факторного признака.

Линейный коэффициент корреляции изменяется в пределах от -1 до 1: -1 < r < 1. Знаки коэффициентов регрессии и корреляции совпадают.

Значимость линейного коэффициента корреляции проверяется на основе t-критерия Стьюдента:

t

 

=

 

r 2

( n −

2) =

r

n − 2 .

p

1 −

r 2

1 −

 

 

 

 

r 2

Если расчетное значение tp > tkp (табличное), то гипотеза Но : ryx = 0 отвергается, что свидетельствует о значимости линейного коэффициента корреляции, а следовательно, и о статистической существенности зависимости между х и у.

Множественный коэффициент корреляции вычисляется при наличии линейной связи между результативными и несколькими факторными признаками, а также между каждой парой факторных признаков.

Множественный коэффициент корреляции вычисляется по формуле

 

 

 

 

δ

2

σ îñò2

 

Ry/ x x

...x

k

=

σ

2 = 1−

σ

2

,

1 2

 

 

 

 

 

 

 

ãäå d2 — дисперсия теоретических значений результативного признака, рассчитанная по уравнению множественной регрессии;d2 îñò — остаточная дисперсия, d2 — общая дисперсия результативного признака.

5 0

Соседние файлы в предмете Экономика