Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

СТАТИСТИКА (пособие 2012)

.pdf
Скачиваний:
67
Добавлен:
13.04.2015
Размер:
2.98 Mб
Скачать

а)

средней гармонической для сгруппированных данных;

б)

средней гармонической для несгруппированных данных;

в)

средней арифметической;

г)

средней из групповых средних.

14.

Если A3>0, то имеет место:

а)

правосторонняя асимметрия;

б)

левосторонняя асимметрия;

в)

симметрия.

15.

Если Ex<0, то имеет место:

а)

островершинность;

б)

низковершинность;

в)

равновершинность;

д)

нормальное распределение.

15. Межгрупповая дисперсия равна 64% от общей дисперсии, эмпирическое корреляционное отношение равно (с точностью до 0,01):

а) 0,64;

б) 0,80;

в) 0,36;

г)0,41.

16.Для оценки однородности совокупности рассчитывают: а) среднее линейное отклонение; б) среднее квадратическое отклонение; в) коэффициент осцилляции; г) коэффициент вариации; д) эксцесс распределения.

17.Коэффициент детерминации может принимать значения: а) от –1 до 0; б) любые положительные;

в) от -1 до 1;

г) от 0 до 1.

18.В каких случаях расчет среднего значения признака производится по способу моментов:

а) если признак моментный, а данные не группированы; б) если ряд со сгруппированными данными – интервальный с равными интервалами; в) если максимальная частота находится в середине ряда;

г) если ряд дискретный с равноотстоящими данными.

19. Внутригрупповая дисперсия показывает:

а) влияние неучтенных факторов на размеры вариации; б) влияние фактора группировки на величину вариации результативного признака;

51

в) размеры вариации под влиянием всех факторов; г) вариацию внутригрупповых показателей.

ГЛАВА 4. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ.

4.1. Выборочное наблюдение, оценка генеральных параметров

Статистическая методология исследования массовых явлений различает два способа наблюдения: методом сплошного и несплошного наблюдения. Для исследования части единиц совокупности (проведения несплошного наблюдения) используются три метода: метод основного массива, выборочный и монографический.

Каждый из методов формирует выборочную совокупность или выборку,

являющуюся частью всей совокупности. Вся совокупность единиц называется генеральной. Обязательное назначение каждого из методов – распространение результатов исследования части единиц совокупности на совокупность в целом.

Метод основного массива состоит в отборе наиболее крупных единиц совокупности в выборочную совокупность, обладающих изучаемым свойством.

Монографический метод представляет собой отбор одной или нескольких единиц совокупности, подвергающихся более тщательному изучению их свойств.

Выборочный метод представляет собой метод несплошного наблюдения, при котором отбор из основной совокупности выполняется в случайном порядке, в соответствии с научными принципами теории выборочного метода. Основные принципы выборочного метода – случайность отбора (равной возможности попадания в выборку) и репрезентативность, представительство по всем признакам изучаемой совокупности.

Выборочное наблюдение – несплошное наблюдение, выполненное выборочным методом, при котором отобранная часть изучается, а результаты распространяются на всю совокупность.

Главным условием качества первичных данных статистического наблюдения является достоверность и полнота. В проведении ряда исследований наиболее предпочтительным представляется выборочный метод. В основу отбора выборочным методом лежит принцип равной возможности попадания в выборку каждой единицы генеральной совокупности, случайностью отбора.

При любом статистическом исследовании сплошном или несплошном возникают ошибки двух видов: регистрации и репрезентативности. Ошибки регистрации возникают в результате сбора, занесения информации об изучаемом явлении или процессе и могут быть случайными (непреднамеренными, неискажающими общей картины явления) и систематическими (тенденциозными или преднамеренными, умышленно искажающими картину явления). Ошибки репрезентативности присущи только несплошному статистическому наблюдению и возникают в связи с отличием выборочной и генеральной совокупностей.

Условие случайности отбора предупреждает появление систематических (тенденциозных) ошибок и делает возможной оценку ошибки представительства (репрезентативности). Очевидное отличие выборки от генеральной совокупности позволяет сделать вывод о различиях в оценке показателей, характеризующих

52

генеральную совокупность (генеральных параметров) и выборку (выборочных параметров). Это отличие составляет ошибку выборки.

Ошибка выборки (репрезентативности)- разница между значением показателя, полученного по выборке и генеральным параметром. Ошибка выборки оценивается в зависимости от метода отбора повторного или бесповторного. Так повторный метод представляет собой выбор единицы совокупности и возврат ее в основную совокупность после регистрации ее свойств и признаков, при этом выбранная единица может снова служить объектом отбора. При бесповторном отборе единица совокупности, попавшая в выборку, в генеральную совокупность не возвращается, при такой выборке численность единиц генеральной совокупности сокращается.

Основные генеральные параметры, служащие оценке ошибки выборки представлены в таблице:

 

Характеристики

Генеральная

Выборочная

 

совокупность

совокупность

 

 

1.

Объем совокупности

N

n

2.

Число единиц, обладающих изучаемым

M

m

 

признаком

 

 

 

 

 

 

 

 

 

3.

Доля единиц, обладающих изучаемым

w

M

 

p

 

m

 

 

признаком

 

 

 

 

 

 

 

 

 

 

N

 

 

 

n

4.

Средняя величина признака

~

x

 

 

 

 

x

 

 

 

 

5.

Дисперсия количественного признака

~

 

 

 

 

 

 

 

2

 

 

2

 

 

 

x

 

 

 

 

 

 

x

6.

Дисперсия доли

2

 

 

2

 

 

 

w

p

Основные генеральные параметры, для которых выполняется оценка с использованием ошибки – генеральная средняя (среднее значение признака в генеральной совокупности) и генеральная доля (доля единиц генеральной совокупности, обладающая изучаемым свойством). Для этого используются выборочная средняя (среднее значение признака в выборке) и выборочная доля (доля единиц выборки, обладающая изучаемым свойством ), предельная ошибка

выборки ( x ) и предельная ошибка выборочной доли ( p ).

Очевидно, что генеральный и выборочный параметры отличаются друг от

~

друга. Так: предельная ошибка выборочной средней x x x ,а предельная ошибка выборочной доли р p где x, p - значения средней величины и

доли для выборочной совокупности, ~ - значения средней величины и доли

x,

~

x x ; p p . Причем,

генеральной совокупности, отсюда: x

предельная ошибка выборочной средней является произведением параметра функции Лапласа и средней ошибки выборочной средней (Sx):

53

 

 

 

 

 

 

 

 

 

 

x2

 

 

для повторного отбора

 

 

t

 

 

 

 

 

 

 

n

 

 

 

x

t S x

 

 

 

 

 

 

2

 

 

 

 

 

 

n

 

 

 

 

t

x (1

 

)

для бесповторного отбора

 

 

 

 

 

 

n

N

 

 

 

 

 

 

Предельная ошибка выборочной доли является произведением параметра функции Лапласа и средней ошибки выборочной доли (Sw)

 

 

 

 

 

 

 

 

 

 

 

 

 

p (1 p)

 

 

 

 

для повторного отбора

 

 

t

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

p

t Sw

 

 

 

 

 

 

 

 

 

p (1 p)

 

 

n

 

 

 

 

 

 

 

 

 

 

 

t

 

(1

 

 

)

для бесповторного отбора

 

 

 

 

 

 

 

n

 

 

N

 

 

где n объем выборки, N – объем генеральной совокупности.

Значение параметра t разыскивается по таблице значений функции Лапласа

Ф(t) P(

 

~

x

 

) (таблица 4), значение

p

m

 

 

 

 

 

x

 

 

, где m-число единиц

 

 

n

 

 

 

 

 

 

 

 

совокупности, обладающих изучаемым признаком. Некоторые значения функции Лапласа:

 

t

1

 

 

2

 

3

 

Ф(t)

0,683

 

 

0,954

 

0,997

Тогда доверительным интервалом

~

x ; x

;

для генеральной средней будет:

x

для генеральной доли, соответственно: p p ; p p .x x

Рассмотрим пример:

С целью изучения занятости населения города на предприятиях проведена 5%-ная механическая выборка, в результате которой получено следующее распределение предприятий по численности работников:

Группы по численности работников, чел.

Число предприятий

До

25

15

 

 

 

25

50

20

 

 

 

50

75

35

 

 

 

75

100

25

 

 

 

100

и выше

5

 

 

 

1.С вероятностью 0,997 определить ошибку выборочной средней и возможные границы, в которых ожидается средняя численность на предприятиях города.

54

2.С вероятностью 0,954 предельную ошибку выборочной доли и границы удельного веса предприятий с численностью работников от 25 до 100 человек.

Рассчитаем выборочную среднюю и дисперсию по способу моментов (ряд является интервальным рядом распределения с равными интервалами), для этого найдем условный ноль и шаг: A =62,5 (середина интервала с максимальной частотой); h=25.

Группы по численности

Число

xi

xi fi

x

2

работников, чел.

предприятий

i fi

 

 

 

 

 

 

 

 

 

 

 

 

До

 

25

15

-2

-30

 

60

 

 

 

 

 

 

 

 

25

 

50

20

-1

-20

 

20

 

 

 

 

 

 

 

 

50

 

75

35

0

0

 

0

 

 

 

 

 

 

 

 

75

 

100

25

1

25

 

25

 

 

 

 

 

 

 

 

100

 

и выше

5

2

5

 

20

 

 

 

 

 

 

 

 

Итого:

100

 

-15

125

 

 

 

 

 

 

 

 

Значения вероятности позволяет по таблице значения функции Лапласа найти значения параметра t, так для расчета предельной ошибки выборочной средней t=3, для расчета предельной ошибки выборочной доли t=2. Так как отбор был бесповторным, то расчет предельных ошибок производится по соответствующим формулам.

2

 

x

8,099

 

~

 

1. x =58,75;

 

 

27,6982;

 

50,651 x

66,849, средняя

x

численность работников на предприятиях города от 50 до 67 человек;

2.p 0,800; р 0,077974 72,2% % 87,8%, доля предприятий с

численностью от 25 до 100 человек на всех предприятиях города составляет от 72,2% до 87,8%.

Существует определенная зависимость между функцией Лапласа, дисперсией и значениями осредняемого признака статистической совокупности

(правило 3 , так:

-если доверительный интервал x , то у 68,3% единиц совокупности значение признака попадает в указанный интервал;

-

если

доверительный

интервал

x 2 ,

то

у

95,4%

единиц

 

совокупности значение признака попадает в указанный интервал;

-

если

доверительный

интервал

x 3 ,

то

у

99,7%

единиц

совокупности значение признака попадает в указанный интервал. Основные причины использования несплошного наблюдения: экономия

средств и времени, возможность быстрого получения необходимых данных.

55

4.2. Оптимальный объем выборки. Малая выборка

При планировании выборочного наблюдения с заранее заданным значением допустимой ошибки выборки очень важным является определение численности выборочной совокупности, которая с определенной вероятностью обеспечит заданную точность результатов наблюдения.

Формулы для расчета n можно легко определить из соответствующих формул выборочной средней и выборочной доли.

Метод отбора

Формулы объема выборки

для средней

для доли

 

 

 

 

 

t 2

2

 

 

 

 

 

t 2 p(1 p)

 

 

Повторный

 

n

x

 

n

 

 

2x

 

2p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Бесповторный

n

 

t 2 2x N

n

 

t 2 p(1 p)N

 

 

N 2x t 2 2x

 

N 2p t 2 p(1 p)

 

Для расчета объема выборки должны быть известны вероятность (для определения параметра функции Лапласа), дисперсия, предельные ошибки выборочной средней и дисперсия доли, полученные из ранее проведенных исследований или на основе специального выборочного обследования небольшого объема.

В экономических исследованиях оценка может производиться на основе малой выборки, что обусловлено рядом причин, таких как недостаточность временных и трудовых ресурсов для выполнения сплошного наблюдения.

Под малой выборкой понимается несплошное статистическое обследование, при котором выборочная совокупность формируется из небольшого числа единиц генеральной совокупности. Объем малой выборки не превышает 30 единиц и может доходить до 4-5 единиц.

Для малой

выборки средняя ошибка выборки S

м.в.

2

,

а тогда

n

 

 

 

 

 

 

 

 

 

предельная ошибка малой

выборки м.в. t Sм.в. ,

предельная

ошибка

 

 

 

 

 

 

выборочной доли

p( м.в.) t

 

p (1 p)

 

. При малых объемах выборки (менее

 

 

 

 

 

n

 

 

 

 

5%) множителем (1 Nn ) можно пренебречь.

Контрольные вопросы:

1.Какое наблюдение является выборочным?

2.В чем преимущества выборочного наблюдения перед сплошным?

3.В чем различие повторного и бесповторного отборов?

4.Опишите правило 3 .

56

5.Какова формула расчета предельной ошибки выборочной средней при повторном и бесповторном отборе?

6.Какова формула расчета предельной ошибки выборочной доли при повторном и бесповторном отборе?

7.Что такое параметр функции Лапласа?

8.Как определяются границы генеральной средней?

9.Как определяются границы генеральной доли?

10.Какие методы существуют для оценки связи атрибутивных признаков?

11.Чем отличаются выборочная и генеральная совокупности?

12.Какой показатель используется для оценки асимметрии и остроты вершины ряда распределения?

13.Для определения средней продолжительности поездки на работу планируется провести выборочное наблюдение методом случайного бесповторного отбора. Численность населения города составляет 670 тыс.чел. Каков должен быть необходимый объем выборочной совокупности, чтобы с вероятностью 0,954 предельная ошибка выборки не превышала 5 мин. При среднем квадратическом отклонении 25 мин.?

Тесты по теме:

1.Выберите верное утверждение, описывающее следующую цепочку неравенств 85% 93%, где - удельный вес предприятий, имеющих убыток, обследовано 100 предприятий региона, а вероятность pавна

0,954:

а) от 85% до 93% предприятий региона имеют прибыль с большой долей вероятности; б) от 85% до 93% предприятий региона имеют убыток как у 100 предприятий;

в) от 85% до 93% предприятий региона имеют убыток с вероятностью 0,954; г) удельный вес 100 предприятий с вероятностью 0,954 определяет их границы в генеральной совокупности от 85 до 93%.

2.Разница между значением показателя, полученного по выборочной совокупности, и генеральным параметром это (закончите фразу):

а) предельная ошибка выборки; б) среднее линейное отклонение; в) колеблемость признака; г) средняя ошибка выборки.

3. Для чего строятся доверительные интервалы: а) для оценки выборочных параметров; б) для оценки качества первичной информации;

в) для распространения результатов по выборке на генеральную совокупность; г) для графической иллюстрации различий в отдельных значениях признака.

57

4. Какие ошибки присущи только выборочному наблюдению: а) тенденциозные; б) случайные;

в) репрезентативности; г) абсолютные.

5.При проверке веса импортируемого груза на таможне методом случайно повторной выборки было отобрано 100 изделий. В результате был установлен средний вес изделия 40 г. при среднем квадратическом отклонении 4 г. С вероятностью 0,997 определить предельную ошибку выборки:

а) 0,3; б) 1,2; в) 0,1; г) 0,399.

ГЛАВА 5. СТАТИСТИЧЕСКИЕ МЕТОДЫ ИЗУЧЕНИЯ ВЗАИМОСВЯЗЕЙ В СТАТИСТИКЕ. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ.

5.1. Методы изучения связей в статистике

В исследовании социально-экономических явлений и процессов очень важным является статистическое изучение взаимосвязей признаков. Для этого применяют следующие основные приемы:

Метод сопоставления параллельных рядов, который состоит в сортировке статистических данных по возрастанию фактора, позволяющий установить наличие и направление связи между фактором и результатом, например:

Объем произведенной

средняя заработная плата в

продукции, тыс.у.е.

группе, тыс. руб.

3- 7

13,5

7-14

14,2

14-23

14,4

23-33

14,6

33-56

15,1

Пример демонстрирует, что с увеличением объема произведенной продукции (фактор) увеличивается размер средней заработной платы (результат), очевидно, что связь существует и она – прямая.

Графический метод представляет собой графическое изображение в прямоугольной системе координат значений результата на оси абсцисс (ось x), а значения фактора – на оси ординат (ось y). Полученные точки называют корреляционным полем. При отсутствии связи точки располагаются беспорядочно, чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи. Очевидной является возможность установления наличия и направления связи, в определенной степени

58

этот метод – графическая иллюстрация предыдущего метода (метода сопоставления параллельных рядов);

Метод аналитических группировок статистических данных,

оценивающий наличие связи, ее силу и тесноту (рассмотрен в 3 главе);

Корреляционно-регрессионный анализ (КРА) осуществляет построение аналитического выражения зависимости признаков, оценивает это аналитическое выражение, оценивает существующие между факторами и результатом связи, рассчитывает теоретические значения функции. Этот метод позволяет проектировать значение результата на основе задания значения факторам;

Непараметрические методы (для оценки связи атрибутивных признаков).

Первый и третий методы изучены ранее в теме «Сводка и группировка». Первый позволяет определить наличие связи и ее направление, третий – направление, силу и тесноту связи, второй метод, как уже было отмечено, является графической иллюстрацией первого. Ни один из этих методов не позволяет установить закономерность и аналитическое выражение связи между признаками.

Формы проявления взаимосвязей количественных признаков весьма разнообразны, в качестве двух самых общих видов выделяют:

-функциональную (жестко детерминированную) связь, которая ставит в соответствие значениям независимых переменных (факторов) одно или несколько значений результата;

-статистическую (стохастически детерминированную) связь, которая устанавливает связь между значениями факторов и любыми значениями результата в определенных границах с некоторыми вероятностями, но некоторые статистические характеристики (например, средние величины) могут быть представлены функциональной связью.

Для изучения того насколько показатели зависят друг от друга, какова эта зависимость в аналитическом выражении очень важная задача.

5.2.Корреляционно-регрессионный анализ

59

Для изучения взаимодействия признаков используют исследования по типам связей между различными явлениями и их признаками. Различают два типа связей

Функциональная

 

Статистическая

(жёстко детерминированная)

 

(стохастически

 

 

 

детерминированная)

 

 

 

 

 

 

 

Эта связь определённым

 

Эта связь значению одной переменной

образом ставящее в

 

ставит в соответствие любые значения

соответствие значению одной

 

другой в определённых пределах с

переменной одно или

 

некоторыми вероятностями, но её

несколько значений другой по

 

среднее значение или другие

строго определённому закону

 

статистические характеристики

или формуле

 

подчинены определённому закону

 

 

 

 

Корреляционно-регрессионный анализ (КРА) основывается на формах проявления взаимосвязей, используя статистическую связь, а точнее, частный случай стохастической связи – корреляционную.

Корреляционной связью называется такая связь между явлениями и их признаками, когда разным значениям переменных соответствуют различные условные средние значения другой переменной. Для изучения корреляционных

связей используют уравнение

регрессии,

которое представляет

собой

 

 

~

f (x1, x2 , x3..., xn ) ,

 

математическое выражение связи

признаков

y

xi

значения n факторов, базирующееся на изменении условной средней величины

~

результативного признака ( y ) с изменением факторов.

Корреляционный анализ: измеряет тесноту известной связи между факторами и результатом, оценивает факторы, оказывающие наибольшее влияние.

Регрессионный анализ: осуществляет выбор модели связи, определяет расчетные значения функции, устанавливает степень влияния признаков.

Отсюда, корреляционно -регрессионный анализ осуществляет построение аналитического выражения зависимости признаков, оценивает это аналитическое выражение, оценивает существующие между факторами и результатом связи, рассчитывает теоретические значения функции.

Классификация корреляционных связей может быть представлена следующим образом:

I.Направление действия прямая связь (большему значению аргумента

 

соответствует большее значение функции); обратная связь (большему

 

значению аргумента соответствует меньшее значение функции);

II.

Аналитическое выражение прямолинейная связь (например, описание

 

зависимости от одного фактора с помощью уравнения прямой линии

 

~

 

y a b x ) и криволинейная связь (другие математические функции

 

для описания зависимости фактора и результата, например, для одного

60