Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СТАТИСТИКА/2 курс, 1 семестр- умк.doc
Скачиваний:
44
Добавлен:
13.03.2015
Размер:
1.55 Mб
Скачать

Тема лекции 3. Статистическая сводка и группировка.

Конспект лекции: Контроль первичного статистического материала. Собранный первичный статистический материал подвергается логиче­скому и арифметическому контролю. Первый заключается в проверке смысловой согласованности сведений первичного документа, второй - в проверке счетной согласованности. Затем приступают к статистиче­ской сводке.

Статистической сводкой называют научное обобщение первичного ста­тистического материала с помощью итоговых подсчетов, выполняемых по определенной системе. Сводка может осуществляться либо ручным, либо машинным способом.

Статистическая группировка лежит в основе использования всего пер­вичного статистического материала. Группировкой в статистике назы­вают разделение единиц изучаемого общественного явления на одно­родные группы по существенным для него признакам.

Виды группировок, различают три вида группировок:

1) типологические (выделение социально-экономических типов яв­лений);

2) структурные (определение структуры однородных совокупно­стей);

3) аналитические (вскрытие связей и зависимостей между отдель­ными признаками общественных явлений).

Примером типологической группировки является группировка насе­ления по социальному составу, пример структурной группировки при­веден в таблице 1. Пример аналитической группировки приведен в таблице 2.

Возрастной состав металлорежущих станков судостроительного предприятия

Таблица 1

Группы станков по срокам службы, лет

Численность к итогу, %

До 10

38,2

10-20

25,3

20 и более

36,5

Всего

100,0

Сроки службы металлорежущих станков и затраты на их капитальный ремонт

Таблица 2

Группы станков по срокам службы, лет

Число станков в группе

Среднегодовые затраты на ремонт станков данной группы, тыс. руб./ ед. рем, ел.

Среднегодовые затраты на ремонт одного станка данной группы, тыс. руб./ ед. рем. ел.

0-5

26

224,0

8,60

5-10

24

214,0

8,90

10-15

20

190,0

9,50

15-20

14

138,0

9,85

20-25

16

176,0

11,00

Простые и комбинационные группировки. Простой называют группировку, в которой группы образованы по како­му-либо одному признаку (например, табл. 1,2). Комбинационной на­зывают группировку, в которой группы образуются на основе двух или более признаков, взятых в сочетании друг с другом.

Виды группировочных признаков. Существенные признаки, на основе которых производится группиров­ка, могут быть атрибутивными (они характеризуют качество явления и не имеют количественного выражения) и количественными (вариации данного явления выражаются числами). В первом случае число групп определяет характер признака, во втором — конкретные задачи того или иного исследования.

Таксономия. Группировка результатов статистического наблюдения может быть про­изведена также с помощью теории распознавания образов. Группы (так­соны) образуются в этом случае на основе специально разработанных алгоритмов. Наиболее плодотворен указанный метод для классифика­ции многомерных объектов.

Вторичная группировка. Если группировка первичного статистического материала не удовлет­воряет целям исследования либо с точки зрения числа групп, либо в отношении сопоставимости данных, прибегают ко вторичной группи­ровке. Различают два способа образования новых групп:

1) изменение интервалов первичной группировки;

2) выделение определенной доли единиц совокупности.

Результаты статистической сводки даются обычно в виде статистиче­ских таблиц.

Статистическая таблица — это рациональная форма изло­жения и анализа цифровых характеристик изучаемого общественного явления. В статистической таблице различают подлежащее (объект изучения) и сказуемое (числовые показатели, которыми характеризу­ется объект изучения). По характеру подлежащего статистические таблицы подразделяют­ся на:

- простые ( в них содержится лишь перечень объектов);

- групповые (в них содержатся группы, образованные по какому-либо одному признаку);

-комбинационные (в них содержатся группы, образованные по двум или более признакам).

Таблицы комбинационные, в которых совокупность разби­та на группы не по одному, а по нескольким признакам. Выбор типа таблицы зависит всегда от цели ее построения. Если таблицы используются для практических нужд планирова­ния и управления, то в них должны содержаться сведения по тем частям, в разрезе которых ведется планирование и управление. Чаще всего этой задаче соответствуют простые таблицы, исполь­зуются также и групповые. Если же ставится задача более глубо­кого познания исследуемого объекта, то используются группо­вые и комбинационные таблицы. В простых таблицах помещаются данные различного рода организациям: предприятиям, стройкам, учреждениям, министер­ствам и т.д., имеющие, как правило, познавательное значение.

Примером простой статистической таблицы является таблица 3, где приведена динамика цен на муниципальные квартиры в разных районах г. Мо­сквы за 5 месяцев 2009 г.

Динамика цен 1 кв. м муниципального жилья в Москве в 2009 г. (млн. руб.).

Таблица 3

Местоположение жилья

Январь

Февраль

Март

Апрель

Май

Митино

3,4

3,7

4,0

4,8

5,2

Южное Бутово

3,2

3,5

3,8

4,5

4,9

Северное Бутово

3,5

3,8

4,1

4,8

5,8

Отрадное

4,5

4,9

5,3

6,0

6,5

Верная улица

5,3

5,5

5,9

7,0

7,6

Жулебино

3,4

3,7

4,0

4,5

4,9

Сочетание территориальной группировки с данными за не­сколько месяцев 2009 г. позволяет получить весьма полезную ин­формацию. По данным табл. 3, мы видим наличие вариации цен за 1 кв. м муниципального жилья по районам города Москвы и, ес­ли в январе цена варьировала от 3,2 млн. руб: (Южное Бутово) до 5,3 млн. руб, (ул. Верная), то в мае границы вариации существенно сдвинулись вправо: от 4,9 млн. руб. (Северное Бутово) до 7,6 млн. руб. (ул. Верная). Кроме того, можно сделать вывод о наличии об­щей для всех районов Москвы тенденции неуклонного роста цен муниципального жилья. Данные подобного рода таблиц могут ис­пользоваться для принятия оперативных решений, например оценки того, как изменятся затраты на приобретение жилья, если задержаться с принятием решения хотя бы на месяц.

В отличие от простых групповые и комбинационные таблицы обладают важными аналитическими свойствами: они позволяют производить наглядные сравнения и вскрывать существенные свя­зи и различия в развитии явлений. Идея комбинационной табли­цы состоит в том, что каждую из групп в групповой таблице разби­вают на подгруппы по какому-либо признаку; выделенные под­группы могут дальше расчленяться по следующему признаку и т.д.

Результаты комбинационной группировки по большому ко­личеству признаков даже при небольшом числе интервалов груп­пировки становятся трудно обозримыми, и таблица теряет свое важнейшее преимущество - наглядность. Поэтому нецелесообраз­но составлять комбинационные таблицы по сочетанию более чем трех признаков и при количестве интервалов более четырех. Ис­пользование комбинационных таблиц и системы взаимосвязан­ных группировок позволяет провести глубокий и всесторонний анализ сложных общественных явлений.

Группировка, осуществляемая не последовательно по отдель­ным признакам, как при комбинационной группировке, а одно­временно по комплексу признаков, называется многомерной. Как уже сказано, характеристика одной и той же качественной сторо­ны изучаемого явления может быть дана с помощью набора при­знаков.

Например, для характеристики технического уровня раз­вития предприятий могут быть использованы следующие пока­затели: удельный вес активной части промышленно-производственных основных фондов, удельный вес автоматических машин и оборудования в составе рабочих машин и оборудования; элект­ро - вооруженность труда, машиновооруженность рабочих; степень охвата механизированным трудом, коэффициент обновления ма­шин и оборудования и т.д.

Характеризуя, таким образом, каждую единицу совокупности набором признаков, можно рассматривать эту единицу как точку в m - мерном пространстве, а задача многомерной группировки бу­дет состоять в выделении точек, составляющих однородные груп­пы единиц. Мерой близости (сходства) между единицами могут слу­жить различные критерии. В зависимости от выбранного критерия существуют различные методы многомерной группировки. Применение методов многомерной группировки связано с большой вычислительной работой и требует использования элек­тронной вычислительной техники.

Основная литература: 3 [60-65],4 [16-17].

Контрольные вопросы:

1. Виды статистических таблиц ;

2.Ис­пользование комбинационных таблиц.

3.Многомерные группировки и статистические таблицы.

4. Статистическая группировка и их виды;

5. Группировка статистического наблюдения.

Тема лекции 4. Абсолютные и относительные величины.

Конспект лекции: Абсолютные и относительные статистические величинами называют показатели, выражающие размеры количественных признаков конкретных общественных явлений. Это число именованные.

Единицами измерения бывают: натуральные, стоимостные, трудовые.

Натуральные: метр, тоннах, часах, киловатт. Стоимостные в денежном выражении трудовыми: затрат труда на единицу выпуска продукции, т.е человеко-час, человека - дни.

Они широко ис­пользуются в планировании и анализе деятельности предприя­тий, фирм, концернов, отраслей и экономики в целом. Многооб­разная характеристика всех сторон исследуемых социально-эко­номических явлений может быть дана лишь с помощью всех ви­дов обобщающих показателей. Вместе с тем, каждый вид показа­телей имеет определенное значение и занимает различное место в процессе познания реальной действительности. Путем непосредственного суммирования первичных данных получают обобщающие абсолютные показатели, которые харак­теризуют численность совокупности и объем (размер) изучаемо­го явления в конкретных границах времени и места. Например, численность населения России по переписи на 12 января 1999 г. составила 147,4 млн. человек, валовой внутренний продукт в 2004 г. - 630 трлн. руб. Первый из приведенных показателей характе­ризует численность населения по состоянию на определенный мо­мент, и получают такие абсолютные величины по результатам сводки данных единовременного наблюдения.

Второй из приве­денных показателей характеризует размер явления за определенный период время и он получен как результат сводки данных текущего наблюдения.

Абсолютные показатели являются всегда именованными чис­лами, т.е. имеют какую-либо единицу измерения. Натуральные единицы измерения применяют в тех случаях, когда единица из­мерения соответствует потребительским свойствам продукта. На­пример, производство цемента оценивается в тоннах, тканей - в квадратных метрах, автомобилей - в штуках и т.д. Натуральные единицы могут быть и составными (сложными).

Например, отработанное рабочими время учитывается в челове­ко-днях и человеко-часах, грузооборот автомобильного и желез­нодорожного транспорта - в тонно-километрах и т.п. Составные единицы отражают сочетание двух различных сторон явления. Так, при учете затрат рабочего времени отражается совместное измерение численности рабочих и времени их работы, при опре­делении объема работы транспорта - измерение объема грузов и расстояния перевозок.

При учете продукции в натуральном выражении нередки слу­чаи, когда применяются различные единицы измерения для од­ного и того же вида продукции. Если некоторые разновидности продукции обладают общ­ностью основного потребительного свойства, обобщенные итоги по выпуску этих разновидностей продукции можно получить, ис­пользуя условно-натуральные единицы. В этом случае одна из раз­новидностей принимается в качестве единого измерителя, а дру­гие приводятся к этому измерителю с помощью соответствующих коэффициентов пересчета.

Например, в тоннах условного топли­ва определяется общий объем потребленного на предприятии топ­лива, при определении объема производства минеральных удоб­рений пересчет производится на стандартное или 100%-ное со­держание питательного вещества и т.п.

При обобщении учетных данных даже на уровне предприя­тий, а тем более на уровне отраслей и народного хозяйства широ­ко используются стоимостные (денежные) единицы измерения. Для получения общего объема продукции в денежном выраже­нии количество единиц каждого вида продукции в натуральном выражении умножается на цену соответствующего вида, а затем полученные произведения суммируют во всем видам.

При опре­делении стоимостных показателей объема продукции абсолют­ные величины получаются расчетным путем. Тем более это каса­ется определения таких обобщающих показателей, как чистая про­дукция промышленности, прибыль, объем валового националь­ного продукта и др.

Так, объем чистой продукции определяют вычитанием из сто­имости объема продукции стоимости материальных затрат на ее производство. Прибыль от реализации продукции промышлен­ного предприятия получают как разность между выручкой от ре­ализации продукции по оптовым ценам предприятий и ее пол­ной себестоимостью. Расчетный метод определения абсолютных величин может опираться также на балансовый метод.

Например, наличие оборудования на конец года определяется прибавлени­ем к количеству оборудования на начало года числа единиц вве­денного оборудования и вычитанием числа единиц выбывшего оборудования. Таким образом, абсолютные величины получают непосредственным подсчетом данных статистического наблюде­ния или расчетным путем.

Относительными статистическими величинами называют обобщающие показатели, характеризующие количественные отношения обществен­ных явлений. Различают две формы выражения относительных вели­чин: неименованные относительные величины и именованные относи­тельные величины и семь видов относительных величин: задания, выполнения задания, структуры, координации, интенсивности, динами­ки, сравнения. Относительная величина структуры — это соотношение размеров ча­сти и целого. Относительной величиной координации называют соотношение час­тей целого между собой. Относительная величина интенсивности — это соотношение разно­именных, но связанных между собой величин. В числителе берется ве­личина явления, степень распространения которого изучается, а в зна­менателе — объем той среды, в которой происходит распространение данного явления, например показатель производства продукции на од­ного работающего (производительность труда).

Относительные величины планового задания; относительные величины структуры; относи­тельные величины координации; относительные величины на­глядности. Относительная величина динамики характеризует изменение явления во времени и показывает, во сколько раз увеличился (или уменьшился) уровень показателя по сравнению с каким-либо предшествующим периодом.

Для расчета относительной величи­ны динамики определяют отношение уровней, характеризующих изучаемое явление в разные периоды времени. Как правило, при анализе опираются на данные за ряд периодов. Так, в статистиче­ской отчетности содержатся показатели за каждый месяц отчетного года или за соответствующий квартал. На основе обобще­ния квартальных и месячных данных получаем итоги за каждый год. Статистические показатели за каждый квартал отчетного го­да можно сравнить с показателем непосредственно предшеству­ющего квартала или же с уровнем соответствующего квартала предшествующего года или же с уровнем четвертого квартала предшествующего года, т.е. рассчитываются относительные вели­чины с переменной или с постоянной базой сравнения. Расчет относительных величин динамики показан в таблице 4.

Внешнеторговый оборот России со странами дальнего зарубежья в I кв. 2009 г. Таблица 4

Месяц

и год

Внешнеторговый оборот России, млн. доля США (со странами дальнего зарубежья)

В том числе

Коэффициент роста внешнеторгового оборота, %

Удельный вес, %

экспорт

импорт

к соотв.

периоду прошлого

года

к пред, месяцу

к дек. 2008г

экспорта

импорта

1

2

3

4

5

6

7

8

9

Дек. 2008г.

8640

4730

3910

92

-

100

54,75

45,25

Янв. 2009 г.

5629

3188

2441

106

65

65

56,64

43,36

Фев. 2008г.

6902

3800

3102

117

123

80

55,06

44,94

Март 2009г.

7741

4536

3205

121

112

90

58,60

41,40

Относительные величины имеют форму коэффициентов, ес­ли они исчисляются делением сравниваемой величины на базу сравнения. Если коэффициент умножить на 100, то получим ре­зультат сопоставления в процентах. Таковы относительные ве­личины, характеризующие динамику внешнеторгового оборота (см. гр. 5, 6, 7, табл. 4.). Рассчитанная относительная величина динамики показывает, например, что в январе 2009 г. по сравне­нию с декабрем 2008 г. оборот внешней торговли России снизил­ся на 35%. Эта величина исчисляется как разность между вели­чиной темпа роста (коэффициент роста, выраженный в процен­тах) и 100% и называется относительным приростом (в приводи­мом примере - относительное снижение). В таблице 4, расчет коэффициентов роста с постоянной базой ведется в сравнении с декабрем 2008 г.

Выбор базы сравнения нередко имеет сущест­венное значение. Так, в ряде случаев в качестве базы сравнения принимаются годы, являющиеся исторически обусловленной гра­ницей отдельных периодов времени. В планах предприятий задания устанавливаются как в абсо­лютных показателях, так и в виде относительных величин, кото­рые показывают, во сколько раз или на сколько процентов дол­жна увеличиться (уменьшиться) величина показателя по плану в сравнении с его уровнем в предшествующем периоде.

Напри­мер, по плану темп роста экспорта продукции предприятия дол­жен был составить в 2009 г. (в % к предшествующему году) 106,1%, относительная величина динамики объема экспорта продукции составила 107,3%. Сравнение двух относительных величин - пла­нового задания и динамики свидетельствует о перевыполнении плана по экспорту продукции предприятия в 2009г.

Степень вы­полнения плана оценивается с помощью относительной величи­ны выполнения плана, которую получают отношением фактиче­ского уровня показателя в отчетном периоде к его уровню, запла­нированному на этот же период.

Понятие о статистическом графике. Элементы статистического графика.

По форме и образу статистические графики различают точечные, линейные, плос­костные, объемные и изобразительные диаграммы.

По задачам различают графики статического и динамического срав­нения, структурные, распределения частоты явлений, связи явлений, выпол­нения плана, балансовые и территориального размещения.

Графики статического сравнения применяются для сопоставления отдельных величин, относящихся к одному периоду или моменту времени.

Графический образ: линейные, плоскостные и объемные диаграммы. Используются для сравнения событий, изменяющихся во времени. Графический образ: линейный, например таблицу 4 можно представить как рисунок 1, выполнен на EXCEL-е.

Графики структуры. Применяются для долевого представления целого. Графический образ: линейные и плоскостные диаграммы.

Графики распределения частоты явлений. Используются для показа того, как распределяется рассматриваемое явление по различ­ным вариантам группировочного признака. Графический образ: ли­нейные и плоскостные диаграммы (полигоны и гистограммы).

Графики для изображения связи явлений. Применяются для показа тесноты и формы связи явлений. Графический образ: точечные и линейные диа­граммы (поле корреляции).

Балансовые изображения. Применяются для показа соотношений противоположных явлений, например поступления и расхода элект­роэнергии. Графический образ: линейные и плоскостные диаграммы.

Изображение территориального размещения. Применяется для изображения статистических данных на определенной территории. Графический образ: плоскостная диаграмма. Различают картограм­му (отдельные районы контурной географической карты обозначены различно в зависимости от величины статистического признака) и картодиаграмму (размещение на географической карте графических образов в масштабе, соответствующем величине изображаемых ста­тистических показателей).

Рисунок 2. Внешнеторговый оборот России со странами дальнего зарубежья в I кв. 2009 г.

Основная литература 1[71-85], 8 [118-219];

Контрольные вопросы:

1. Назовите единицы измерения абсолютных показателей?

2. Относительные величины, виды показателей?

3. Рассчитанная относительная величина и их динамика.

4. Как вычисляются коэффициент прироста?

5. Как исчисляются коэффициент роста?

Тема лекции 5. Средние величины.

Конспект лекции: Объект статистики как общественной науки во многом специ­фичен, в известном смысле формы величины и мето­ды познания показателей. Изучение разнообразных форм стати­стических показателей со стороны величины (средние, показа­тели структуры, индексы и т. д.) с учетом специфики явлений жизни общества осуществляет общая теория статистики. Она со­средоточивает внимание на общих свойствах статистических пока­зателей и составляющих их элементов, на общих методах и прие­мах получения (познания) объективных показателей.

Изучение многообразия объективных статистических показа­телей по содержанию (включая все богатство форм содержания) в связи с их количественной стороной выполняет социально-эко­номическая статистика со всеми своими отраслевыми подразделе­ниями. Общество и рыночная экономика представляют собой весь­ма сложную систему, имеют много взаимосвязанных существен­ных сторон и отношений. Адекватная изучаемому объекту дифференциация его особых, являющихся предметом статистики признаков по содержанию) означает систему признаков, систему пока­зателей. Следовательно, социально-экономическая статистика рассматривает систему, объективных статистических показателей состояния и развития общества, состояния и развития экономики.

Среди обобщающих показателей, которыми статистика характеризует общественные явления, большую роль играют среднее величины.

Средней величиной в статистике называют обобщающую характеристику совокупности однородных общественных явлении, которая показывает типичный уровень варьирующего признака в расчете на единицу совокупности. Она обобщает многие индивидуальные величины одного и того же вида. Вид среднего в статистике подчинен социально-экономическому содержанию изучаемых явлений. Соотношения, выражающие смысл средних, называют исходными соотношениями. Они являются базой расчета и критерием правильности выбора вида средней в статистике. Часто применяются средняя арифметическая. Например: Средний срок службы станков = Суммарный срок службы всех станков / Общее количество станков.

(1)

Виды средних величин. Средние, используемые в статистике, делятся на два класса: степен­ные средние и структурные средние. Из первого класса наиболее часто применяются средняя арифметическая и средняя гармоническая. Сред­няя геометрическая применяется только при исчислении средних пока­зателей рядов динамики, средняя квадратическая — при исчислении показателей вариации.

Рисунок 3. Кривая распределения средних величин

Представителями второго класса средних явля­ются мода и медиана.

Средняя ариф­метическая. Для сгруппированных данных средней ариф­метической :

(2)

где хi - варианты признака; тi - частоты (частости), i=1,2,…,n

Пример расчета средней арифметической и средней гармонической

Таблица 5

Группы станков по срокам службы, х

Число станков в группе mi

Общий срок службы станков по данной группе М=хm

0-5

26

65,0

5-10

24

180,0

10-15

20

225,0

15-20

14

245,0

20-25

16

360,0

Всего

100

1100,0

Если мы располагаем данными, приведенными в графах 1 и 2 табл.5, то исходное соотношение приводит к расчету средней арифметической:

Средняя гармоническая : (3)

где Мi - суммарный объем i - признаков в данной группе.

Если мы располагаем данными, приведенными в графах 1 и 3 табл.5, то исходное соотношение приводит к расчету средней гармонической:

Модой в статистике называют значение признака в данной совокупно­сти, имеющего наибольшую частоту. Значение моды для дискретного вариационного ряда может быть найдено непосредственно. Для интервального вариацион­ного ряда значение моды Мо определяется по следующей формуле

(4)

где хМо - нижняя граница модального интервала;

iMo - величина модального интервала;

mMo , mMo-1, mMo+1 частота модального, предмодального и послемодального интервалов соответственно.

Приведенная формула (3) моды может быть использована в ва­риационных рядах с равными интервалами на рисунке 3 и расчеты соответственно.

Медианой в статистике называют признак, делящий численность вариационного ряда по сумме накопленных частот на две равные части. Для нахождения медианы Ме в интервальном вариационном ряду применяют следующую формулу:

(5)

где Σm - сумма частот вариационного ряда; SMe-1 - сумма накопленных частот до медианного интервала.

Для примера таблицы 5 медиана равно 10 лет.

Дополнительно к медиане для характеристики структуры вариационного ряда исчисля­ют квартили и процентили, которые ряд делят по сумме частот соответ­ственно на четыре и на сто равных частей.

Средняя величина признака не позволяет судить о тех колебаниях, ко­торым подвержен изучаемый признак в данной совокупности. Для оп­ределения величины этой колеблемости в статистике применяют пока­затели вариации.

Медиану и моду можно определить графически. Медиана определяется по кумуляте. Для ее определения вы­соту наибольшей ординаты, которая соответствует общей числен­ности совокупности, делят пополам. Через полученную точку про­водят прямую, параллельную оси абсцисс, до пересечения ее скумулятой. Абсцисса точки пересечения является медианой.

Рисунок 4. Полигон распределения группированных модальных данных

Мода также определяется по гистограмме распределения ( рисунок 4.). Для это­го правую вершину модального прямоугольника соединяем с пра­вым верхним углом предыдущего прямоугольника, а левую вер­шину модального прямоугольника - с левым верхним углом по­следующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.

Основной характеристикой центра распределения является средняя арифметическая, опирающаяся на всю информацию об изучаемой совокупности единиц. Однако в ряде случаев средняя арифметическая должна быть дополнена и даже заменена модаль­ным значением или медианой.

Например, в статистическом конт­роле качества продукции удобнее пользоваться медианой, а не средней арифметической, так как определение медианы для ран­жированного ряда данных не требует специального расчета. Кро­ме того, она не чувствительна к крайним значениям взятой конт­рольной пробы. В рядах с открытыми интервалами также целе­сообразнее пользоваться в качестве характеристики центра рас­пределения модой и медианой. Мода применяется при изучении спроса населения на товары народного потребления (например, на обувь, одежду и т.д.), когда интерес представляет определение модального размера, т.е. размера, пользующегося наибольшим спросом.

Основная литература: 1[121-169], 4 [20-29].

Контрольные вопросы:

1. Значение моды для дискретного вариационного ряда;

2. Величина модального интервала для ряда

3. Средние величины в статистике

4. Назовите виды средних величин.

5. Общая характеристика структурного ряда

Тема лекции 6. Показатели вариации и способы их расчета.

Конспект лекции: Группировочный признак, имеющий количественное выражение, варь­ирует, т. е. принимает различное числовое значение у каждого элемента совокупности (варианты).

Вариация признака может быть:

- прерывной (дискретной) — иметь только вполне определенные значения, между которыми не может быть промежуточных;

- непрерывной — иметь любые значения с определенной степенью точности. Средняя величина признака не позволяет судить о тех колебаниях, ко­торым подвержен изучаемый признак в данной совокупности. Для оп­ределения величины этой колеблемости в статистике применяют пока­затели вариации.

Размах вариации R находится так:

R=xma x - xmin (6)

где xmax , xmin - максимальное и минимальное значение признака соот­ветственно.

Среднее линейное отклонение для несгруппированных данных определяется по формуле :

,

для сгруппированных данных

(7)

Дисперсия σ2 для несгруппированных данных находится так:

. (8)

для сгруппированных данных σ рассчитывается следующим образом:

(9)

Размах вариации, среднее линейное и среднее квадратиче­ское отклонение являются величинами именованными. Они имеют те же единицы измерения, что и индивидуальные зна­чения признака.

Дисперсия и среднее квадратическое отклонение - наиболее широко применяемые показатели вариации. Объясняется это тем, что они входят в большинство теорем теории вероятностей, слу­жащих фундаментом математической статистики. Кроме того, дисперсия может быть разложена на составные элементы, позво­ляющие оценить влияние различных факторов, обусловливаю­щих вариацию признака. В последующих разделах будет показано, как дисперсия используется для построения показателей тесно­ты корреляционной связи, при оценке результатов выборочных наблюдений, в дисперсионном анализе и т.д.

Расчет показателей вариации для 20 банков m=20, сгруппированных по размеру прибыли, показан в таблице 6.

Таблица 6

Размер прибыли, млрд. тенге.

Число банков

Расчетные показатели

Интервалы

группы

mi

хi

mi хi

xi -

хi-mi

(xi-)│2 mi

1

2

3

4

5

6

7

3,7 - 4,6

2

4,15

8,30

-1,935

3,870

7,489

4,6 - 5,5

4

5,05

20,20

-1,035

4,140

4,285

5,5 - 6,4

6

5,95

35,70

-0,135

0,810

0,109

6,4 - 7,3

5

6,85

34,25

+0,765

3,825

2,926

7,3 - 8,2

3

7,75

23,25

+ 1,665

4,995

8,317

Итого

20

121,70

17,640

23,126

Примечание. Знак (-) в первом интервале указывает, что значения призна­ка, совпадающие с верхней границей интервала, включаются в следующий ин­тервал. Это связано с тем, что верхняя граница последнего интервала больше х1 данной совокупности. По таблице 6 =6,085 млрд. тенге,d=0,882 млрд. тенге σ2=1,156, σ =1,075 млрд. тенге. Значение среднее линейное и среднее квадратическое отклонения по­казывает на сколько в среднем колеблется величины признаков хi.

Ряды распределения. Описание колебаний варьирующего признака осуществляется с помо­щью ряда распределения, который представляет собой характеристику вариантов признака их частотами. В соответствии с разными вариация­ми признака различают дискретный вариационный ряд и непрерывный, или интервальный, вариационный ряд. Графически дискретный ряд распределения изображается в виде полигона (многоугольника рис. 4), а не­прерывный ряд — в виде гистограммы рис.3, 5. При анализе непрерывного ряда распределения с неравными интервалами прибегают к показателю «плотность распределения» — числу единиц совокупности, приходя­щемуся на единицу ширины интервала. Для различных целей возникает необходимость находить ряд накопленных частот, который графически представляется кумулятивной кривой рис.3.

Вариация признака, вызванная случайными факторами (внутригрупповая дисперсия), определяется следующим образом:

σ2r=Σσ2rnr/Σnr (10)

где δ 2r — дисперсия в отдельных группах. Она вычисляется по формуле:

σ2r=(xi-X)2nr (11)

Сумма указанных дисперсий образует общую дисперсию признака:

δ2+ σ2=σ2 .

Данное равенство определяет правило сложения дисперсий. Оно ис­пользуется, в частности, в корреляционном анализе при определении тесноты связи результативного признака и факторных значений.

Рисунок 5. Дискретный ряд распределения

По аналитической группировке можно измерить связь с помощью еще одного показателя: эмпирического корреляцион­ного отношения. Этот показатель обозначается греческой бу­квой ƞ (эта). Он основан на правиле разложения дисперсии, со­гласно которому общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий.

Эмпирическое корреляционное отношение измеряет, часть общей колеблемости результативного признака и вызы­вает изучаемый фактор.

Соответственно этот показатель рас­считывается на основе отношения факторной дисперсии к общей дисперсии результативного признака:

- коэффициент детерминации, (12)

- эмпирическое корреляционное отношение. (13)

Этот показатель принимает значения в интервале [0, 1]: чем ближе к 1, тем теснее связь, и наоборот.

Дисперсия обладает рядом свойств, некоторые из них позво­ляют упростить ее вычисления:

1) дисперсия постоянной величины равна нулю;

2) если все варианты значений признака уменьшить на одно и то же число,

то дисперсия не уменьшится;

3) если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшится в k2 раз.

Выполнение группировки позволяет разло­жить общую дисперсию признака на две дисперсии, одна из кото­рых будет характеризовать часть вариации, обусловленную вли­янием фактора, положенного в основу группировки, а вторая - вариацию, происходящую под влиянием (внешних) прочих факторов (кро­ме фактора, положенного в основу группировки). Расчеты приведены в предыдущей таблице 3.

Например, вариации цен на муниципальное жилье ( таблица 3 ) в мае 2009 г. было сделано после расчета показателя относительной колеблемости уровня признака, т.е. коэффициента вариации.

Расчет коэффициента вариации цен 1 кв. м муниципального жилья в Москве приводит к следующим результатам:

В январе 2009г.

В мае 2009г.

Следовательно, в мае 2009 г. вариация цен 1 кв. м муници­пального жилья в Москве снизилась 2,88 % по сравнению с январем 2009 г.

Отклонение индивидуальных значений признака от общей средней можно представить так. Вариацию, обусловленную влиянием фактора, положенно­го в основу группировки, характеризует межгрупповая дисперсия σ-, которая является мерой колеблемости частных средних по группам хi общей средней Х и исчисляется по формуле (9) где k - число групп; п- число единиц в i-и группе; - частная сред­няя поi-и группе; X - общая средняя по совокупности единиц.

Вариацию, обусловленную влиянием прочих факторов, харак­теризует в каждой группе внутригрупповая дисперсия (11).

Основная литература : 4[26-28], 3 [55-59], 2[63-65].

Контрольные вопросы:

1. Формула для расчета дисперсии

2. Формула для расчета среднего квадратического отклонения.

3. Виды и размах вариации

4. Дисперсия и среднее квадратическое отклонение

5. Ряды распределения.

Тема лекции 7. Выборочное наблюдение.

Конспект лекции: Выборочное наблюдение - наиболее совершенная разновидность не­сплошного наблюдения, при котором из общей (генеральной совокуп­ности) обследованию подвергается некоторая часть, называемая выбо­рочной совокупностью. Обобщающие показатели, характеризующие эту обследованную часть, распространяются на всю совокупность.

Вы­борочный метод отличается от других видов несплошного наблюдения, во-первых, тем, что заранее устанавливается, сколько единиц или какая часть генеральной совокупности будет обследована, и, во-вторых, зара­нее определяется порядок отбора, при котором выборочная совокуп­ность в достаточной мере репрезентовала бы (представляла) генераль­ную совокупность.

Применение выборочного метода связано с возникновением присущих ему ошибок репрезентативности, которые представляют собой разность между генеральными и выборочными обобщающими показателями.

Существуют различные способы отбора единиц исследуемой генераль­ной совокупности в целях образования выборочной. Их классифика­ция представлена на рисунке 1. Рассмотрим различные способы отбора единиц генеральной совокуп­ности, представленные на рисунке 6.

Индивидуальный отбор - выборочная совокупность образуется при последовательном отборе отдельных единиц.

При серийном отборе формирование выборочной совокупности производится сериями.

Вы­борку, при которой отбор производится непреднамеренно, случайно, называют случайной, если же механически через равный интервал - механической.

Типический отбор предполагает предварительное деление генеральной совокупности на однородные группы, а затем отбор из образованных групп одним из рассмотренных выше способов.

Повтор­ный отбор предполагает возвращение перед очередным отбором обсле­дованной единицы или серии в генеральную совокупность, бесповтор­ный отбор такого возвращения не предусматривает.

Особой разновидностью выборочного наблюдения является моментно-выборочное наблюдение. Оно состоит в фиксации наличия отдель­ных элементов изучаемого процесса на определенные моменты времени без учета длительности данного элемента.

С точки зрения оценки репрезентативности выборочных обобщаю­щих показателей различают большие и малые выборки.

Будем считать выборку безусловно большой, если численность единиц в ней превыша­ет 100, и безусловно малой, если численность единиц в ней меньше 20.

Рисунок 6. Виды отбора выборочного наблюдения

Определение объема и ошибок большой выборки

Определение ошибок и объема выборки покажем применительно к слу­чайному бесповоротному отбору, так как последний чаще всего имеет место в социально-экономических исследованиях.

При случайном отбо­ре выборочная средняя , как и выборочная доля ω, является перемен­ной величиной при различных исходах выборки и колеблется около со­ответствующих генеральных значений средней и доли p.

Мерой этой колеблемости является стандартная ошибка средней и доли:

(14)

где п - объем выборки;

N - объем генеральной совокупности;

s2 - выборочная дисперсия.

Предельная ошибка выборки может быть определена для средней как:

,

а для доли как

(где р - генеральная доля). Коэффициент t зависит от вероятности, с которой можно гарантировать, что предельная ошибка выборки не пре­высит t-кратную стандартную ошибку.

Значения t для различных веро­ятностей (интеграл вероятностей) табулированы. Объем выборки для определения средней:

(15)

и для определения доли

(16)

Определение объема и ошибок малой выборки

В практике социально-экономических исследований часто приходится пользоваться малыми выборками. При малых выборках методы оценок параметров генеральной совокупности, разработанные применительно к нормальному распределению, нуждаются в корректировке. Так, стан­дартная ошибка средней имеет вид:

(17)

а взаимосвязь t и вероятности для расчета предельной ошибки определяются в этом случае распределением Стьюдента, значения которого также табулированы. Определение объема малой выборки производится таким же способом, что и большой, но с использованием указанного распределения.

Основная литература 2 [114-268], 4 [73-88],

Дополнительная литература 1[ 46-70].

Контрольные вопросы:

1. Вы­борочный метод

2. Виды отбора выборочного наблюдения

3. Предельная ошибка доли

4. Предельная ошибка выборки

5.Вид стан­дартной ошибки среднего

Тема лекции 8. Ряды динамики.

Конспект лекции: Ряды динамики - это ряд расположенных во времени статистических показателей, характеризующих изменение данного общественного яв­ления. Он состоит из двух строк или столбцов: про­межутков или моментов времени, к которым относятся уров­ни, и самих уровней признака (показателя). Ряд, в котором время задано в виде промежутков — лет, месяцев, суток, на­зывается интервальным динамическим рядом. Ряд, в котором время задано в виде конкретных дат (моментов времени), на­зывается моментным динамическим рядом.

Моментным динамическим рядом называют ряд абсолютных и относительных величин, характеризующих уровень изучаемого явления у на определенный мо­мент времени t. Уровни динамического ряда у - случайные величины, имеющие определенную закономерность распределения во времени. В ряде случаев они не являются независимыми: зачастую ряды динамики наблюдает зависимость последующих уровней яв­ления от предшествующих им во времени. Показатели анализа уровней ряда динамики на рисунке 6.

Абсолютное изменение уровней — в данном случае его мож­но назвать абсолютным приростом — это разность между срав­ниваемым уровнем и уровнем более раннего периода, приня­тым за базу сравнения. Если эта база — непосредственно пре­дыдущий уровень, показатель называют цепным, если за базу взят, например, начальный уровень, показатель называют ба­зисным. Формулы абсолютного изменения уровня:

цепное: (18)

базисное: (19)

Темп роста — это отношение сравниваемого уровня (бо­лее позднего) к уровню принятому за базу сравнения (более раннему). Темп роста исчисляется в цепном варианте к предыдущему уровню или в базисном варианте — к одному и тому же, обычно начальному уровню. Он говорит о том, сколько процентов составляет сравниваемый уровень по от­ношению к уровню, принятому за базу, или во сколько раз сравниваемый уровень больше уровня, принятого за базу. При этом если уровни снижаются со временем, то сказать,

Относительное изменение уровней — связь относительных показателей динамики. Обозначим темп изменения через Т. Тогда имеем:

цепной темп роста

базисный темп роста

Средние показатели уровня ряда. Средняя хронологическая (для моментного ряда)

(20)

где п — количество моментов (временных дат).

Средний уровень интервального ряда :

где п — число периодов времени.

Средний абсолютный прирост : (21)

где п — число промежутков между датами.

Средний темп роста :

где п — число осредняемых темпов роста.

Средний темп прироста:

Рисунок 7. Классификация динамических рядов.

Например: имеется данные динамических рядов изменение цен на потребительские товары и услуги по Акмолинской области на конец периода, к декабрю предыдущего года, (%) таблице 7.

Потребительские товары и услуги Акмолинской области РК.

Таблица 7

Регионы/годы

Потребительские товары и услуги

2002 г

2003 г

2004 г

2005 г

2006 г

2007 г

Акмолинская

7,1

7,2

8,1

16,1

8,4

7,8

Базовый темп роста

100,0

101,4

114,0

226,7

118,3

109,8

Цепной темп роста

100,0

101,4

112,5

198,7

52,1

92,8

*Оплата труда в РК. Статистический сборник. Астана. 2009.

Рисунок 8. График на потребительские товары и услуги Акмолинской области

Основная литература 1 [443-558], 3 [73-88],

Дополнительная литература 1[ 46-70].

Контрольные вопросы:

1. Абсолютное изменение уровней динамики

2. Относительное изменение уровней динамики

3. Классификация динамических рядов

4. Средний темп роста

5. Средний темп прироста.

Тема лекции 9. Методы анализа тенденции в рядах динамики

Конспект лекции: Моделирование основной тенденции (тренда) временных динамических рядов связаны с случайным соци­ально-экономическим процессом. При этом разбить на систематическую составля­ющую, которая является детерминированной и связанной с ходом вре­мени t, и случайную компоненту ε t - остаток, т. е.:

Yt=ƒ(t)+εt (22)

Первое слагаемое отражает некоторое общее направление развития общественных явлений их основную тенденцию (тренд), второе - действие случайных факторов на уровень экономического явления. Количественное описание тенденции может быть сделано с помощью различных методов.

Метод укрупнения интервалов

Сущность его заключается в том, что с помощью средних величин коле­бания отдельных уровней временного ряда взаимно погашаются и тренд ряда проявляется более отчетливо.

Метод скользящего среднего состоит в нахождении центрированных средних скользящего интервала. Сглаженный ряд короче первоначального на

( К- 1) уровней при ширине избранного интервала К.

Метод аналитического выравнивания состоит в аналитическом выравнивании фактические уровни временного ряда и заменяются теоретическими на основе линейной или нелиней­ной формы связи. В качестве факторного признака принимается время. Таким образом, тенденция временного ряда представляется некоторым уравнением регрессии.

Авторегрессионная модель временного динамического ряда

Авторегрессия первого порядка. Уровни временного динамического ряда - случайные величины, имеющие определенную закономерность распределения во времени. В ряде случаев они не являются независимыми: зачастую во временных рядах наблюдается зависимость последующих уровней яв­ления от предшествующих им во времени. Эта зависимость называется автокорреляцией и может быть оценена коэффициентом автокорреля­ции ρt.

(23)

Последовательность коэффициентов автокорреляции между данным временным и этим же рядом, сдвинутым на τ сдвигов (лаги). Зависимость уровня ряда от предыдущих с увеличением сдвига τ.

Зависи­мость одних уровней ряда от других может быть оценена количественно с помощью уравнения авторегрессии.

Парное линейное уравнение авторегрессии (уравнение первого по­рядка) имеет вид:

(24)

где a 0, а1 - параметры уравнения.

Фактическое значение уровня временного ряда может быть пред­ставлено соответственно как:

(25)

где ε - остаток.

Авторегрессия высших порядков. Если данные автокорреляционной функции свидетельствуют о высокой степени тесноты связи уровней временного ряда нескольких последовательных сдвигов, то для модели­рования данного уровня можно прибегнуть к построению многофактор­ной регрессии. Независимыми факторными признаками в ней будут выступать уровни явления нескольких предыдущих периодов.

Так, уравнение авторегрессии с тремя факторными признаками (3-го порядка) имеет вид:

(26)