- •Министерство образования и науки Республики Казахстан
- •1.Учебная программа дисциплины – Syllabus
- •1.1 Данные о преподавателях:
- •1.2 Данные о дисциплине:
- •Выписка из учебного плана
- •1.5. Краткое описание дисциплины
- •1.6. Перечень и виды заданий и график их выполнения:
- •1.7 Список литературы
- •2.Содержание Активного раздаточного материала
- •2.2. Конспект лекционных занятий
- •Тема лекции 3. Статистическая сводка и группировка.
- •Корреляция между временными рядами
- •2.3 Планы практических занятий
- •2.5 Планы занятий в рамках самостоятельной работы студентов
- •2.6 Планы занятий в рамках самостоятельной работы студентов (срс)
- •2.7.Тестовые задания для самоконтроля с указанием ключей правильных ответов
- •Коды правильных ответов
- •Глосарий
- •Выходные сведения
Тема лекции 3. Статистическая сводка и группировка.
Конспект лекции: Контроль первичного статистического материала. Собранный первичный статистический материал подвергается логическому и арифметическому контролю. Первый заключается в проверке смысловой согласованности сведений первичного документа, второй - в проверке счетной согласованности. Затем приступают к статистической сводке.
Статистической сводкой называют научное обобщение первичного статистического материала с помощью итоговых подсчетов, выполняемых по определенной системе. Сводка может осуществляться либо ручным, либо машинным способом.
Статистическая группировка лежит в основе использования всего первичного статистического материала. Группировкой в статистике называют разделение единиц изучаемого общественного явления на однородные группы по существенным для него признакам.
Виды группировок, различают три вида группировок:
1) типологические (выделение социально-экономических типов явлений);
2) структурные (определение структуры однородных совокупностей);
3) аналитические (вскрытие связей и зависимостей между отдельными признаками общественных явлений).
Примером типологической группировки является группировка населения по социальному составу, пример структурной группировки приведен в таблице 1. Пример аналитической группировки приведен в таблице 2.
Возрастной состав металлорежущих станков судостроительного предприятия
Таблица 1
Группы станков по срокам службы, лет |
Численность к итогу, % |
До 10 |
38,2 |
10-20 |
25,3 |
20 и более |
36,5 |
Всего |
100,0 |
Сроки службы металлорежущих станков и затраты на их капитальный ремонт
Таблица 2
Группы станков по срокам службы, лет |
Число станков в группе |
Среднегодовые затраты на ремонт станков данной группы, тыс. руб./ ед. рем, ел. |
Среднегодовые затраты на ремонт одного станка данной группы, тыс. руб./ ед. рем. ел. |
0-5 |
26 |
224,0 |
8,60 |
5-10 |
24 |
214,0 |
8,90 |
10-15 |
20 |
190,0 |
9,50 |
15-20 |
14 |
138,0 |
9,85 |
20-25 |
16 |
176,0 |
11,00 |
Простые и комбинационные группировки. Простой называют группировку, в которой группы образованы по какому-либо одному признаку (например, табл. 1,2). Комбинационной называют группировку, в которой группы образуются на основе двух или более признаков, взятых в сочетании друг с другом.
Виды группировочных признаков. Существенные признаки, на основе которых производится группировка, могут быть атрибутивными (они характеризуют качество явления и не имеют количественного выражения) и количественными (вариации данного явления выражаются числами). В первом случае число групп определяет характер признака, во втором — конкретные задачи того или иного исследования.
Таксономия. Группировка результатов статистического наблюдения может быть произведена также с помощью теории распознавания образов. Группы (таксоны) образуются в этом случае на основе специально разработанных алгоритмов. Наиболее плодотворен указанный метод для классификации многомерных объектов.
Вторичная группировка. Если группировка первичного статистического материала не удовлетворяет целям исследования либо с точки зрения числа групп, либо в отношении сопоставимости данных, прибегают ко вторичной группировке. Различают два способа образования новых групп:
1) изменение интервалов первичной группировки;
2) выделение определенной доли единиц совокупности.
Результаты статистической сводки даются обычно в виде статистических таблиц.
Статистическая таблица — это рациональная форма изложения и анализа цифровых характеристик изучаемого общественного явления. В статистической таблице различают подлежащее (объект изучения) и сказуемое (числовые показатели, которыми характеризуется объект изучения). По характеру подлежащего статистические таблицы подразделяются на:
- простые ( в них содержится лишь перечень объектов);
- групповые (в них содержатся группы, образованные по какому-либо одному признаку);
-комбинационные (в них содержатся группы, образованные по двум или более признакам).
Таблицы комбинационные, в которых совокупность разбита на группы не по одному, а по нескольким признакам. Выбор типа таблицы зависит всегда от цели ее построения. Если таблицы используются для практических нужд планирования и управления, то в них должны содержаться сведения по тем частям, в разрезе которых ведется планирование и управление. Чаще всего этой задаче соответствуют простые таблицы, используются также и групповые. Если же ставится задача более глубокого познания исследуемого объекта, то используются групповые и комбинационные таблицы. В простых таблицах помещаются данные различного рода организациям: предприятиям, стройкам, учреждениям, министерствам и т.д., имеющие, как правило, познавательное значение.
Примером простой статистической таблицы является таблица 3, где приведена динамика цен на муниципальные квартиры в разных районах г. Москвы за 5 месяцев 2009 г.
Динамика цен 1 кв. м муниципального жилья в Москве в 2009 г. (млн. руб.).
Таблица 3
-
Местоположение жилья
Январь
Февраль
Март
Апрель
Май
Митино
3,4
3,7
4,0
4,8
5,2
Южное Бутово
3,2
3,5
3,8
4,5
4,9
Северное Бутово
3,5
3,8
4,1
4,8
5,8
Отрадное
4,5
4,9
5,3
6,0
6,5
Верная улица
5,3
5,5
5,9
7,0
7,6
Жулебино
3,4
3,7
4,0
4,5
4,9
Сочетание территориальной группировки с данными за несколько месяцев 2009 г. позволяет получить весьма полезную информацию. По данным табл. 3, мы видим наличие вариации цен за 1 кв. м муниципального жилья по районам города Москвы и, если в январе цена варьировала от 3,2 млн. руб: (Южное Бутово) до 5,3 млн. руб, (ул. Верная), то в мае границы вариации существенно сдвинулись вправо: от 4,9 млн. руб. (Северное Бутово) до 7,6 млн. руб. (ул. Верная). Кроме того, можно сделать вывод о наличии общей для всех районов Москвы тенденции неуклонного роста цен муниципального жилья. Данные подобного рода таблиц могут использоваться для принятия оперативных решений, например оценки того, как изменятся затраты на приобретение жилья, если задержаться с принятием решения хотя бы на месяц.
В отличие от простых групповые и комбинационные таблицы обладают важными аналитическими свойствами: они позволяют производить наглядные сравнения и вскрывать существенные связи и различия в развитии явлений. Идея комбинационной таблицы состоит в том, что каждую из групп в групповой таблице разбивают на подгруппы по какому-либо признаку; выделенные подгруппы могут дальше расчленяться по следующему признаку и т.д.
Результаты комбинационной группировки по большому количеству признаков даже при небольшом числе интервалов группировки становятся трудно обозримыми, и таблица теряет свое важнейшее преимущество - наглядность. Поэтому нецелесообразно составлять комбинационные таблицы по сочетанию более чем трех признаков и при количестве интервалов более четырех. Использование комбинационных таблиц и системы взаимосвязанных группировок позволяет провести глубокий и всесторонний анализ сложных общественных явлений.
Группировка, осуществляемая не последовательно по отдельным признакам, как при комбинационной группировке, а одновременно по комплексу признаков, называется многомерной. Как уже сказано, характеристика одной и той же качественной стороны изучаемого явления может быть дана с помощью набора признаков.
Например, для характеристики технического уровня развития предприятий могут быть использованы следующие показатели: удельный вес активной части промышленно-производственных основных фондов, удельный вес автоматических машин и оборудования в составе рабочих машин и оборудования; электро - вооруженность труда, машиновооруженность рабочих; степень охвата механизированным трудом, коэффициент обновления машин и оборудования и т.д.
Характеризуя, таким образом, каждую единицу совокупности набором признаков, можно рассматривать эту единицу как точку в m - мерном пространстве, а задача многомерной группировки будет состоять в выделении точек, составляющих однородные группы единиц. Мерой близости (сходства) между единицами могут служить различные критерии. В зависимости от выбранного критерия существуют различные методы многомерной группировки. Применение методов многомерной группировки связано с большой вычислительной работой и требует использования электронной вычислительной техники.
Основная литература: 3 [60-65],4 [16-17].
Контрольные вопросы:
1. Виды статистических таблиц ;
2.Использование комбинационных таблиц.
3.Многомерные группировки и статистические таблицы.
4. Статистическая группировка и их виды;
5. Группировка статистического наблюдения.
Тема лекции 4. Абсолютные и относительные величины.
Конспект лекции: Абсолютные и относительные статистические величинами называют показатели, выражающие размеры количественных признаков конкретных общественных явлений. Это число именованные.
Единицами измерения бывают: натуральные, стоимостные, трудовые.
Натуральные: метр, тоннах, часах, киловатт. Стоимостные в денежном выражении трудовыми: затрат труда на единицу выпуска продукции, т.е человеко-час, человека - дни.
Они широко используются в планировании и анализе деятельности предприятий, фирм, концернов, отраслей и экономики в целом. Многообразная характеристика всех сторон исследуемых социально-экономических явлений может быть дана лишь с помощью всех видов обобщающих показателей. Вместе с тем, каждый вид показателей имеет определенное значение и занимает различное место в процессе познания реальной действительности. Путем непосредственного суммирования первичных данных получают обобщающие абсолютные показатели, которые характеризуют численность совокупности и объем (размер) изучаемого явления в конкретных границах времени и места. Например, численность населения России по переписи на 12 января 1999 г. составила 147,4 млн. человек, валовой внутренний продукт в 2004 г. - 630 трлн. руб. Первый из приведенных показателей характеризует численность населения по состоянию на определенный момент, и получают такие абсолютные величины по результатам сводки данных единовременного наблюдения.
Второй из приведенных показателей характеризует размер явления за определенный период время и он получен как результат сводки данных текущего наблюдения.
Абсолютные показатели являются всегда именованными числами, т.е. имеют какую-либо единицу измерения. Натуральные единицы измерения применяют в тех случаях, когда единица измерения соответствует потребительским свойствам продукта. Например, производство цемента оценивается в тоннах, тканей - в квадратных метрах, автомобилей - в штуках и т.д. Натуральные единицы могут быть и составными (сложными).
Например, отработанное рабочими время учитывается в человеко-днях и человеко-часах, грузооборот автомобильного и железнодорожного транспорта - в тонно-километрах и т.п. Составные единицы отражают сочетание двух различных сторон явления. Так, при учете затрат рабочего времени отражается совместное измерение численности рабочих и времени их работы, при определении объема работы транспорта - измерение объема грузов и расстояния перевозок.
При учете продукции в натуральном выражении нередки случаи, когда применяются различные единицы измерения для одного и того же вида продукции. Если некоторые разновидности продукции обладают общностью основного потребительного свойства, обобщенные итоги по выпуску этих разновидностей продукции можно получить, используя условно-натуральные единицы. В этом случае одна из разновидностей принимается в качестве единого измерителя, а другие приводятся к этому измерителю с помощью соответствующих коэффициентов пересчета.
Например, в тоннах условного топлива определяется общий объем потребленного на предприятии топлива, при определении объема производства минеральных удобрений пересчет производится на стандартное или 100%-ное содержание питательного вещества и т.п.
При обобщении учетных данных даже на уровне предприятий, а тем более на уровне отраслей и народного хозяйства широко используются стоимостные (денежные) единицы измерения. Для получения общего объема продукции в денежном выражении количество единиц каждого вида продукции в натуральном выражении умножается на цену соответствующего вида, а затем полученные произведения суммируют во всем видам.
При определении стоимостных показателей объема продукции абсолютные величины получаются расчетным путем. Тем более это касается определения таких обобщающих показателей, как чистая продукция промышленности, прибыль, объем валового национального продукта и др.
Так, объем чистой продукции определяют вычитанием из стоимости объема продукции стоимости материальных затрат на ее производство. Прибыль от реализации продукции промышленного предприятия получают как разность между выручкой от реализации продукции по оптовым ценам предприятий и ее полной себестоимостью. Расчетный метод определения абсолютных величин может опираться также на балансовый метод.
Например, наличие оборудования на конец года определяется прибавлением к количеству оборудования на начало года числа единиц введенного оборудования и вычитанием числа единиц выбывшего оборудования. Таким образом, абсолютные величины получают непосредственным подсчетом данных статистического наблюдения или расчетным путем.
Относительными статистическими величинами называют обобщающие показатели, характеризующие количественные отношения общественных явлений. Различают две формы выражения относительных величин: неименованные относительные величины и именованные относительные величины и семь видов относительных величин: задания, выполнения задания, структуры, координации, интенсивности, динамики, сравнения. Относительная величина структуры — это соотношение размеров части и целого. Относительной величиной координации называют соотношение частей целого между собой. Относительная величина интенсивности — это соотношение разноименных, но связанных между собой величин. В числителе берется величина явления, степень распространения которого изучается, а в знаменателе — объем той среды, в которой происходит распространение данного явления, например показатель производства продукции на одного работающего (производительность труда).
Относительные величины планового задания; относительные величины структуры; относительные величины координации; относительные величины наглядности. Относительная величина динамики характеризует изменение явления во времени и показывает, во сколько раз увеличился (или уменьшился) уровень показателя по сравнению с каким-либо предшествующим периодом.
Для расчета относительной величины динамики определяют отношение уровней, характеризующих изучаемое явление в разные периоды времени. Как правило, при анализе опираются на данные за ряд периодов. Так, в статистической отчетности содержатся показатели за каждый месяц отчетного года или за соответствующий квартал. На основе обобщения квартальных и месячных данных получаем итоги за каждый год. Статистические показатели за каждый квартал отчетного года можно сравнить с показателем непосредственно предшествующего квартала или же с уровнем соответствующего квартала предшествующего года или же с уровнем четвертого квартала предшествующего года, т.е. рассчитываются относительные величины с переменной или с постоянной базой сравнения. Расчет относительных величин динамики показан в таблице 4.
Внешнеторговый оборот России со странами дальнего зарубежья в I кв. 2009 г. Таблица 4
Месяц и год
|
Внешнеторговый оборот России, млн. доля США (со странами дальнего зарубежья) |
В том числе |
Коэффициент роста внешнеторгового оборота, % |
Удельный вес, % | ||||
экспорт
|
импорт
|
к соотв. периоду прошлого года |
к пред, месяцу
|
к дек. 2008г
|
экспорта
|
импорта
| ||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Дек. 2008г. |
8640 |
4730 |
3910 |
92 |
- |
100 |
54,75 |
45,25 |
Янв. 2009 г. |
5629 |
3188 |
2441 |
106 |
65 |
65 |
56,64 |
43,36 |
Фев. 2008г. |
6902 |
3800 |
3102 |
117 |
123 |
80 |
55,06 |
44,94 |
Март 2009г. |
7741 |
4536 |
3205 |
121 |
112 |
90 |
58,60 |
41,40 |
Относительные величины имеют форму коэффициентов, если они исчисляются делением сравниваемой величины на базу сравнения. Если коэффициент умножить на 100, то получим результат сопоставления в процентах. Таковы относительные величины, характеризующие динамику внешнеторгового оборота (см. гр. 5, 6, 7, табл. 4.). Рассчитанная относительная величина динамики показывает, например, что в январе 2009 г. по сравнению с декабрем 2008 г. оборот внешней торговли России снизился на 35%. Эта величина исчисляется как разность между величиной темпа роста (коэффициент роста, выраженный в процентах) и 100% и называется относительным приростом (в приводимом примере - относительное снижение). В таблице 4, расчет коэффициентов роста с постоянной базой ведется в сравнении с декабрем 2008 г.
Выбор базы сравнения нередко имеет существенное значение. Так, в ряде случаев в качестве базы сравнения принимаются годы, являющиеся исторически обусловленной границей отдельных периодов времени. В планах предприятий задания устанавливаются как в абсолютных показателях, так и в виде относительных величин, которые показывают, во сколько раз или на сколько процентов должна увеличиться (уменьшиться) величина показателя по плану в сравнении с его уровнем в предшествующем периоде.
Например, по плану темп роста экспорта продукции предприятия должен был составить в 2009 г. (в % к предшествующему году) 106,1%, относительная величина динамики объема экспорта продукции составила 107,3%. Сравнение двух относительных величин - планового задания и динамики свидетельствует о перевыполнении плана по экспорту продукции предприятия в 2009г.
Степень выполнения плана оценивается с помощью относительной величины выполнения плана, которую получают отношением фактического уровня показателя в отчетном периоде к его уровню, запланированному на этот же период.
Понятие о статистическом графике. Элементы статистического графика.
По форме и образу статистические графики различают точечные, линейные, плоскостные, объемные и изобразительные диаграммы.
По задачам различают графики статического и динамического сравнения, структурные, распределения частоты явлений, связи явлений, выполнения плана, балансовые и территориального размещения.
Графики статического сравнения применяются для сопоставления отдельных величин, относящихся к одному периоду или моменту времени.
Графический образ: линейные, плоскостные и объемные диаграммы. Используются для сравнения событий, изменяющихся во времени. Графический образ: линейный, например таблицу 4 можно представить как рисунок 1, выполнен на EXCEL-е.
Графики структуры. Применяются для долевого представления целого. Графический образ: линейные и плоскостные диаграммы.
Графики распределения частоты явлений. Используются для показа того, как распределяется рассматриваемое явление по различным вариантам группировочного признака. Графический образ: линейные и плоскостные диаграммы (полигоны и гистограммы).
Графики для изображения связи явлений. Применяются для показа тесноты и формы связи явлений. Графический образ: точечные и линейные диаграммы (поле корреляции).
Балансовые изображения. Применяются для показа соотношений противоположных явлений, например поступления и расхода электроэнергии. Графический образ: линейные и плоскостные диаграммы.
Изображение территориального размещения. Применяется для изображения статистических данных на определенной территории. Графический образ: плоскостная диаграмма. Различают картограмму (отдельные районы контурной географической карты обозначены различно в зависимости от величины статистического признака) и картодиаграмму (размещение на географической карте графических образов в масштабе, соответствующем величине изображаемых статистических показателей).
Рисунок 2. Внешнеторговый оборот России со странами дальнего зарубежья в I кв. 2009 г.
Основная литература 1[71-85], 8 [118-219];
Контрольные вопросы:
1. Назовите единицы измерения абсолютных показателей?
2. Относительные величины, виды показателей?
3. Рассчитанная относительная величина и их динамика.
4. Как вычисляются коэффициент прироста?
5. Как исчисляются коэффициент роста?
Тема лекции 5. Средние величины.
Конспект лекции: Объект статистики как общественной науки во многом специфичен, в известном смысле формы величины и методы познания показателей. Изучение разнообразных форм статистических показателей со стороны величины (средние, показатели структуры, индексы и т. д.) с учетом специфики явлений жизни общества осуществляет общая теория статистики. Она сосредоточивает внимание на общих свойствах статистических показателей и составляющих их элементов, на общих методах и приемах получения (познания) объективных показателей.
Изучение многообразия объективных статистических показателей по содержанию (включая все богатство форм содержания) в связи с их количественной стороной выполняет социально-экономическая статистика со всеми своими отраслевыми подразделениями. Общество и рыночная экономика представляют собой весьма сложную систему, имеют много взаимосвязанных существенных сторон и отношений. Адекватная изучаемому объекту дифференциация его особых, являющихся предметом статистики признаков по содержанию) означает систему признаков, систему показателей. Следовательно, социально-экономическая статистика рассматривает систему, объективных статистических показателей состояния и развития общества, состояния и развития экономики.
Среди обобщающих показателей, которыми статистика характеризует общественные явления, большую роль играют среднее величины.
Средней величиной в статистике называют обобщающую характеристику совокупности однородных общественных явлении, которая показывает типичный уровень варьирующего признака в расчете на единицу совокупности. Она обобщает многие индивидуальные величины одного и того же вида. Вид среднего в статистике подчинен социально-экономическому содержанию изучаемых явлений. Соотношения, выражающие смысл средних, называют исходными соотношениями. Они являются базой расчета и критерием правильности выбора вида средней в статистике. Часто применяются средняя арифметическая. Например: Средний срок службы станков = Суммарный срок службы всех станков / Общее количество станков.
(1)
Виды средних величин. Средние, используемые в статистике, делятся на два класса: степенные средние и структурные средние. Из первого класса наиболее часто применяются средняя арифметическая и средняя гармоническая. Средняя геометрическая применяется только при исчислении средних показателей рядов динамики, средняя квадратическая — при исчислении показателей вариации.
Рисунок 3. Кривая распределения средних величин
Представителями второго класса средних являются мода и медиана.
Средняя арифметическая. Для сгруппированных данных средней арифметической :
(2)
где хi - варианты признака; тi - частоты (частости), i=1,2,…,n
Пример расчета средней арифметической и средней гармонической
Таблица 5
-
Группы станков по срокам службы, х
Число станков в группе mi
Общий срок службы станков по данной группе М=хm
0-5
26
65,0
5-10
24
180,0
10-15
20
225,0
15-20
14
245,0
20-25
16
360,0
Всего
100
1100,0
Если мы располагаем данными, приведенными в графах 1 и 2 табл.5, то исходное соотношение приводит к расчету средней арифметической:
Средняя гармоническая : (3)
где Мi - суммарный объем i - признаков в данной группе.
Если мы располагаем данными, приведенными в графах 1 и 3 табл.5, то исходное соотношение приводит к расчету средней гармонической:
Модой в статистике называют значение признака в данной совокупности, имеющего наибольшую частоту. Значение моды для дискретного вариационного ряда может быть найдено непосредственно. Для интервального вариационного ряда значение моды Мо определяется по следующей формуле
(4)
где хМо - нижняя граница модального интервала;
iMo - величина модального интервала;
mMo , mMo-1, mMo+1 частота модального, предмодального и послемодального интервалов соответственно.
Приведенная формула (3) моды может быть использована в вариационных рядах с равными интервалами на рисунке 3 и расчеты соответственно.
Медианой в статистике называют признак, делящий численность вариационного ряда по сумме накопленных частот на две равные части. Для нахождения медианы Ме в интервальном вариационном ряду применяют следующую формулу:
(5)
где Σm - сумма частот вариационного ряда; SMe-1 - сумма накопленных частот до медианного интервала.
Для примера таблицы 5 медиана равно 10 лет.
Дополнительно к медиане для характеристики структуры вариационного ряда исчисляют квартили и процентили, которые ряд делят по сумме частот соответственно на четыре и на сто равных частей.
Средняя величина признака не позволяет судить о тех колебаниях, которым подвержен изучаемый признак в данной совокупности. Для определения величины этой колеблемости в статистике применяют показатели вариации.
Медиану и моду можно определить графически. Медиана определяется по кумуляте. Для ее определения высоту наибольшей ординаты, которая соответствует общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее скумулятой. Абсцисса точки пересечения является медианой.
Рисунок 4. Полигон распределения группированных модальных данных
Мода также определяется по гистограмме распределения ( рисунок 4.). Для этого правую вершину модального прямоугольника соединяем с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника - с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.
Основной характеристикой центра распределения является средняя арифметическая, опирающаяся на всю информацию об изучаемой совокупности единиц. Однако в ряде случаев средняя арифметическая должна быть дополнена и даже заменена модальным значением или медианой.
Например, в статистическом контроле качества продукции удобнее пользоваться медианой, а не средней арифметической, так как определение медианы для ранжированного ряда данных не требует специального расчета. Кроме того, она не чувствительна к крайним значениям взятой контрольной пробы. В рядах с открытыми интервалами также целесообразнее пользоваться в качестве характеристики центра распределения модой и медианой. Мода применяется при изучении спроса населения на товары народного потребления (например, на обувь, одежду и т.д.), когда интерес представляет определение модального размера, т.е. размера, пользующегося наибольшим спросом.
Основная литература: 1[121-169], 4 [20-29].
Контрольные вопросы:
1. Значение моды для дискретного вариационного ряда;
2. Величина модального интервала для ряда
3. Средние величины в статистике
4. Назовите виды средних величин.
5. Общая характеристика структурного ряда
Тема лекции 6. Показатели вариации и способы их расчета.
Конспект лекции: Группировочный признак, имеющий количественное выражение, варьирует, т. е. принимает различное числовое значение у каждого элемента совокупности (варианты).
Вариация признака может быть:
- прерывной (дискретной) — иметь только вполне определенные значения, между которыми не может быть промежуточных;
- непрерывной — иметь любые значения с определенной степенью точности. Средняя величина признака не позволяет судить о тех колебаниях, которым подвержен изучаемый признак в данной совокупности. Для определения величины этой колеблемости в статистике применяют показатели вариации.
Размах вариации R находится так:
R=xma x - xmin (6)
где xmax , xmin - максимальное и минимальное значение признака соответственно.
Среднее линейное отклонение для несгруппированных данных определяется по формуле :
,
для сгруппированных данных
(7)
Дисперсия σ2 для несгруппированных данных находится так:
. (8)
для сгруппированных данных σ рассчитывается следующим образом:
(9)
Размах вариации, среднее линейное и среднее квадратическое отклонение являются величинами именованными. Они имеют те же единицы измерения, что и индивидуальные значения признака.
Дисперсия и среднее квадратическое отклонение - наиболее широко применяемые показатели вариации. Объясняется это тем, что они входят в большинство теорем теории вероятностей, служащих фундаментом математической статистики. Кроме того, дисперсия может быть разложена на составные элементы, позволяющие оценить влияние различных факторов, обусловливающих вариацию признака. В последующих разделах будет показано, как дисперсия используется для построения показателей тесноты корреляционной связи, при оценке результатов выборочных наблюдений, в дисперсионном анализе и т.д.
Расчет показателей вариации для 20 банков m=20, сгруппированных по размеру прибыли, показан в таблице 6.
Таблица 6
Размер прибыли, млрд. тенге. |
Число банков |
Расчетные показатели | ||||
Интервалы группы |
mi |
хi |
mi хi |
xi - |
│хi-│mi |
│(xi-)│2 mi |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
3,7 - 4,6 |
2 |
4,15 |
8,30 |
-1,935 |
3,870 |
7,489 |
4,6 - 5,5 |
4 |
5,05 |
20,20 |
-1,035 |
4,140 |
4,285 |
5,5 - 6,4 |
6 |
5,95 |
35,70 |
-0,135 |
0,810 |
0,109 |
6,4 - 7,3 |
5 |
6,85 |
34,25 |
+0,765 |
3,825 |
2,926 |
7,3 - 8,2 |
3 |
7,75 |
23,25 |
+ 1,665 |
4,995 |
8,317 |
Итого |
20 |
|
121,70 |
|
17,640 |
23,126 |
Примечание. Знак (-) в первом интервале указывает, что значения признака, совпадающие с верхней границей интервала, включаются в следующий интервал. Это связано с тем, что верхняя граница последнего интервала больше х1 данной совокупности. По таблице 6 =6,085 млрд. тенге,d=0,882 млрд. тенге σ2=1,156, σ =1,075 млрд. тенге. Значение среднее линейное и среднее квадратическое отклонения показывает на сколько в среднем колеблется величины признаков хi.
Ряды распределения. Описание колебаний варьирующего признака осуществляется с помощью ряда распределения, который представляет собой характеристику вариантов признака их частотами. В соответствии с разными вариациями признака различают дискретный вариационный ряд и непрерывный, или интервальный, вариационный ряд. Графически дискретный ряд распределения изображается в виде полигона (многоугольника рис. 4), а непрерывный ряд — в виде гистограммы рис.3, 5. При анализе непрерывного ряда распределения с неравными интервалами прибегают к показателю «плотность распределения» — числу единиц совокупности, приходящемуся на единицу ширины интервала. Для различных целей возникает необходимость находить ряд накопленных частот, который графически представляется кумулятивной кривой рис.3.
Вариация признака, вызванная случайными факторами (внутригрупповая дисперсия), определяется следующим образом:
σ2r=Σσ2rnr/Σnr (10)
где δ 2r — дисперсия в отдельных группах. Она вычисляется по формуле:
σ2r=(xi-X)2/Σnr (11)
Сумма указанных дисперсий образует общую дисперсию признака:
δ2+ σ2=σ2 .
Данное равенство определяет правило сложения дисперсий. Оно используется, в частности, в корреляционном анализе при определении тесноты связи результативного признака и факторных значений.
Рисунок 5. Дискретный ряд распределения
По аналитической группировке можно измерить связь с помощью еще одного показателя: эмпирического корреляционного отношения. Этот показатель обозначается греческой буквой ƞ (эта). Он основан на правиле разложения дисперсии, согласно которому общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий.
Эмпирическое корреляционное отношение измеряет, часть общей колеблемости результативного признака и вызывает изучаемый фактор.
Соответственно этот показатель рассчитывается на основе отношения факторной дисперсии к общей дисперсии результативного признака:
- коэффициент детерминации, (12)
- эмпирическое корреляционное отношение. (13)
Этот показатель принимает значения в интервале [0, 1]: чем ближе к 1, тем теснее связь, и наоборот.
Дисперсия обладает рядом свойств, некоторые из них позволяют упростить ее вычисления:
1) дисперсия постоянной величины равна нулю;
2) если все варианты значений признака уменьшить на одно и то же число,
то дисперсия не уменьшится;
3) если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшится в k2 раз.
Выполнение группировки позволяет разложить общую дисперсию признака на две дисперсии, одна из которых будет характеризовать часть вариации, обусловленную влиянием фактора, положенного в основу группировки, а вторая - вариацию, происходящую под влиянием (внешних) прочих факторов (кроме фактора, положенного в основу группировки). Расчеты приведены в предыдущей таблице 3.
Например, вариации цен на муниципальное жилье ( таблица 3 ) в мае 2009 г. было сделано после расчета показателя относительной колеблемости уровня признака, т.е. коэффициента вариации.
Расчет коэффициента вариации цен 1 кв. м муниципального жилья в Москве приводит к следующим результатам:
В январе 2009г.
В мае 2009г.
Следовательно, в мае 2009 г. вариация цен 1 кв. м муниципального жилья в Москве снизилась 2,88 % по сравнению с январем 2009 г.
Отклонение индивидуальных значений признака от общей средней можно представить так. Вариацию, обусловленную влиянием фактора, положенного в основу группировки, характеризует межгрупповая дисперсия σ-, которая является мерой колеблемости частных средних по группам хi общей средней Х и исчисляется по формуле (9) где k - число групп; п- число единиц в i-и группе; - частная средняя поi-и группе; X - общая средняя по совокупности единиц.
Вариацию, обусловленную влиянием прочих факторов, характеризует в каждой группе внутригрупповая дисперсия (11).
Основная литература : 4[26-28], 3 [55-59], 2[63-65].
Контрольные вопросы:
1. Формула для расчета дисперсии
2. Формула для расчета среднего квадратического отклонения.
3. Виды и размах вариации
4. Дисперсия и среднее квадратическое отклонение
5. Ряды распределения.
Тема лекции 7. Выборочное наблюдение.
Конспект лекции: Выборочное наблюдение - наиболее совершенная разновидность несплошного наблюдения, при котором из общей (генеральной совокупности) обследованию подвергается некоторая часть, называемая выборочной совокупностью. Обобщающие показатели, характеризующие эту обследованную часть, распространяются на всю совокупность.
Выборочный метод отличается от других видов несплошного наблюдения, во-первых, тем, что заранее устанавливается, сколько единиц или какая часть генеральной совокупности будет обследована, и, во-вторых, заранее определяется порядок отбора, при котором выборочная совокупность в достаточной мере репрезентовала бы (представляла) генеральную совокупность.
Применение выборочного метода связано с возникновением присущих ему ошибок репрезентативности, которые представляют собой разность между генеральными и выборочными обобщающими показателями.
Существуют различные способы отбора единиц исследуемой генеральной совокупности в целях образования выборочной. Их классификация представлена на рисунке 1. Рассмотрим различные способы отбора единиц генеральной совокупности, представленные на рисунке 6.
Индивидуальный отбор - выборочная совокупность образуется при последовательном отборе отдельных единиц.
При серийном отборе формирование выборочной совокупности производится сериями.
Выборку, при которой отбор производится непреднамеренно, случайно, называют случайной, если же механически через равный интервал - механической.
Типический отбор предполагает предварительное деление генеральной совокупности на однородные группы, а затем отбор из образованных групп одним из рассмотренных выше способов.
Повторный отбор предполагает возвращение перед очередным отбором обследованной единицы или серии в генеральную совокупность, бесповторный отбор такого возвращения не предусматривает.
Особой разновидностью выборочного наблюдения является моментно-выборочное наблюдение. Оно состоит в фиксации наличия отдельных элементов изучаемого процесса на определенные моменты времени без учета длительности данного элемента.
С точки зрения оценки репрезентативности выборочных обобщающих показателей различают большие и малые выборки.
Будем считать выборку безусловно большой, если численность единиц в ней превышает 100, и безусловно малой, если численность единиц в ней меньше 20.
Рисунок 6. Виды отбора выборочного наблюдения
Определение объема и ошибок большой выборки
Определение ошибок и объема выборки покажем применительно к случайному бесповоротному отбору, так как последний чаще всего имеет место в социально-экономических исследованиях.
При случайном отборе выборочная средняя , как и выборочная доля ω, является переменной величиной при различных исходах выборки и колеблется около соответствующих генеральных значений средней и доли p.
Мерой этой колеблемости является стандартная ошибка средней и доли:
(14)
где п - объем выборки;
N - объем генеральной совокупности;
s2 - выборочная дисперсия.
Предельная ошибка выборки может быть определена для средней как:
,
а для доли как
(где р - генеральная доля). Коэффициент t зависит от вероятности, с которой можно гарантировать, что предельная ошибка выборки не превысит t-кратную стандартную ошибку.
Значения t для различных вероятностей (интеграл вероятностей) табулированы. Объем выборки для определения средней:
(15)
и для определения доли
(16)
Определение объема и ошибок малой выборки
В практике социально-экономических исследований часто приходится пользоваться малыми выборками. При малых выборках методы оценок параметров генеральной совокупности, разработанные применительно к нормальному распределению, нуждаются в корректировке. Так, стандартная ошибка средней имеет вид:
(17)
а взаимосвязь t и вероятности для расчета предельной ошибки определяются в этом случае распределением Стьюдента, значения которого также табулированы. Определение объема малой выборки производится таким же способом, что и большой, но с использованием указанного распределения.
Основная литература 2 [114-268], 4 [73-88],
Дополнительная литература 1[ 46-70].
Контрольные вопросы:
1. Выборочный метод
2. Виды отбора выборочного наблюдения
3. Предельная ошибка доли
4. Предельная ошибка выборки
5.Вид стандартной ошибки среднего
Тема лекции 8. Ряды динамики.
Конспект лекции: Ряды динамики - это ряд расположенных во времени статистических показателей, характеризующих изменение данного общественного явления. Он состоит из двух строк или столбцов: промежутков или моментов времени, к которым относятся уровни, и самих уровней признака (показателя). Ряд, в котором время задано в виде промежутков — лет, месяцев, суток, называется интервальным динамическим рядом. Ряд, в котором время задано в виде конкретных дат (моментов времени), называется моментным динамическим рядом.
Моментным динамическим рядом называют ряд абсолютных и относительных величин, характеризующих уровень изучаемого явления у на определенный момент времени t. Уровни динамического ряда у - случайные величины, имеющие определенную закономерность распределения во времени. В ряде случаев они не являются независимыми: зачастую ряды динамики наблюдает зависимость последующих уровней явления от предшествующих им во времени. Показатели анализа уровней ряда динамики на рисунке 6.
Абсолютное изменение уровней — в данном случае его можно назвать абсолютным приростом — это разность между сравниваемым уровнем и уровнем более раннего периода, принятым за базу сравнения. Если эта база — непосредственно предыдущий уровень, показатель называют цепным, если за базу взят, например, начальный уровень, показатель называют базисным. Формулы абсолютного изменения уровня:
цепное: (18)
базисное: (19)
Темп роста — это отношение сравниваемого уровня (более позднего) к уровню принятому за базу сравнения (более раннему). Темп роста исчисляется в цепном варианте к предыдущему уровню или в базисном варианте — к одному и тому же, обычно начальному уровню. Он говорит о том, сколько процентов составляет сравниваемый уровень по отношению к уровню, принятому за базу, или во сколько раз сравниваемый уровень больше уровня, принятого за базу. При этом если уровни снижаются со временем, то сказать,
Относительное изменение уровней — связь относительных показателей динамики. Обозначим темп изменения через Т. Тогда имеем:
цепной темп роста
базисный темп роста
Средние показатели уровня ряда. Средняя хронологическая (для моментного ряда)
(20)
где п — количество моментов (временных дат).
Средний уровень интервального ряда :
где п — число периодов времени.
Средний абсолютный прирост : (21)
где п — число промежутков между датами.
Средний темп роста :
где п — число осредняемых темпов роста.
Средний темп прироста:
Рисунок 7. Классификация динамических рядов.
Например: имеется данные динамических рядов изменение цен на потребительские товары и услуги по Акмолинской области на конец периода, к декабрю предыдущего года, (%) таблице 7.
Потребительские товары и услуги Акмолинской области РК.
Таблица 7
-
Регионы/годы
Потребительские товары и услуги
2002 г
2003 г
2004 г
2005 г
2006 г
2007 г
Акмолинская
7,1
7,2
8,1
16,1
8,4
7,8
Базовый темп роста
100,0
101,4
114,0
226,7
118,3
109,8
Цепной темп роста
100,0
101,4
112,5
198,7
52,1
92,8
*Оплата труда в РК. Статистический сборник. Астана. 2009.
Рисунок 8. График на потребительские товары и услуги Акмолинской области
Основная литература 1 [443-558], 3 [73-88],
Дополнительная литература 1[ 46-70].
Контрольные вопросы:
1. Абсолютное изменение уровней динамики
2. Относительное изменение уровней динамики
3. Классификация динамических рядов
4. Средний темп роста
5. Средний темп прироста.
Тема лекции 9. Методы анализа тенденции в рядах динамики
Конспект лекции: Моделирование основной тенденции (тренда) временных динамических рядов связаны с случайным социально-экономическим процессом. При этом разбить на систематическую составляющую, которая является детерминированной и связанной с ходом времени t, и случайную компоненту ε t - остаток, т. е.:
Yt=ƒ(t)+εt (22)
Первое слагаемое отражает некоторое общее направление развития общественных явлений их основную тенденцию (тренд), второе - действие случайных факторов на уровень экономического явления. Количественное описание тенденции может быть сделано с помощью различных методов.
Метод укрупнения интервалов
Сущность его заключается в том, что с помощью средних величин колебания отдельных уровней временного ряда взаимно погашаются и тренд ряда проявляется более отчетливо.
Метод скользящего среднего состоит в нахождении центрированных средних скользящего интервала. Сглаженный ряд короче первоначального на
( К- 1) уровней при ширине избранного интервала К.
Метод аналитического выравнивания состоит в аналитическом выравнивании фактические уровни временного ряда и заменяются теоретическими на основе линейной или нелинейной формы связи. В качестве факторного признака принимается время. Таким образом, тенденция временного ряда представляется некоторым уравнением регрессии.
Авторегрессионная модель временного динамического ряда
Авторегрессия первого порядка. Уровни временного динамического ряда - случайные величины, имеющие определенную закономерность распределения во времени. В ряде случаев они не являются независимыми: зачастую во временных рядах наблюдается зависимость последующих уровней явления от предшествующих им во времени. Эта зависимость называется автокорреляцией и может быть оценена коэффициентом автокорреляции ρt.
(23)
Последовательность коэффициентов автокорреляции между данным временным и этим же рядом, сдвинутым на τ сдвигов (лаги). Зависимость уровня ряда от предыдущих с увеличением сдвига τ.
Зависимость одних уровней ряда от других может быть оценена количественно с помощью уравнения авторегрессии.
Парное линейное уравнение авторегрессии (уравнение первого порядка) имеет вид:
(24)
где a 0, а1 - параметры уравнения.
Фактическое значение уровня временного ряда может быть представлено соответственно как:
(25)
где ε - остаток.
Авторегрессия высших порядков. Если данные автокорреляционной функции свидетельствуют о высокой степени тесноты связи уровней временного ряда нескольких последовательных сдвигов, то для моделирования данного уровня можно прибегнуть к построению многофакторной регрессии. Независимыми факторными признаками в ней будут выступать уровни явления нескольких предыдущих периодов.
Так, уравнение авторегрессии с тремя факторными признаками (3-го порядка) имеет вид:
(26)