Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
zayavka_merkel.doc
Скачиваний:
5
Добавлен:
24.03.2015
Размер:
202.88 Кб
Скачать

Кластерный анализ

КЛАСТЕРНЫЙ АНАЛИЗ ― классификация объектов по характеризующим их признакам, разделение совокупности объектов на однородные группы, близкие по определяющим критериям, выделение объектов определенной группы. Кластерный анализ включает также таксономиюраспознавание образов.

Кластерный анализ (англ. Data clustering) ― задача разбиения заданной выборкиобъектов (ситуаций) на подмножества, называемые кластерами, так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя.

7)абсолют и относ.показатели

Первичная статистическая информация выражается прежде всего в виде абсолютных показателей, которые являются количественной базой всех форм учета. Абсолютные показатели характеризуют итоговую численность единиц совокупности или ее частей, размеры (объемы, уровни) изучаемых явлений и процессов, выражают временные характеристики. Абсолютные показатели могут быть только именованными числами, где единица измерения выражается в конкретных цифрах. В зависимости от сущности исследуемого явления и поставленных задач единицы измерения могут быть натуральными, условно-натуральными, стоимостными и трудовыми.

В статистике относительные показатели используют в сравнительном анализе, в обобщении и синтезе. Относительные показатели - это цифровые обобщающие показатели, они есть результат сопоставления двух статистических величин. По своей природе относительные величины производны от деления текущего (сравниваемого) абсолютного показателя на базисный показатель.

Относительные величины, используемые в статистической практике:

 относительная величина структуры;

 относительная величина координации;

 относительная величина планового задания;

 относительная величина выполнения плана;

 относительная величина динамики;

 относительная величина сравнения;

 относительная величина интенсивности.

8)Средние показатели

Наиболее распространенной формой статистических показателей, используемых в социально-экономических исследованиях, является средняя величина, представляющая собой обобщенную количественную характеристику признака статистической совокупности. Средние величины являются как бы «представителями» всего ряда наблюдений. Определить среднюю можно во многих случаях через исходное соотношение средней (ИСС) или ее логическую формулу:

.

Так, например, для расчета средней заработной платы работников предприятия необходимо общий фонд заработной платы разделить на число работников:

9) Вариация  это колеблемость значений признака у отдельных единиц совокупности.Простейшим показателем вариации является размах колебаний: . Вариации в статистике проявляются двояко, либо через изменения значений признака у отдельных единиц совокупности, либо через наличие или отсутствие изучаемого признака у отдельных единиц совокупности.

10) Ошибки репрезентативности 

 

Между характеристиками выборочной совокупности и искомыми параметрами генеральной совокупности, как правило, существует некоторое расхождение, которое называют ошибкой.

Общая величина возможной ошибки выборки слагается из ошибок двоякого рода:  -  ошибки регистрации;  -  ошибки репрезентативности.  Применение выборочного метода в замен сплошного дает возможность лучше организовать наблюдение, обеспечивает быстроту проведения наблюдения, приводит к экономии средств затрат труда на получение и обработку информации.  Выборочный метод находит широкое применение не только как самостоятельный метод статистического исследования, но может быть также использован для ускоренной обработки материалов сплошного наблюдения и проверки данных сплошных переписей и учетов. Задача формирования выборочной совокупности заключается в том, что средние и относительные показатели, характеризующие эту совокупность, с достаточной точностью отражали соответствующие средние и относительные показатели генеральной совокупности. 

11)По способу организации различают следующие виды выборок:

собственно случайную (простую)

типическую

механическую

серийную

Механический отбор заключается в том, что составляется список единиц генеральной совокупности и в зависимости от числа отбираемых единиц (серий) устанавливается шаг отбора, т.е. через какой интервал следует брать для наблюдения единицы (серии). Например, в простейшем случае, при 10%–м отборе, отбирается каждая десятая единица по этому списку, т.е. если первой взята единица за № 1, то следующими отбираются 11–я, 21–я и т.д. В такой последовательности производится отбор, если единицы совокупности расположены в списке без учета их “рангов”, т.е. значимости по изучаемым признакам. Слайд 8. МЕХАНИЧЕСКАЯ ВЫБОРКА

Примером квази-случайного отбора является механическая выборка. Проведение механической выборки требует списка характеристик респондентов (фамилии, адреса, телефоны и т.д.). Из этого списка через равные промежутки люди отбираются в выборку. Этот промежуток называется шагом выборки.

Шаг = N/n (округляется отбрасыванием дробной части)

где

N - объем генеральной совокупности

n - объем выборочной совокупности.

Начало отбора выбирается случайным образом в пределах шага выборки. Например, если шаг выборки равен 20, то начинать отбор надо с любого числа от 1 до 20.

При определении ошибки репрезентативности и объема выборки используются те же формулы, что и при случайной выборке. Процедура проведения механической выборки менее громоздка, чем проведение случайной выборки. Механическая выборка может быть как более точной, так и менее точной по сравнению со случайной выборкой.

12)

Рассмотрим организацию типической (стратифицированной) выборки. Как правило, социальные и экономические явления характеризуются большим разнообразием и не являются однородными в отношении изучаемых признаков. При наличии в составе генеральной совокупности различных типов явлений с разными уровнями изучаемых признаков желательно так организовать выборку, чтобы обеспечить более равномерное представительство в выборочной совокупности различных частей (типов) явления. Различные формы организации выборочного наблюдения - типическая (районированная или стратифицированная) выборка, серийная (гнездовая) выборка, механическая выборка, комбинированная выборка - представляют собой дальнейшее развитие и видоизменение простой случайной выборки. Применение этих форм обусловлено соображениями удешевления или облегчения процесса наблюдения, особым характером объекта наблюдения или отсутствием необходимой информации для составления списка единиц генеральной совокупности.

13)Серийная выборка

Сущность серийной выборки заключается в том, что вместо слу­чайного отбора единиц совокупности осуществляется отбор групп (серий, гнезд). Внутри отобранных серий производится сплошное наблюдение. Серии (гнезда) состоят из единиц, связанных между собой или территориально, или организационно, или, наконец, во времени. Отбор серий может производиться в порядке повторного и бесповторного отбора. Серии могут быть равновеликими и не­равновеликими. На практике чаще применяется серийный отбор с равными сериями.

14)Статистическое изучение взаимосвязи между явлениями

Методы изучения взаимосвязей экономических явлений: метод параллельных рядов, аналитических группировок. Сущность, задачи и понятия дисперсионного и корреляционно-регрессионного анализа. Измерение взаимосвязей между социально-экономическими явлениями.

15)Метод наименьших квадратов (МНК, OLS, Ordinary Least Squares) ― один из базовых методов регрессионного анализа для оценки неизвестных параметров регрессионных моделей по выборочным данным. Метод основан на минимизации суммы квадратов остатков регрессии.

Необходимо отметить, что собственно методом наименьших квадратов можно назвать метод решения задачи в любой области, если решение заключается или удовлетворяет некоторому критерию минимизации суммы квадратов некоторых функций от искомых переменных. Поэтому метод наименьших квадратов может применяться также для приближённого представления (аппроксимации) заданной функции другими (более простыми) функциями, при нахождении совокупности величин, удовлетворяющих уравнениям или ограничениям, количество которых превышает количество этих величин и т. д.

16)Коэффициент ранговой корреляции Спирмена - это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.

Практический расчет коэффициента ранговой корреляции Спирмена включает следующие этапы:

1) Сопоставать каждому из признаков их порядковый номер (ранг) по возрастанию (или убыванию).

2) Определить разности рангов каждой пары сопоставляемых значений.

3) Возвести в квадрат каждую разность и суммировать полученные результаты.

4) Вычислить коэффициент корреляции рангов по формуле:.

где  - сумма квадратов разностей рангов, а  - число парных наблюдений.

При использовании коэффициента ранговой корреляции условно оценивают тесноту связи между признаками, считая значения коэффициента равные 0,3 и менее, показателями слабой тесноты связи; значения более 0,4, но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более - показателями высокой тесноты связи.

17)Смысл коэффициента линейной корреляции.

Коэффициент линейной корреляции отражает меру линейной зависимости между двумя переменными. Предполагается, что переменные измерены в интервальной шкале либо в шкале отношенийHYPERLINK "http://psystat.at.ua/publ/1-1-0-28" .

Если представить две переменные на координатном поле , то каждая пара значений будет отображать координаты точки в этом поле. Чем ближе точки к усредненной прямой, тем выше коэффициент корреляции 

18)Виды рядов динамики. Методы расчета среднего уровня в рядах динамики

Ряды динамики ― это ряды статистических показателей, характеризующих развитие явлений природы и общества во времени. Публикуемые Госкомстатом России статистические сборники содержат большое количество рядов динамики в табличной форме. Ряды динамики позволяют выявить закономерности развития изучаемых явлений.

Ряды динамики содержат два вида показателей. Показатели времени (годы, кварталы, месяцы и др.) или моменты времени (на начало года, на начало каждого месяца и т.п.). Показатели уровней ряда. Показатели уровней рядов динамики могут быть выражены абсолютными величинами (производство продукта в тоннах или рублях), относительными величинами (удельный вес городского населения в %) и средними величинами (средняя заработная плата работников отрасли по годам и т. п.). В табличной форме ряд динамики содержит два столбца или две строки.

19)Индексами называют сравнительные относительные величины, которые характеризуют изменение сложных социально-экономических показателей (показатели, состоящие из несуммируемых элементов) во времени, в пространстве, по сравнению с планом.

Индекс - это результат сравнения двух одноименных показателей, при исчислении которого следует различать числитель индексного отношения (сравниваемый или отчетный уровень) и знаменатель индексного отношения (базисный уровень, с которым производится сравнение). Выбор базы зависит от цели исследования. Если изучается динамика, то за базисную величину может быть взят размер показателя в периоде, предшествующем отчетному. Если необходимо осуществить территориальное сравнение, то за базу можно принять данные другой территории. За базу сравнения могут приниматься плановые показатели, если необходимо использовать индексы как показатели выполнения плана.

Индивидуальные индексы (i) - это индексы, которые характеризуют изменение только одного элемента совокупности.

Общий (сводный) индекс  (I) характеризует изменение по всей совокупности элементов сложного явления. Если индексы охватывают только часть явления, то их называют групповыми. В зависимости от способа изучения общие индексы могут быть построены или как агрегатные (от лат. аggrega - присоединяю) индексы, или как средние взвешенные индексы (средние из индивидуальных).

Способ построения агрегатных индексов заключается в том, что при помощи так называемых соизмерителей можно выразить итоговые величины сложной совокупности в отчетном и базисном периодах, а затем первую сопоставить со второй.

В статистике имеют большое значение индексы переменного и фиксированного состава, которые используются при анализе динамики средних показателей.

Индексом переменного состава  называют отношение двух средних уровней.

Индекс фиксированного состава  есть средний из индивидуальных индексов. Он рассчитывается как отношение двух стандартизованных средних, где влияние изменения структурного фактора устранено, поэтому данный индекс называют еще индексом постоянного состава.

20)Цепные индексы получают путем сопоставления текущих уровней с предшествующим, при этом база сравнения постоянно меняется.

Базисные индексы  получают путем сопоставления с тем уровнем периода, который был принят за базу сравнения.

21)К индексам количественных (объемных) показателей относятся такие индексы, как индексы физического объема производства продукции, затрат на выпуск продукции, стоимости продукции, а также индексы показателей, размеры которых определяются абсолютными величинами. Используются различные виды индексов количественных показателей.

Индекс физического объема продукции  (ФОП) отражает изменение выпуска продукции.

Индивидуальный индекс ФОП отражает изменение выпуска продукции одного вида и определяется по формуле

 (10.1)

где q1 и q0 - количество продукции данного вида в натуральном выражении в текущем и базисном периодах.

Агрегатный индекс ФОП (предложен Э. Ласпейресом) отражает изменение выпуска всей совокупности продукции, где индексируемой величиной является количество продукции q, а соизмерителем - цена р:

 (10.2)

где q1 и q0 - количество выработанных единиц отдельных видов продукции соответственно в отчетном и базисном периодах; p0 - цена единицы продукции (отдельного вида) в базисном периоде.

При вычислении индекса ФОП в качестве соизмерителей может выступать также себестоимость продукции или трудоемкость.

Средние взвешенные индексы ФОП используются в том случае, если известны индивидуальные индексы объема по отдельным видам продукции и стоимость отдельных видов продукции (или затраты) в базисном или отчетном периоде.

Средний взвешенный арифметический индекс ФОП определяется по формуле

 (10.3)

где iq - индивидуальный индекс по каждому виду продукции; q0 p0 - стоимость продукции каждого вида в базисном периоде.

Средний взвешенный гармонический индекс ФОП

 (10.4)

где q1 p1 - стоимость продукции каждого вида в текущем периоде.

Аналогично рассчитывается индекс затрат на выпуск продукции (ЗВП), который отражает изменение затрат на производство и может быть как индивидуальным, так и агрегатным.

Индивидуальный индекс ЗВП отражает изменение затрат на производство одного вида и определяется по формуле

 (10.5)

где z1 и z0 - себестоимость единицы продукции искомого вида в текущем и базисном периодах; q1 z1 и q0 z0 - суммы затрат на выпуск продукции искомого вида в текущем и базисном периодах.

Агрегатный индекс ЗВП характеризует изменение общей суммы затрат на выпуск продукции за счет изменения количества выработанной продукции и ее себестоимости и определяется по формуле

(10.6)

где q1 z1 и q0 z0 - затраты на выпуск продукции каждого вида соответственно в отчетном и базисном периодах.

Рассмотрим построение индекса стоимости продукции (СП), который может определяться и как индивидуальный, и как агрегатный.

Индивидуальный индекс СП характеризует изменение стоимости продукции данного вида и имеет вид:

 (10.7)

где p1 и p0 - цена единицы продукции данного вида в текущем и базисном периодах; q1 p1 и q0 p0 - стоимость продукции данного вида в текущем и базисном периодах.

Агрегатный индекс СП (товарооборота) характеризует изменение общей стоимости продукции за счет изменения количества продукции и цен и определяется по формуле

 (10.8)

10.3.

Индексы качественных показателей. Факторный анализ

Качественные показатели определяют уровень исследуемого итогового показателя и определяются путем соотношения итогового показателя и определенного количественного показателя (например, средняя заработная плата определяется путем соотношения фонда заработной платы и количества работников). К индексам качественных показателей относятся индексы цен, себестоимости, средней заработной платы, производительности труда.

Самым распространенным индексом в этой группе является индекс цен.

Индивидуальный индекс цен  характеризует изменение цен по одному виду продукции и определяется по формуле

 (10.9)

где p1 и p0 - цена за единицу продукции в текущем и базисном периодах.

Соответственно определяются индексы себестоимости и затрат рабочего времени по каждому виду продукции.

Агрегатный индекс цен определяет среднее изменение цены р по совокупности определенных видов продукции q.

Для характеристики среднего изменения цен на потребитель-ские товары используют индекс цен, предложенный Э. Ласпейресом (индекс Ласпейреса):

 (10.10)

где q0 - потребительская корзина (базовый период); p0 и p1 - соответственно цены базисного и отчетного периодов.

Если количество набора продуктов принимается на уровне отчетного периода (q1 ), то в этом случае индекс цен именуется индексом Пааше:

 (10.11)

Если известны индивидуальные индексы цен по отдельным видам продукции и стоимость отдельных видов продукции, то применяются средние взвешенные индексы цен (средний взвешенный арифметический и средний взвешенный гармонический индексы цен).

Формула среднего взвешенного арифметического индекса цен

 (10.12)

где i - индивидуальный индекс по каждому виду продукции; p0 q0 - стоимость продукции каждого вида в базисном периоде.

Формула среднего взвешенного гармонического индекса цен

(10.13)

где p1 q1 - стоимость продукции каждого вида в текущем периоде.

В статистической практике очень широко используется агрегатный территориальный индекс цен, который может быть рассчитан по следующей формуле:

 (10.14)

где pA pB - цена за единицу продукции каждого вида соответственно на территории А и В; qA - количество выработанной или реализованной продукции каждого вида по территории А (в натуральном выражении).

Из формулы видно, что в данном индексе в качестве фиксированного показателя (веса) принят объем продукции территории А. При расчете данного индекса в качестве веса можно принять также объем продукции территории В или суммарный объем продукции двух территорий.

Возможны два способа расчета индексов: цепной и базисный.

Цепные индексы  получают путем сопоставления текущих уровней с предшествующим, при этом база сравнения постоянно меняется.

Базисные индексы  получают путем сопоставления с тем уровнем периода, который был принят за базу сравнения.

В качестве примера можно привести цепные и базисные индексы цен.

Цепные индивидуальные индексы цен имеют следующий ряд расчета:

  ... . (10.15)

Базисные индивидуальные индексы цен:

  ... . (10.16)

Следует помнить, что произведение цепных индивидуальных индексов цен равно последнему базисному индексу:

 (10.17)

Цепные агрегатные индексы цен:

  ... . (10.18)

Базисные агрегатные индексы цен:

  ... . (10.19)

Между индексами существует также взаимосвязь и взаимозависимость, как и между самими экономическими явлениями, что позволяет проводить факторный анализ. Благодаря индексному методу можно рассматривать все факторы независимо друг от друга, что дает возможность определить размер абсолютного изменения сложного явления за счет каждого фактора в отдельности.

Предположим, что результативный признак зависит от трех факторов и более. В этом случае результативный индекс примет вид

 (10.20)

Изменение результативного индекса за счет каждого фактора может быть выражено следующим образом:

 

  (10.21)

Для выявления роли каждого фактора в отдельности индекс сложного показателя разлагают на частные (факторные) индексы, которые характеризуют роль каждого фактора. При этом используют два метода:

 метод обособленного изучения факторов;

 последовательно-цепной метод.

При первом методе сложный показатель берется с учетом изменения лишь того фактора, который взят в качестве исследуемого, все остальные остаются неизменными на уровне базисного периода.

Последовательно-цепной метод предполагает использование системы взаимосвязанных индексов, которая требует определенного расположения факторов. Как правило, на первом месте в цепи располагают качественный фактор. При определении влияния первого фактора все остальные сохраняются в числителе и знаменателе на уровне базисного периода, при определении второго факторного индекса первый фактор сохраняется на уровне базисного периода, а третий и все последующие - на уровне отчетного периода, при определении третьего факторного индекса первый и второй факторы сохраняются на уровне базисного периода, четвертый и все остальные - на уровне отчетного периода и т.д.

23)Система национальных счетов ― это система взаимосвязанных показателей и классификаций (например, в виде таблиц), применяемая для описания и анализа макроэкономических процессов страны в условиях рыночной экономики. СНС связывает важнейшие макроэкономические показатели: объемы выпуска товаров и услуг, совокупные доходы и расходы. Также она позволяет представить ВВП (ВНП) на всех основных стадиях: производствораспределениеперераспределениепользование

СНС выполняет несколько важных функций, среди которых:

• измерение объемов производства за определенный промежуток времени

• выявление существующих тенденций в экономике

• организация экономической политики государства.

К показателям, связанным с СНС, относят: Валовой внутренний продукт (ВВП), Валовой национальный продукт(ВНП), валовой национальный располагаемый доход, конечное потребление, валовое накопление, национальное сбережение; чистое кредитование и чистое заимствование (см. Счет финансовых операций), Национальное богатствоСальдо внешней торговли.