Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
stat.doc
Скачиваний:
2
Добавлен:
28.10.2018
Размер:
239.1 Кб
Скачать

1 вопрос Предмет, задачи и методы статистики.

В настоящее время статистику рассматривают как

1) Область практической деятельности, которая связана со сбором и анализом информации;

2) Наука, которая разрабатывает свою методологию и стандарты;

3) Это данные отчётов предприятий, министерств и т.д.

Особенности статистики.

1.Общественная наука;

2. Изучает количественную сторону явлений;

3.Явление изучается в конкретных условиях места и времени.

Задачи статистики.

1.Изучение уровня явления (нищета, достаток);

2. Изучение структуры явления (состав);

3. Изучение динамики явления (изменение во времени);

4. Изучение взаимосвязи явлений;

5. Прогнозирование.

Под предметом статистики понимается количественная сторона массовых общественных явлений в постоянной связи с их содержанием или количественной стороной, а также количественное выражение закономерностей общественного развития в конкретных условиях места и времени.

2 вопрос.

Основные принципы организации государственной статистики в РФ. Обзор истории статистики.

«Статистика» впервые у Шекспира в «Гамлете». В России – Пётр 1. Первое направление – описать. Статистика стала развиваться в 19 веке. Зародилась в середине 18 века. Её основоположником был немецкий учёный Ахенваль.

Общая теория статистики делится на социальную и экономическую, а также существуют отраслевые (здравоохранения, криминогенная).

Госкомитет статистики занимается главными проблемами статистики. Госкомитет-сайт.

Задачи Госкомстата:

1.Предоставление официальной статистической информации президенту, правительству, общественности;

2. Координация статистической деятельности всех подразделений. Для этого созданы ведомственные комитеты по статистике и единый регистр предприятий;

3. Разработка нормативной документации в соответствии с международными стандартами и экономическими возможностями.

Ведомственные статистические комитеты разрабатывают свою методологию и их показатели могут отличаться от мировых.

фффф Статистика в своих исследованиях опирается на законы больших чисел. При большом количестве наблюдений действие случайных факторов можно не учитывать.

Статистическая совокупность – это объединение группы единиц исследования по каким-либо признакам.

Признак – это мера отличия единиц статистического исследования(цвет). Существует 4 вида признаков:

1. количественный

2. альтернативный (качественный признак, который может иметь только два значения)

3. порядковый (определяется в виде ранжирования какого-либо признака, должен иметь более двух значений)

4. интервальный

Для каждой из видов признаков рассчитываются определённые виды показателей. Так нельзя рассчитывать среднее значение порядкового признака. Показатели рассчитывают, а признаки измеряют.

Статистические наблюдения

Требования и этапы статистического наблюдения.

Требования к с.н.

1. оно производится непрерывно и систематически

2. учёт массовых данных должен обеспечивать полноту данных и их постоянные изменения

3. данные должны быть максимально достоверны

4. результаты наблюдения должны иметь не только научную, но и практическую ценность.

Этапы статистического наблюдения.

1. Подготовительный. На нём составляется программа стат.наблюдения

2. Организация и производство статистического наблюдения

3. Контроль полученной первичной информации.

Программа статистического наблюдения.

На первом этапе создаётся программа, которая включает в себя:

1. Цель наблюдения.

Цель – это получение достоверной информации о развитии явления или процесса для принятия управленческих решений. Объект исследования может быть совокупностью физических лиц, юридических лиц или физических единиц.

2. Единицы наблюдения – это первичный элемент, являющийся носителем признака, подлежащего регистрации.

-Существуют признаки единиц наблюдения

-Время проведения, в котором оговаривается критический момент наблюдения -Составляются вопросы наблюдения в зависимости от того, какой вид наблюдении проводится

-Определяются формы отчётности

-Разрабатывается инструментарий

Виды статистического наблюдения

1.По охвату единиц совокупности

а) сплошное

б) несплошное-1)выборочное (5%-ое, 25%-ое); 2) в виде основного массива; 3) монографическое (подробное исследование единиц наблюдения одного вида)

2.По времени регистрации

а) непрерывное (текущее)

б) периодическое

в) единовременное

3.По источникам сведений

а) докумнтальное

б) непосредственное (у врача)

в) опрос (устный, анкетный, корреспондентский, саморегистрация)

Формы статистического наблюдения

  1. Специально организованное наблюдение

  2. Регистровая

  3. Отчётность

Даже в чётко организованном наблюдении всегда встречаются ошибки.

Ошибка – это расхождение между расчётным и фактическим значением показателя исследуемой совокупности.

Виды ошибок в зависимости от причин возникновения.

  1. Ошибки регистрации

а) случайные, которые не имеют определённой направленности, возникают под действием случайных факторов. При обобщении материала эти ошибки взаимопогашаются.

б) систематические – имеют конкретную направленность для искажения результатов.

Ошибки регистрации свойственны любому наблюдению.

2) Ошибки репрезентативности

Они характеризуют расхождение между показателями, полученными в выборке с его значениями в генеральной совокупности.

а) случайные возникают, если отображаемая совокупность (выборка) не воспроизводит все признаки исследуемой генеральной совокупности.

б) систематические – возникают, если нарушен принцип отбора единиц в выборку.

Виды контроля

1. Синтаксический. заключается в проверке правильности заполнения анкеты (формуляра)

2. Логический. состоит в проверке взаимосвязи между отдельными показателями

3. Счётный или арифметический контроль

На основе всех видов контроля многие, но не все ошибки удаётся исправить.

Статистические сводки и группировки

Понятие и виды сводок

Сводка(статистическая сводка) – это научно организованная обработка результатов наблюдения, которая заключается в систематизации данных, составлении таблиц, группировке, подсчёте средних и итоговых показателей.

Сводка выполняется в три этапа:

1. предварительный контроль материалов

2. группировка и расчёт производственных показателей

3. оформление таблиц и графиков

Виды сводок

1.в зависимости от количества групп:

-простая

-сложная

2) в зависимости от места обработки материалов

-централизованная

-децентрализованная

Группировка представляет собой объединение единиц совокупностей и группы по каким-либо признакам. Классификация – это устойчивая общепринятая группировка.

Виды группировок

- в зависимости от задач систематизации

а) топологическая – которая предназначена для выявления качественных однородных групп

б) структурная группировка – строится в основном по количественному признаку

в) аналитическая группировка – предназначена для выявления зависимости между признаками

2 признака – факторный и результативный

-по числу группировочных признаков

а) простые (например, вариационные ряды)

б) сложные, которые могут быть комбинированными и многомерными

-по используемой информации

а) первичные

б) вторичные – получаются в результате перегруппировки. Перегруппировка выполняется 2 способами. 1- объединение интервалов, 2- выделение доли единиц в совокупности.

Графическое представление группировок

Гистограмма предназначена для изображения интегрального вариационного ряда.

Полигон

Кумулята. По вертикальной оси отображается накопленная частота или накопленная частость.

Правила построения группировок

1.Определяется признак, по которому строится группировка. 2) Если признак количественный. то число групп зависит от вариации признака. В общем случае количество групп определяется по формуле Стрерждесса.

n=1+3,322 lgN

3) Определяется размах R=x max – x min

r=R/n

Значение шага всегда округляется в большую сторону в зависимости от разрядности исходных данных.

4) Строится таблица, в которую вносится x, f, fn, S, Sn, xcp (для каждого интервала), совокупность.

Аналитическая группировка всегда строится по факторному признаку и характеризуется средним значением результативного признака в каждом интервале

Статистические показатели

Понятия и виды показателей

- по охвату единиц совокупности

индивидуальные

групповые

общие

-по временному фактору

моментальные

интервальные

-по форме выражения

абсолютные

относительные

средние

Абсолютные показатели

Абсолютные показатели выражают масштабы явления, они всегда именованные(стоимостные, трудовые).

Различают абсолютные показатели динамики двух видов:

-цепные ∆у б= уi-у баз

-базисные ∆у ц= уi-у (i-1)

Абсолютные показатели сравнения

∆x-x a-x b

Отношения или деления

Относительные показатели могут выражаться в разных единицах. Если мы находим коэффициент или индекс без единиц измерения.

При умножении на 100 получаем %

При умножении на 1000 получаем промили

При умножении на 10000 получаем радеций

Если в числителе и знаменателе разноимённые величины, то км/ч например.

Относительные показатели динамики

а)Цепной ОПД=ТР=xi/xi-1*100

б)Базисный ОПД=ТР=xi/x0*100

Для вычисления темпа прироста

ТП=ТР-100 (темп роста минус сто)

Относительные показатели структуры показывают удельный вес части во всей совокупности.

ОПС=(xi/x общее)*100

x общее=∑xi

Относительный показатель выполнения плана

ОПВП=(x фактич/x план)*100%

Относительный показатель планового задания

ОППЗ=(x пл.отч.года/x ф.базисного года)*100%

Относительный показатель сравнения

ОПср=(xа/xb)*100

Относительный показатель координации позволяет сравнивать части одного и того же явления или совокупности между собой

Относительный показатель интенсивности характеризует меру распространения какого-либо явления. Числитель и знаменатель в нём выражены разными единицами.

ОПИ=х/Mx

x – показатель явленя

Мx-мера распространения этого явления

Степенные средние показатели

Средние величины – обобщённая характеристика однотипных явлений. Среднюю можно вычислять только для данных, измеряемой в шкале отношений или в интервальной.

Виды средних

-Типичные и нетипичные

-Простые (по одному ряду) и взвешенные (по вариационному ряду)

Общая формула степенной средней

Если m=1 получим среднюю арифметическую для простого ряда, для гармонического.

Если m=-1 получим среднюю гармоническую

Используется для вычисления средней цены, если известна ещё и стоимость (или скорость)

Если m=0 получим среднюю геометрическую.

Используется для вычисления среднего значения отн. величин, например %-ых

Если m=2, получим среднюю квадратическую

Свойства мажорантности средних это чем больше показатель степени, тем больше величина соответств. средней.

Структурные средние

К ним относятся мода и медиана. Они показывают среднее значение ранжированных рядов или рядов, построенных по качественному признаку. Мода- это значение признака, которое встречается чаще других

где:

  • — значение моды

  • — нижняя граница модального интервала

  • — величина интервала

  • — частота модального интервала

  • — частота интервала, предшествующего модальному

  • — частота интервала, следующего за модальным

Моду можно определить графически. Для этого строим гистограмму. Соединяем верхнюю вершину..

Медиана – значения признака, которое находится в середине ранжированного ряда. Для интервального вариационного ряда медиану находят по формуле или графически.

где:

  • — искомая медиана

  • — нижняя граница интервала, который содержит медиану

  • — величина интервала

  • — сумма частот или число членов ряда

  • - сумма накопленных частот интервалов, предшествующих медианному

  • — частота медианного интервала

Графически медианы определяются по кумуляте

Квантили – это значения вариационного ряда, которые соответствуют заданному значению вероятности появления признака.

Виды квантилей.

1. Квартили – это значения признака в ранжированном ряду выбранные таким образом, что 25 % всех единиц меньше первого квартиля находятся между первым и вторым квартилем и т.д.

В интервальном ряду квартили рассчитываются по формуле медианы.

2) Квинтили. 4 квинтиля разбивают ранжированный ряд на 5 частей.

3) Децили. 9 децилей разбивают ряд на 10 частей. Рассчитываются также по этой формуле.

4) Перцентили 99 разбивают на 100 частей.

Показатели вариации

Абсолютные показатели вариации.

1) R- размах вариации (max-min)

2) Cреднее линейное отклонение

взвешенное:

Дисперсия

взвешенная:

Среднее квадратическое отклонение

Для альтернативного признака равно корню из p на q.

Для альтернативного признака сигма равна 1.25*ср.лин.откл.

Сигма используют, чтобы определить, насколько распределение близко к нормальному. В этом случае действует правило 3 сигм. В пределах x+1сигма находится 68,3 единиц совокупности. В пределах x+2сигма 95,4%, x+3 сигма 99,7% всех единиц совокупности.

Правило сложения дисперсий

В интервальном вариационном ряду можно вычислить несколько дисперсий

1) общая – оценивает вариацию всей совокупности.

2) внутригрупповая – оценивает вариацию под влиянием неучтённых факторов

Далее рассчитывается средняя внутригрупповая дисперсия () по формуле средней арифметической взвешенной.

3) Межгрупповая дисперсияОценивает ситуацию, возникшую под влиянием факторного признака, т.е. систематическую.

(

где - средняя величина по отдельной группе.

Все три вида дисперсии связаны между собой: общая дисперсия равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии:

Относительные показатели вариации

1) Коэффициент асцелляции

2) Линейный коэффициент вариации

3) Коэффициент вариации

Совокупность считается однородной, если коэффициент вариации не превышает 33% (среднюю можно считать типичной).

4) Отн.показатель квартильной вариации.

∆Q=(Q3-Q1)/2

Децильный коэффициент дифференциации

К=D9/D1

Для сравнения 2-х совокупностей можно использовать средние значения и показатели вариации. Нужно подтвердить статистическую значимость различий при помощи проверки гипотез. Существуют параметрические критерии для нормального распределения (Стьюдента и Фишера) и непараметрические критерии(Q-критерий Розенбаума ,U-критерий Манна-Уитни, Критерий Колмогорова ,Критерий Уилкоксона ). Для проверки гипотезы вычисляют эмпирическое значение критерия сравнивают с критическим табличным значением и если расчётное меньше табличного…

Показатели формы распределения

Понятие моментов

Виды моментов

-Начальные

-Центральные

-Условные

Момент – это относительная величина, которая используется для характеристики рядов распределения, это средняя арифметическая тех или иных степеней отклонений, индивидуальных значений признака от определяемой исходной величины.

Начальный момент 1-ого порядка – это среднее арифметическое взвешенное.

Формула центральных моментов 3-ого порядка:

Центральный момент 2-ого порядка – это дисперсия. Если распределение симметричное, то центральный момент 3-его порядка и всех нечётных равен 0.

Условные моменты самостоятельного значения не имеют. Используются для упрощения вычислений центральных моментов.

Асимметрия.

Более точная формула

Если ≥0.5 – асимметрия существенна, знак + - правосторонняя, знак ─ - левосторонняя.

Эксцесс

Чтобы показать, насколько форма изучаемого рада отличается от кривой нормального распределения, рассчитывают эксцесс.

Если равен 0 – распределение симметрично, >0 - распределение островершинное, <0 – плосковершинное.

Индексы

Понятие и классификация индексов

Индекс – это относительная величина сравнения или динамики сложных совокупностей и отдельных их частей.

Свойства индексов.

-Синтетические – соединение в целое разнородных единиц;

-Аналитические – определение влияния отдельных факторов на изменение изучаемого явления, влияние структурных сдвигов.

Виды индексов

1) В зависимости от характера объектов исследования: индексы объёмных и качественных показателей;

2) По степени охвата единиц совокупности: индивидуальные, групповые, общие;

3) В зависимости от методологии расчета:

-агрегатные (суммарные);

-средние от индивидуальных индексов.

4) В зависимости от задач исследования (или выбора периода)

-отдельный индекс

-ряд индексов (цепных и базисных)

Индексы количественных(объёмных) показателей

-индексы физического объёма продукции, затрат на выпуск продукции, стоимости продукции;

- индексы показателей, размер которых определяется абсолютными величинами

Индивидуальный индекс объёма продукции

iq=q1/q0

Агрегатный индекс объёма продукции (Ласпейреса)

Iq=(∑q1*p0)/ (∑q0*p0)

Iq=(∑q1p1)/(∑(1/iq)*(q1*p1))

Индивидуальный индекс товарооборота(количеств.)

ipq=(p1*q1)/ (p0*q0)

Общий индекс товарооборота

Ipq=(∑p1*q1)/(∑p0*q0) p – цена, q – количество.

Индексы качественных показателей

- курсы валют, цен, работы и т.д.

- эти индексы характеризуют динамику явления в расчёте на единицу совокупности

Они носят расчётный характер и измеряют интенсивность процесса, явления.

Индивидуальный индекс цен

ip=pi/p0,

где pi – цена текущего периода,

p0 – базисная цена.

Агрегатные индексы цен

Ласпейреса (на потребительские товары)

Ip=∑(pi*q0)/∑(p0*q0)

Паше

Ip=∑(pi*qi)/(p0*q1)

«Идеальный» индекс цен Фишера

(среднее геометрическое)

Средний взвешенный арифметический

Ip=∑(ip*q0*p0)/∑(q0*p0)(по данным прошлого периода)

Средний взвешенный гармонический

Ip=(∑q1p1)/(∑(1/ip)*(q1*p1))

Агрегатный терп. индекс цен

IpT=∑(pa*Qa)/ ∑(pb*Qa)

Взаимосвязь индексов

Iq*Ip=Iqp

Факторный анализ

Изменение товарооборота за счёт двух факторов

∆∑pq=∑(p1*q1)-∑(p0*q1) – за счёт цены

Общее правило факторного анализа:

Если оценивают изменение качественного показателя, то вес (второй показатель) фиксируют на уровне отчётного периода, а если количественного показателя, то вес фиксируют на уровне базисного периода.

∆pq(q)=∑(p0*q1)-∑(p0*q0)

∆pq=∆pq(p)- ∆pq(q)=∑(p1*q1)-∑(p0*q0) – за счёт двух факторов

Виды динамики

Анализ динамических рядов

Динамический ряд представляет собой хронологическую последовательность числовых значений статистических показателей. Он состоит из компонентов: t – показатель времени, y – уровень ряда (значение показателя).

Виды рядов.

1) Моментные ряды - отображают состояние изучаемых явлений на определённые даты (моменты) времени. Его особенности: в его уровни могут входить одни и те же единицы изучаемой совокупности.

2) Интервальные ряды – отображают итоги развития изучаемых явлений за отдельные периоды (интервалы) времени. Каждый уровень складывается из данных за более короткие интнрвалы.

3) Ряды с нарастающими итогами – складываются уровни, этим достигается обобщение результата(типа кумуляты).

4) Производные ряды – уровни состоят из средних или относительных величин.

Показатели рядов динамики:

Темп*на 100;

Абсолютный прирост (цепной и базисный)

Темп роста(цепной и базисный)

Темп прироста(цепной и базисный)

Коэффициент роста(цепной и базисный)

Темп наращивания(цепной)

Tнi=∆yцi/y0=Tрбi- Tрб(i-1)

Между цепными и базисными показателями имеется взаимосвязь: произведение последовательных цепных коэффициентов роста равно последнему базисному коэффициенту роста.

Абсолютное значение 1% прироста(цепное)

А1%=∆yцi/TПцi=0,01yi-1

Средние

Абсолютный прирост

∆y=(уn-y0)/(n-1)

Темп роста

Tр=

Темп прироста

Тп=Тр-1

Средний уровень интервального ряда - определяется по формуле средней арифметической простой.

Если ряд моментный, то по формуле средней хронологической простой:

y=(0.5y0+y1+y2+0.5yn)/(n-1)

В ряду с неравностоящими датами (по средней хронологической взвешенной).

y1=∑ti*yi/∑ ti=(t1y1+t2y2+…tnyn)/(t1+t2+…+tn)

Методы анализа тенденции

Тенденция(тренд) – показывает общее направление развития явления. Это составляющая долговременного действия.

Методы выявления тренда:

1) Укрупнение интервалов (12 месяцев – 1 квартал)

2) Метод скользящей средней – исчисляется средний уровень из определённого числа (обычно нечётного) первых по счёту уровней ряда. Затем – из такого же числа уровней, но начиная со второго по счёту и т.д. Средняя как бы «скользит» по ряду динамики.

3) Автоматическое выравнивание ряда. Даёт количественную модель отражения тенденции. Общая тенденция рассчитывается как функция времени. y=f(t)

Индекс сезонности

Процентное отношение фактических внутригрупповых уровней к теоретическим уровням.

Порядок его определения:

для каждого месяца рассчитывается средняя величина уровня.

Затем рассчитывается среднемесячный уровень всего ряда.

Определяется показатель сезонной волны – индекс сезонности Is

Индекс сезонности

Is=yi/y*100%

yi – средний уровень для каждого месяца

у – общий средний уровень

Методы прогнозирования

1) Экстраполяция тенденций (сглаживание):это распространение установленных в прошлом тенденций на будущий период.

Методы экстраполяции:

- упрощённые приёмы, основанные на средних;

- аналитические методы (позволяют построить математическую модель);

- адаптивные методы (авторегрессии).

2) Методы статистического моделирования:

- статистические (метод порной и множественной регрессии)

- динамические (анализ динамических рядов)

- методы агрегатного моделирования (разложение ряда на тенденции)

Построение уравнений регрессии

При выборе уравнения тренда (или регрессии) руководствуются ошибкой аппроксимации. Уравнение тренда имеет вид: y=y0+a1*t

a1 – коэффициент регрессии, который показывает направление зависимости. а0 и а1 находятся по методу наименьших квадратов.

а1=∑t*y/∑t*t

В найденное уравнение подставляется найденное значение времени t и находятся уровни ряда. Делается проверка, при которой сумма всех уровней ряда должна быть равна вычисленной уровне по уравнению регрессии умноженной на t.

Для построения тенденций по имеющимся двум точкам y и t можно построить уравнение y-y0/y1-y0=t-t0/t1-t0 и заполнить предполагаемые недостающие уровни ряда динамики. Данный приём называется смыкание ряда динамики по прямой.

Виды выборок и генеральных совокупностей.

Основные этапы выборочного наблюдения.

1) Определение цели, задач и составление программы;

2) Формирование выборки;

3) Сбор данных;

4) Анализ результатов и расчёт характеристик;

5) Расчёт ошибки выборки и распространение её результатов на генеральную совокупность.

Достоинства выборочного наблюдения

- Экономия ресурсов

- Снижение вероятности ошибки регистрации;

- Используется, если сплошное наблюдение связано с уничтожением объектов наблюдения.

Виды генеральных совокупностей

- В зависимости от критерия объективности: идеальные и реальные;

- В зависимости от объёма: конечные и бесконечные;

- В зависимости от принадлежности к ним элементов: конкретные и гипотетические.

Виды выборок

1) Случайная

а) повторная (каждая единица, отобранная случайно, после проведения наблюдения возв. в совокупность)

б) бесповторная (обследованные единицы в ген.совокупность не возвращаются) вероятность попасть в выборку увеличивается.

2) Типическая (стратифицированная выборка).

-Общий список разбивается на отдельные списки(однородной группы).

-Общий объём выборки n разбивается пропорционально между списками (несколько вариантов)

1 вариант разбивки

ni=n*Ni/N

ni – количество единиц в группе

n – объём выборки

N – объём генеральной совокупности

ni – число наблюдений из i- ой типической группы

Ni – объём i-ой типической группы в генеральной совокупности

2-ой вариант

Равномерный(из каждой группы поровну)

ni=n/k

k – число групп

3 вариант – оптимальный (для групп с большей вариацией признака объём наблюдения увеличивается)

ni=n*(Ni*i/∑Ni*i)

3) Серийная (гнездовая) выборка

- когда случайным образом отбираются целые серии сплошного контроля

- тогда x определяется в сериях без случайной ошибки.

4) Механическая выборка

- при ранжировании генеральной совокупности устанавливается шаг отбора в зависимости от предполагаемого % отбора. (Каждый 10-ый или каждый 20-ый).

Ошибка выборочного наблюдения – величина отклонения между расчётными и фактическими значениями признаков изучаемых объектов.

Виды ошибок:

1) Средняя ошибка (мю) зависит отвида выборки.

Результат выборочного наблюдения распространяется на генеральную совокупность всегда с определённой вероятностью (p).

2) Предельная ошибка

∆=t*мю, t – коэффициент доверия, зависит от вероятности, с которой нужен результат

Предел возможной ошибки

Случайная выборка

Средняя (стандартная) ошибка

Средняя ошибка доли признака

Объём выборки

Типическая выборка

Средняя ошибка

Объём выборки

Серийная выборка

Средняя ошибка

Объём выборки

Средняя ошибка выборки для альтернативного признака

Где t – коэффициент доверия, n – объём выборки, N – объём генеральной совокупности, s – число отобранных серий, S – общее число серий, i – средняя из групповых дисперсий, - отклонение, дельта – межгрупповая дисперсия.

Если объём генеральной совокупности неизвестен, то размер выборки определяется исходя из задачи следования и количества групп. В социологии принято объём выборки обозначать примерно 1000 единиц. В психологии и педагогике объём выборки от 189 единиц, если исследуется одна группа испытуемых. Иногда используется малая выборка размером менее 30 единиц. Для некоторого значения коэффициента доверия t иное нежели для больших выборок.

Характеристики выборки и генеральной совокупности.

1) Выборочная средняя является несмещённой и состоятельной оценкой генеральной средней.

2) Выборочная дисперсия, которая рассчитывается по формуле общей дисперсии, но является смещённой оценкой генеральной дисперсии.

Для исправления выборочной дисперсии достаточно умножить её на дробь n/n-1, получим исправленную дисперсию для генеральной совокупности.

Если распределение нормальное кроме указанных характеристик исп-ют доверительный интервал для среднего значения для дисперсии и среднего квадратического отклонения. При этом используеся закон больших чисел и неравенство Чебышева.

При неограниченном увеличении числа наблюдений в генеральной совокупности можно ожидать что отклонение выборочной средней от генеральной средней будет сколь угодно мало.

Методы изучения связей между динамическими явлениями.

Виды связей.

Если нам уже известно, что изменение одного явления вызвано изменениями другого, то говорят о зависимости между явлениями. Если строится гипотеза о зависимости одного явления на другое употребляют термин связь.

1 вид. Стокостическая или вероятностная связь. Это общий вид связей.

2 вид. Корреляционная связь, при которой одному значению одного явления соответствует множество значений другого. Эта связь проявляется только когда количество наблюдений велико. В корреляционной связи нельзя установить её количественно.

3 вид. Функциональная связь. Когда за изменением одного явления всегда строго следует изменение другого. Функциональная связь задаётся формулой. По направленю связи могут быть прямыми и обратными. Они иллюстрируются на графике.

По аналитическому выражению могут быть линейные и нелинейные. По количеству влияющих факторов: однофакторные и многофакторные.

Методы выявления наличия связей.

1) Построение аналитических группировок. Группировки дают приближённое представление о форме связи, устанавливают направление связи. Но не могут дать количественную характеристику связи.

2) Метод взаимосвязанных параллельных рядов. Заключается в сопоставлении 2-х или нескольких рядов показателей. При этом один признак будет результативным, все остальные факторными. Показания факторного признака располагаются по возрастанию или убыванию, затем параллельно производится запись результативного признака

3) Дисперсионный анализ. Совокупность должна быть разбита на группы. В основе этого метода лежит правило сложения дисперсий. Этот метод применяется в основном к количественным данным. В нём оценивается различие средних значений по одному или нескольким признакам.

4) Корреляционный анализ

5) Регрессионный анализ.

Корреляционный анализ

Цель корреляционного анализа – получение некоторой информации об одной переменной с помощью другой. Если цель достигнута, то говорят, что переменные коррелируют. Этот анализ отражает только линейную зависимость величин. Используется, если количество случаев по каждому признаку от 25 до 100. Корреляционный анализ не может дать результатов, если зависимость есть, но она нелинейна. Различают парную корреляцию (между факторным и результативным), частную (между 1 факторным и результативными) и множественную.

1) Линейный коэффициент корреляции Пирсена

Значимость r определяется с помощью критерия Стьюдента.

Сравнивают с tкр и r считается значимым, если tрасч больше tкр.

Теоретическое корреляционное отношение – позволяет оценить силу связи между признаком.

Дисперсия отражает влияние на вариацию всех остальных факторов кроме x. Оценка связи происходит по шкале Чадоко.

0< <0,2 – очень слабая

0,2<= <0,3 – cлабая

0,3<= <0,5 – умеренная

Множественный коэффициент корреляции

Этот коэффициент проявляется с помощью критерия Фишера.

Fрасч=((R*R)/(1-R*R))*((n-k-1)/k)

k – количество факторных признаков(x1,x2)

R – результативный признак (y)

V1,V2 – число степеней свободы

V1=k, V2=n-k-1, n-?.

Частные коэффициенты корреляции.

Изучение связи между качественными признаками.

Коэффициент ассоциации

Ka=(a*d-b*c)/(a*d+b*c)

Коэффициент контингенции

Кк=(a*d-b*c)/ (а+b)(a+c)(c+d)(a+d)

Связь признаётся значимой, если коэффициент ассоциации >= 0,5 и к.к. >=0,3.

Альтернативные признаки.

Коэффициент ранговой корреляции Спирмена.

Каждому показателю x и y присваивается ранг, рассчитываются разности рангов d=mx-my

Если больше 0,5, то связь подтверждена коэф.Кендалла.

Коэф.корр. знаков Фетнера и др.

Если в шкале отношений – Пирсена, бывает дихотомическая шкала (2 признака)

Статистика населения Понятия статистики населения

Статистика населения – наука, изучающая количественные закономерности, которые протекают в населении в непрерывной связи с их качественной стороной.

Население – это объект демографии, которая устанавливает его развитие, жизнедеятельность во всех аспектах (экономическом, статистическом, политическом).

Задачи статистики населения:

1) Определение численности населения в целом и различных групп;

2) Изучение взаимосвязей, имеющих место в самом населении и исследование зависимостей процессов в населении от факторов внешней среды (кор-регр. анализ)

3) Установление структуры населения и демографических процессов;

4) Рассмотрение динамики демографических процессов различных категорий населения;

5) Прогнозирование численности населения.

Виды движения населения:

1) Естественные движения (рождаемость, смертность)

2) Механическое (миграционное)

3) Социальное движение

Домохозяйства – это а) два человека и более, проживающие постоянно в жилом помещении и совместно обеспечивающие себя всем необходимым, полностью или частично объединяющие свои средства. б) один человек, постоянно проживающий…, который не объединяет свои средства с другими людьми, проживающими в этом помещении.

Семья – это супружеская пара с детьми или без детей, а также один родитель с детьми любого возраста, если дети не в браке и нет внуков.

В статистике рассчитывают структуру домохозяйств, коэффициент экономической нагрузки на работающего члена домохозяйства.

Kn=Sn/S0

Sn – общее число работающих

S0 – общее число

Определяют число иждивенцев. На одно домохозяйство, на одного занятого человека и на одного члена семьи, имеющего источник средств к существованию.

Рассчитывают средний размер домохозяйства: среднее число детей моложе 18 лет и др.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]