- •Конспект лекций По предмету «Статистика»
- •Содержание
- •Глава 1 Введение. Понятие статистики, предмет и методология. Основные определения………………………………………………………………………......4
- •Глава 2 Статистический анализ рядов распределения…………………….….14
- •Глава 3 Выборочное наблюдение………………………………………………..26
- •Глава 4 Статистическое изучение связей. Корреляционно-регрессионный анализ………………………………………………………………………………..33
- •Глава 5 Статистический анализ временных рядов……………………………45
- •Глава 1 Введение. Понятие статистики, предмет и методология. Основные определения.
- •1.1 Понятие статистики. Предмет и объект изучения статистики
- •1.2 Методология статистики
- •1.3 Этапы статистического исследования
- •1.3.1 Статистическое наблюдение
- •1.3.2 Сводка и группировка данных
- •1.4 Статистические показатели
- •1.4.1 Средняя арифметическая простая
- •1.4.2 Средняя арифметическая взвешенная
- •1.4.3 Средняя гармоническая
- •1.4.4 Средняя геометрическая
- •1.4.5 Средняя квадратическая
- •Глава 2 Статистический анализ рядов распределения
- •2.1 Построение ряда распределения
- •2.2 Графическое изображение вариационных рядов
- •2.3 Показатели центра и структуры распределения
- •2.4 Показатели вариации
- •Среднее линейное отклонение
- •3. Дисперсия
- •4. Среднее квадратическое (стандартное) отклонение
- •Относительное линейное отклонение
- •2.5 Характеристика формы распределения
- •2.6 Выравнивание эмпирических распределений и оценка соответствия эмпирического распределения теоретическому
- •Глава 3 Выборочное наблюдение
- •3.1 Способы отбора единиц в выборочную совокупность
- •3.2 Виды выборки
- •3.3 Ошибка репрезентативности (ошибка выборки)
- •3.4 Правило сложения дисперсий
- •3.5 Ошибка выборки для доли
- •3.6 Определение объема выборки
- •3.7 Особенности малой выборки
- •Глава 4 Статистическое изучение связей. Корреляционно-регрессионный анализ
- •Функционально (жестко-детерминированная) связь
- •2) Статистические связи и зависимости (стохастически детерминированная).
- •4.1 Причины возникновения корреляционной зависимости
- •4.2 Условия применения методов корреляционно-регрессионного анализа
- •4.3 Графическое изображение корреляционной зависимости
- •Показатели корреляции
- •Коэффициент корреляции
- •Коэффициент детерминации
- •Корреляционное отношение
- •Индекс корреляции
- •4.5 Регрессионный анализ. Парное и множественное уравнение регрессии
- •4.5.1 Уравнение парной регрессии
- •4.5.2 Уравнение множественной регрессии
- •4.5.3 Построение матрицы парных коэффициентов корреляции. Отбор факторов
- •4.5.4 Коэффициенты эластичности и β-коэффициенты
- •4.6 Оценка статистической значимости уравнения регрессии и его параметров
- •4.6.1 Оценка статистической значимости уравнения регрессии
- •4.6.2 Оценка статистической значимости параметров уравнения
- •Глава 5 Статистический анализ временных рядов (рядов динамики)
- •5.1 Показатели изменения уровней временного ряда
- •1) Абсолютный прирост;
- •4) Абсолютное значение 1% прироста.
- •Абсолютный прирост
- •1. Абсолютный цепной прирост
- •2. Абсолютный прирост базисный
- •Темп роста (коэффициент роста)
- •5.3.2 Изучение основной тенденции временного ряда. Выравнивание рядов динамики
- •5.3.3 Экстраполяционное прогнозирование на основе трендовых моделей
- •5.4 Автокорреляция в рядах динамики (автокорреляция уровней временных рядов)
- •5.5 Корреляция рядов динамики
- •5.6 Изучение сезонности в динамических рядах
- •5.7 Статистические индексы. Индексный анализ
- •1) Индивидуальные (I)
- •2) Общие индексы (сводные, I)
- •5.7.1 Агрегатные индексы
- •5.7.2 Индексы Ласпейреса и Пааше
- •5.7.3 Идеальный индекс Фишера
- •5.7.4 Индексы средние из индивидуальных
- •5.7.3 Индексы-дефляторы
3.4 Правило сложения дисперсий
Общая дисперсия – сумма межгрупповой и внутригрупповой дисперсий.
Таблица
Производительность труда рабочих (деталей в смену) |
|||||||||
Рабочие, имеющие специальное техническое образование |
Не имеющие специального технического образования |
||||||||
84 |
93 |
95 |
101 |
102 |
62 |
68 |
82 |
88 |
105 |
= 95 (дет.) , = 81 (дет.)
На основе внутригрупповых дисперсий рассчитана средняя дисперсия.
Межгрупповая дисперсия:
Общая дисперсия:
σ2 = δ2 + σ2
185,6 = 49 + 136,6
Общая дисперсия – дисперсия, характеризующая вариацию признака под влиянием всех факторов.
Межгрупповая дисперсия характеризует вариацию анализируемого признака, обусловленную группировочным признаком.
Внутригрупповая дисперсия оценивает вариацию признака, обусловленную всеми остальными факторами, за исключением группировочного.
Поэтому общая дисперсия равна сумме межгрупповой и внутригрупповой дисперсий.
В условиях собственно-случайной выборки в формуле средней ошибки выборки используется общая дисперсия
При стратифицированной выборке для расчета ошибки репрезентативности используется внутригрупповая дисперсия.
Серийная (гнездовая) выборка. Используется межгрупповая дисперсия:
, где
r - число серий в выборочной совокупности;
R - число серий в генеральной совокупности.
Максимальная ошибка выборки возникает при организации собственно-случайной выборки. Стратифицированный и серийный отборы, позволяющие сформировать выборку по структуре и закону распределения более близкую к генеральной совокупности, дают наименьшую величину ошибки.
3.5 Ошибка выборки для доли
Теорема Бернулли – это частный случай теоремы Чебышева и теоремы Ляпунова. Она является основой расчета ошибки выборки для доли. То есть при изучении альтернативного признак или так называемой дихотомической переменной (имеющей всего два исхода). Реально это оценивается в расчете доли единиц совокупности, обладающих или не обладающих данным признаком.
При расчете средней ошибки доли используется формула, аналогичная средней ошибке средней величины, но с учетом дисперсии доли.
, где
W - выборочная совокупность (доля);
p - доля генеральной совокупности.
σ2 = W · (1 – W) - дисперсия доли.
W – tμ ≤ p ≤ W + tμ
3.6 Определение объема выборки
На стадии проектирования выборочного наблюдения рассчитывается объем выборки, который позволит получить допустимую величину ошибки, то есть ошибку, которая удовлетворит задачам исследования. Расчет объема выборки осуществляют исходя из формулы ошибки выборки. Предельная ошибка выборки:
, , ,
Величина ошибки выборки обусловлена задачами исследования и задается на стадии проектирования.
Значение t зависит от устанавливаемого уровня вероятности. Значение дисперсии берется по результатам предшествующих аналогичных исследований, если таковые проводились и если за время между исследованиями не произошло существенных изменений в изучаемой совокупности.
Может быть проведено пробное исследование и по результатам его рассчитана величина дисперсии. Но очень часто нет средств на проведение пилотажного (пробного) исследования.
К определению дисперсии подходят формально, исходя их привила трех σ - когда невозможно провести пилотажные исследования.
σ = 1/6 R , где R – размах вариации.
Если распределение заведомо асимметрично, то значение σ = 1/5 R
В формуле расчета объема выборки ( ) ошибка выборки берется как
абсолютная величина, однако, на практике размер ошибки задается, как правило, как относительная величина. То есть говорят, что ошибка не должна превышать 2% (или 5%).
→