
- •Конспект лекций По предмету «Статистика»
- •Содержание
- •Глава 1 Введение. Понятие статистики, предмет и методология. Основные определения………………………………………………………………………......4
- •Глава 2 Статистический анализ рядов распределения…………………….….14
- •Глава 3 Выборочное наблюдение………………………………………………..26
- •Глава 4 Статистическое изучение связей. Корреляционно-регрессионный анализ………………………………………………………………………………..33
- •Глава 5 Статистический анализ временных рядов……………………………45
- •Глава 1 Введение. Понятие статистики, предмет и методология. Основные определения.
- •1.1 Понятие статистики. Предмет и объект изучения статистики
- •1.2 Методология статистики
- •1.3 Этапы статистического исследования
- •1.3.1 Статистическое наблюдение
- •1.3.2 Сводка и группировка данных
- •1.4 Статистические показатели
- •1.4.1 Средняя арифметическая простая
- •1.4.2 Средняя арифметическая взвешенная
- •1.4.3 Средняя гармоническая
- •1.4.4 Средняя геометрическая
- •1.4.5 Средняя квадратическая
- •Глава 2 Статистический анализ рядов распределения
- •2.1 Построение ряда распределения
- •2.2 Графическое изображение вариационных рядов
- •2.3 Показатели центра и структуры распределения
- •2.4 Показатели вариации
- •Среднее линейное отклонение
- •3. Дисперсия
- •4. Среднее квадратическое (стандартное) отклонение
- •Относительное линейное отклонение
- •2.5 Характеристика формы распределения
- •2.6 Выравнивание эмпирических распределений и оценка соответствия эмпирического распределения теоретическому
- •Глава 3 Выборочное наблюдение
- •3.1 Способы отбора единиц в выборочную совокупность
- •3.2 Виды выборки
- •3.3 Ошибка репрезентативности (ошибка выборки)
- •3.4 Правило сложения дисперсий
- •3.5 Ошибка выборки для доли
- •3.6 Определение объема выборки
- •3.7 Особенности малой выборки
- •Глава 4 Статистическое изучение связей. Корреляционно-регрессионный анализ
- •Функционально (жестко-детерминированная) связь
- •2) Статистические связи и зависимости (стохастически детерминированная).
- •4.1 Причины возникновения корреляционной зависимости
- •4.2 Условия применения методов корреляционно-регрессионного анализа
- •4.3 Графическое изображение корреляционной зависимости
- •Показатели корреляции
- •Коэффициент корреляции
- •Коэффициент детерминации
- •Корреляционное отношение
- •Индекс корреляции
- •4.5 Регрессионный анализ. Парное и множественное уравнение регрессии
- •4.5.1 Уравнение парной регрессии
- •4.5.2 Уравнение множественной регрессии
- •4.5.3 Построение матрицы парных коэффициентов корреляции. Отбор факторов
- •4.5.4 Коэффициенты эластичности и β-коэффициенты
- •4.6 Оценка статистической значимости уравнения регрессии и его параметров
- •4.6.1 Оценка статистической значимости уравнения регрессии
- •4.6.2 Оценка статистической значимости параметров уравнения
- •Глава 5 Статистический анализ временных рядов (рядов динамики)
- •5.1 Показатели изменения уровней временного ряда
- •1) Абсолютный прирост;
- •4) Абсолютное значение 1% прироста.
- •Абсолютный прирост
- •1. Абсолютный цепной прирост
- •2. Абсолютный прирост базисный
- •Темп роста (коэффициент роста)
- •5.3.2 Изучение основной тенденции временного ряда. Выравнивание рядов динамики
- •5.3.3 Экстраполяционное прогнозирование на основе трендовых моделей
- •5.4 Автокорреляция в рядах динамики (автокорреляция уровней временных рядов)
- •5.5 Корреляция рядов динамики
- •5.6 Изучение сезонности в динамических рядах
- •5.7 Статистические индексы. Индексный анализ
- •1) Индивидуальные (I)
- •2) Общие индексы (сводные, I)
- •5.7.1 Агрегатные индексы
- •5.7.2 Индексы Ласпейреса и Пааше
- •5.7.3 Идеальный индекс Фишера
- •5.7.4 Индексы средние из индивидуальных
- •5.7.3 Индексы-дефляторы
2.3 Показатели центра и структуры распределения
Ряды распределения строятся по большим распределениям совокупности. При этом возникает необходимость получить характеристику всего набора данных с использованием одного обобщающего показателя. Прежде всего, таким показателем. Который характеризует совокупность в целом, отражает типический уровень признака в данной совокупности, является средняя арифметическая величина. Среднее рассчитывается на единицу совокупности, однако характеризует совокупность в целом.
По исходным данным средняя величина рассчитывается по средней арифметической простой; если по вариационному ряду – по средней арифметической взвешенной. В качестве весов – частоты, частости. Если среднее рассчитывается по интервальному ряду, в качестве индивидуальных значений признака используются середины интервала.
Мода (M0) – наиболее часто встречающееся значение признаков совокупности.
Проблема расчета данного показателя связана с интервальным вариационным рядом.
Сначала находится модальный интервал (интервал, которому соответствует максимальная частота).
, где
ХМ0о – нижняя граница модального интервала;
h – величина интервала;
fMo – 1 - частота интервала, предшествующего модальному;
fMo – частота модального интервала;
fMo + 1 - частота интервала, следующего за модальным.
Медиана (Ме) – значение признака у единицы, делящей ранжированный ряд пополам.
При определении медианы по ранжированному ряду без группировки
Если число единиц совокупности четное, то значение медианы определяется как среднее арифметическое двух центральных значений.
Если медиана рассчитывается по интервальному вариационному ряду, то сначала находят медианный интервал, а затем по формуле рассчитывается значение медианы.
Медианный интервал – это первый интервал, в который попадает 50% совокупности.
,
где
ХМе – нижняя граница медианного интервала;
f’Me-1 – накопленная частота интервала, предшествующего медианному;
fMe – частота медианного интервала;
∑ fi - сумма накопленных частот.
Вопрос выбора показателя центра распределения зависит от типа характеристике, по которой построен ряд распределения, а также от целей исследования.
Если показатель количественный, то могут быть рассчитаны все показатели центра распределения (и средняя величина, и медиана). Тогда выбор показателя зависит от цели исследования и характера изучаемого распределения.
Если распределение соответствует нормальному распределению, то целесообразнее использовать среднюю величину.
Если в распределении наблюдается существенная асимметрия, то следует использовать либо моду, либо медиану, исходя из цели анализа.
При оценке распределений по атрибутивным признакам, средние значения рассчитаны быть не могут. Показатель моды может быть рассчитан по любому атрибутивному признаку, то есть измерен как по номинальной, так и по порядковой шкале.
Медиана как значение показателя у единицы, делящей ранжированный ряд пополам, одновременно является характеристикой структуры распределения. Так как значение медианы характеризует структуру изучаемой совокупности, указывая, что 50% единиц имеют значение признака меньше медианного, и 50% - больше медианного.
Для более детальной характеристики структуры совокупности, используются такие показатели, как квартили, делящие ранжированный ряд на 4 равные части, децили – на 10 равных частей, перцентили – ни 100, и другие.
Возможность расчета тех или иных показателей определяется целью исследования и размером изучаемой совокупности.
Перечисленные показатели по интервальному вариационному ряду рассчитываются аналогично расчету медианы. То есть для расчета первого или нижнего квартиля сначала находят квартильный интервал, а затем значение первого квартиля.
- первый, нижний квартиль.
- третий, верхний квартиль.
Значение Q1 означает, что у 25% единиц совокупности значение показателя меньше квартильного, а у 75% - больше.
Значение Q3: у 25% единиц совокупности значение больше данного.
Межквартильное расстояние Q3 - Q1 характеризует размах вариации в центре распределения. На этом интервале находится 50% единиц изучаемой совкупности.