- •Статистика учебное пособие
- •Часть 1. Общая теория статистики
- •Глава 1. Методология и основные понятия статистики.
- •Основные понятия статистики.
- •1.2. Статистическое наблюдение.
- •1.3. Сводка и группировка статистических данных.
- •1.4. Представление статистических данных.
- •1.4.1. Статистические таблицы.
- •1.4.2. Графическое изображение статистических данных.
- •1.4.3. Решение типовых задач.
- •Глава 2. Статистические показатели.
- •2.1. Абсолютные величины.
- •2.2. Относительные величины.
- •2.3. Средние величины.
- •2.3.1. Структурные средние.
- •2.3.2. Степенные средние.
- •Глава 3. Показатели вариации.
- •3.1. Абсолютные и относительные показатели.
- •3.2. Однофакторный дисперсионный анализ
- •3.3. Показатели конкуренции.
- •Глава 4. Выборочное наблюдение.
- •4.1. Выборочная совокупность (выборка) и способы её отбора.
- •4.2. Оценка математического ожидания (средней величины).
- •4.3. Оценка вероятности или доли элементов генеральной совокупности, обладающих определенным признаком.
- •Глава 5. Корреляционная связь и ее анализ.
- •5.1. Корреляционно-регрессионный анализ.
- •5.1.1. Уравнение регрессии.
- •5.1.2. Коэффициент корреляции.
- •5.1.3. Оценка уравнения регрессии.
- •5.2. Непараметрические показатели связи.
- •5.2.1. Коэффициенты ранговой корреляции.
- •5.2.2. Анализ связи атрибутивных признаков.
- •5.2.3. Анализ связи альтернативных признаков.
- •Глава 6. Статистическое изучение динамики.
- •6.1. Виды рядов динамики. Средний уровень ряда динамики.
- •6.3. Выявление основной тенденции ряда динамики.
- •6.4. Сезонные колебания.
- •Глава 7. Экономические индексы.
- •7.1. Виды экономических индексов.
- •7.2. Общие индексы средних величин.
- •Глава 8. Экспертное оценивание.
- •8.1. Организация экспертизы.
- •8.2. Обработка и анализ результатов экспертизы.
- •8.2.1. Ранжирование объектов.
- •8.2.2. Оценивание по балльной шкале.
- •8.2.3. Парные сравнения.
- •Часть 2. Применение статистики в конкретных исследованиях
- •Глава 9. Оценка экономического развития страны
- •9.1. Показатели экономического развития страны
- •9.1.1. Национальное богатство
- •9.1.2. Система национальных счетов
- •9.2. Основные производственные фонды.
- •9.2.1. Показатели основных производственных фондов.
- •9.2.2. Показатели динамики основных производственных фондов
- •9.2.3. Показатели использования основных производственных фондов.
- •9.3. Показатели объема и структуры запасов материальных ценностей.
- •Глава 10. Анализ демографической ситуации в стране
- •Глава 11. Показатели продукции, трудовых ресурсов и эффективности
- •11.1. Показатели производства материальных благ и услуг
- •11.1.1. Учет промышленной продукции
- •11.1.2. Учет продукции отраслей сферы обращения
- •11.2. Трудоустройство и занятость населения
- •11.2.1. Классификация рабочей силы
- •11.2.2. Показатели трудоустройства и занятости населения
- •11.3. Производительность труда
- •11.4. Себестоимость продукции и структура затрат на производство
- •11.5. Финансовая деятельность предприятия
- •Глава 12. Оценка уровня жизни населения
- •12.1. Потребление материальных благ и услуг
- •12.2. Показатели доходов населения
- •Глава 13. Статистика денежного обращения и кредита
- •13.1. Статистика денежного обращения
- •13.2. Статистика кредита
- •Глава 14. Статистика платежного баланса
3.2. Однофакторный дисперсионный анализ
В рамках изучения связи признаков часто возникает вопрос о том, какой из признаков влияющий (причина), а какой — зависимый (следствие). В статистике выработан ряд методов, позволяющих выделить факторы (влияющие переменные) и отклики (переменные под влиянием).
Существенную роль играет анализ разброса значений признака — их отклонений от среднего. В основе этого подхода лежит соображение о том, что, если фактор действительно оказывает влияние на отклик, то на разных уровнях фактора (т.е. при разных значениях влияющей переменной) будут наблюдаться разные средние значения отклика. Ясно, что говорить о наличии влияния можно только в том случае, если разброс значений признака в группах меньше общего разброса значений.
Следовательно, степень влияния фактора на отклик может оцениваться как отношение разброса значений отклика между группами к разбросу значений во всех группах относительно генеральной средней (средней по всем группам).
Пусть исходная совокупность делится на J однородных групп по одному фактору (т.е. фактор с J уровнями), в каждой по элементов:
Номер испытания, i |
Уровни фактора, j |
|||
1 |
2 |
... |
J |
|
1 2
|
|
|
… …
... |
|
Групповые средние |
|
|
… |
|
Сначала находятся J частных средних в каждой группе:
Далее, определяется общая средняя как средняя арифметическая этих частных средних:
Затем, вводятся три величины:
внутригрупповая сумма квадратов (sum of squares within group):
межгрупповая сумма квадратов (sum of squares between groups):
общая сумма квадратов (total sum of squares):
где J — число уровней фактора (групп);
—
объем j-ой
группы;
— внутригрупповая
средняя;
—
общая средняя для
всей совокупности.
Несложно доказать, что
SSt= SSw + SSb.
Однофакторный дисперсионный анализ — метод, позволяющий на основании проверки гипотезы о равенстве средних делать выводы о направленном влиянии (одного) фактора на зависимый признак.
Модель однофакторного дисперсионного анализа выражает предположение о том, из чего значение зависимого признака (Y), и записывается следующим образом:
где
μ—
некий средний уровень по всей изучаемой
совокупности, на фоне которого изучается
действие фактора (X)
на зависимый признак (Y);
— вклад в формирование значения
зависимого признака j-го
уровня фактора (X)
(модель);
— случайная добавка, (ошибка модели).
Данная запись действительна для
генеральной совокупности, на выборочной
совокупности генеральные параметры
заменяются выборочными оценками.
Подставив выборочные оценки в уравнение,
получим:
Все три элемента модели можно расценить как вклады в вариацию признака Y, как источники такой вариации.
Нулевой статистической гипотезой дисперсионного анализа является равенство средних значений зависимого признака при разных уровнях фактора:
Заметим,
что альтернативная гипотеза
здесь формулируется достаточно
неопределенно —
:
не все средние равны.
Каждой сумме квадратов отвечает свое число степеней свободы:
где J –количество уровней фактора; n – количество измерений при каждом уровне фактора.
Заметим, что
Введем обозначения
MSb, MSw, MSt — средние квадраты: межгрупповой, внутригрупповой и общий (mean square between/within/total).
Искомая статистика (критерий Фишера) имеет вид
Чем больше влияние факторного (группировочного) признака на результативный, тем больше значение F.
Расчетное значение
F сравнивается с
критическим
,
определяемым по таблице в зависимости
от числа степеней свободы и уровня
значимости
.
Если
,
то факторный признак оказывает влияние
на исследуемый признак. Если
,
то только с вероятностью не выше чем
случайные значения величины
будут превышать расчетное значение.
Следовательно, с малой вероятностью
факторный признак будет оказывать
влияние на результативный признак и
это влияние можно не учитывать.
Соотношение
межгруппового и общего средних квадратов
называется коэффициентом детерминации
и показывает, какая доля в общей
дисперсии приходится на дисперсию,
обусловленную вариацией признака,
положенного в основу группировки:
Пример 3.2. Банк имеет по четыре отделения в трех городах. Текущие объемы денежных вкладов (в условных единицах) представлены в таблице:
Можно ли
утверждать на уровне значимости
Вычисляем
групповые средние
Межгрупповая (факторная) сумма квадратов (3.9):
Внутригрупповая (остаточная) сумма квадратов (3.8):
Общая сумма квадратов: SSt= SSw + SSb =204+224=428. Степени свободы равны:
Статистика (критерий) Фишера:
Для
Полученный коэффициент детерминации (3.22):
показывает, что дисперсия зависит от места расположения отделений на 52,3%; остальные же 47,7 % объясняются множеством других неучтенных факторов. |
|||||||||||||||||||||||

,
что в среднем дела идут одинаково
хорошо во всех трех городах?
и общее среднее
.
.
Следовательно,
и различия значимы.