
- •Тема 4. Статистические показатели
- •4.1. Понятие и атрибуты статистического показателя
- •4.2. Классификация показателей, применяемых в статистике
- •4.3. Виды и принципы построения относительных показателей
- •Тема 5. Обобщающие характеристики статистических совокупностей
- •5.1. Общее понятие средней величины, средняя арифметическая величина, особенности расчета
- •5.2. Квадратичная, кубическая, геометрическая, гармоническая средние
- •5.3. Многомерная средняя величина
- •Данные по 9 магазинам района
- •Средние величины по учитываемым признакам
- •5.4. Понятие вариации. Вариационный ряд. Графическое отображение вариации
- •5.5. Показатели вариации
- •5.6. Вариация сгруппированных данных
5.6. Вариация сгруппированных данных
Используя показатели вариации можно получить информацию не только об изменчивости значения признака в рамках исследуемой совокупности, но и о связи между признаками. Для этого необходимо оценить соотношения различных показателей дисперсии.
Предположим, что между признаками, тесноту связи которых предстоит оценить, существует причинно-следственная зависимость, т. е. предполагается, что изменение одного признака может привести к изменению другого признака.
Рассмотрим процедуру анализа вариации сгруппированных данных на примере.
Пример. В группе из 15 студентов (табл. 5.7) проведено практическое занятие, на котором различные студенты решили разное количество задач. Необходимо определить, зависит ли число решенных студентом задач от того, подготовился он к занятию или нет.
Таблица 5.7
Группировка студентов по признаку «подготовка к занятию»
Группа студентов |
Число студентов |
Количество решенных задач |
Групповая средняя |
Подготовленные |
10 |
10; 9; 8; 9; 9; 8; 9; 8; 9; 9 |
8,8 |
Неподготовленные |
5 |
6; 5; 4; 6; 5 |
5,2 |
Итого |
15 |
|
7,6 |
В дисперсионном анализе различают следующие виды дисперсии:
– общая дисперсия;
– средняя из остаточных дисперсий;
– межгрупповая дисперсия.
Общая дисперсия – это мера отклонения значений признака отдельных ЕСС от среднего по совокупности значения признака. Общая дисперсия определяет меру рассеивания значений признака по всем единицам совокупности под влиянием всех факторов. Например, величина общей дисперсии в данном случае (табл. 5.7) характеризует различие оценок по всем 15 студентам и рассчитывается следующим образом:
.
Средняя величина (7,6) рассчитывается как простая средняя по индивидуальным значениям числа решенных задач по 15 студентам.
Остаточная (внутригрупповая) дисперсия – это мера отклонения значений признака отдельных ЕСС в группе от среднего по данной группе значения признака. Остаточная дисперсия определяет величину рассеивания значений признака по единицам одной группы под влиянием всех факторов, кроме фактора, положенного в основу группировки, и рассчитывается по формуле
.
В данном примере в основу группировки положен признак подготовленности к занятию. Следовательно, остаточная дисперсия в каждой группе характеризует расхождение в числе решенных задач, не связанное с фактом подготовленности к занятию (индивидуальные способности, «списал решение у соседа», случайные факторы и т.п.):
;
.
Средняя из остаточных дисперсий определяет меру рассеивания значений признака по всем единицам совокупности под влиянием всех факторов, кроме фактора, положенного в основу группировки и рассчитывается как средняя из внутригрупповых дисперсий:
.
В данном примере средняя из остаточных дисперсий определяет меру рассеивания значений признака (числа решенных задач) по всем единицам совокупности (по 15 студентам) под влиянием всех факторов, кроме фактора, положенного в основу группировки (кроме фактора подготовленности к занятию):
.
Средняя из остаточных дисперсий рассчитывается как средняя взвешенная, по правилу расчета средних из относительных показателей (см. тема 5, 5.1). Единицей осреднения в данной задаче является один студент, и весом выбирается число студентов в группе (именно эта величина является знаменателем при расчете средних дисперсий в группах).
Межгрупповая дисперсия – это мера отклонения средних по группам значений признака от общей по совокупности средней величины. Межгрупповая дисперсия определяет меру рассеивания значений признака под влиянием фактора, положенного в основу группировки, измеряя вариацию значений групповых средних, и рассчитывается по формуле:
.
В данном примере
.
Общая дисперсия, средняя из остаточных дисперсий и межгрупповая дисперсия объединяются в следующую формулу, которая получила название «правило сложения дисперсий»:
Проверим правильность выполненного расчета: 3,31 = 0,43 + 2,88 – правило выполняется.
Соотношение межгрупповой и общей
дисперсии показывает, какая доля вариации
результативного признака обусловлена
вариацией факторного признака и
называется коэффициентом детерминации
(
):
В рассмотренном примере количество решенных студентами задач на 87 % обусловлено их подготовленностью к занятию и только на 13 % другими факторами. Зависимость считается существенной, если коэффициент детерминации превышает 50 %. Подробнее вопросы связи признаков будут рассмотрены в теме 8 «Статистические методы анализа связи».