Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по статистике.doc
Скачиваний:
484
Добавлен:
01.05.2015
Размер:
6.71 Mб
Скачать

Дисперсия альтернативного признака

Среди множества варьирующих признаков, изучаемых статистикой, существуют признаки, которыми обладают одни единицы совокупности и не обладают другие. Эти признаки называются альтернативными. Примером таких признаков являются наличие бракованной продукции, ученая степень преподавателя вуза, учеба по определенной специальности и т. д.

Предположим, что вся статистическая совокупность имеет nединиц. Из нихmединиц обладают выделенным признаком, тогда оставшиесяnmединиц не обладают этим признаком.

Долю единиц, обладающих признаком, обозначим: , тогда пусть доля единиц, не обладающих данным признаком.

р + q = 1

Единицам х,обладающим данным признаком, присвоим значениех= 1, а не обладающим –х= 0.

Среднее значение альтернативного признака:

=р.

То есть среднее значение альтернативного признака равно доле единиц, обладающих данным признаком.

Дисперсия альтернативного признака:

σ2=

То есть дисперсия альтернативного признака равна произведению доли единиц, обладающих данным признаком, на долю единиц, не обладающих данным признаком.

Пример:5% изготовленных изделий – брак, тогда 95% изделий годных. Дисперсия доли брака равна: σ2 = 0,050,95 = 0,0475, а среднее квадратическое отклонение доли брака составляет σ =или 22%.

Предельное значение дисперсии альтернативного признака равно 0,25; оно получается при р=q= 0,5.

3. Дисперсионный анализ

Вариация признака обусловлена различными факторами, некоторые из этих факторов можно выделить, если статистическую совокупность разбить на группы по какому-либо признаку. Тогда, наряду с изучением вариации признака по всей совокупности в целом, становится возможным изучить вариацию для каждой из составляющих ее группы, а также и между этими группами. В простейшем случае, когда совокупность расчленена на группы по одному фактору, изучение вариации достигается посредством исчисления и анализа трех видов дисперсий:общей, межгрупповой и внутригрупповой.

Общая дисперсия σ2общизмеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака х от общей по совокупности средней и может быть вычислена по формуле простой или взвешенной дисперсии.

Межгрупповая дисперсия σ2межгр характеризует систематическую вариацию результативного признака, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних от общей средней:

σ2межгр= ,

где f — численность единиц в группе.

Внутригрупповая (частная) дисперсия σ2i отражает случайную вариацию, т. е. часть вариации, обусловленную влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы х от средней арифметической этой группы (групповой средней) и может быть исчислена по формуле простой или взвешенной дисперсии:

σ2i= (простая формула);

σ2i= (взвешенная).

На основании внутригрупповой дисперсии по каждой группе (σ2i) можно определить общую среднюю из внутригрупповых дисперсий:

= .

Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:

σ2общ= σ2межгр+ .

Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью — неизвестную, а также судить о силе влияния группировочного признака.

Чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака на изучаемый признак.

В статистическом анализе широко используется эмпирический коэффициент детерминации 2) — показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака и характеризующий силу влияния группировочного признака на образование общей вариации:

η2 = .

Эмпирический коэффициент детерминации показывает долю вариации результативного признака у под влиянием факторного признака х (остальная часть общей вариации у обусловливается вариацией прочих факторов). При отсутствии связи эмпирический коэффициент детерминации η2 равен нулю, а при функциональной связи — единице. Если, например η2 = 0,666, это значит, что на 66,6% вариация исследуемого показателя обусловлена различиями в значениях признака-фактора, положенного в основание группировки, и на 33,4% — влиянием прочих факторов.

Эмпирическое корреляционное отношение — это корень квадратный из эмпирического коэффициента детерминации:

η = .

Оно показывает тесноту связи между группировочным и результативным признаками.

Эмпирическое корреляционное отношение η, как и η2, может принимать значения от 0 до 1.

Если связь отсутствует, то корреляционное отношение η = 0, т. е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный признак никак не влияет на образование общей вариации.

Если связь функциональная, то корреляционное отношение η = 1. В этом случае межгрупповая дисперсия равна общей дисперсии (σ2межгр = σ2), т. е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака.

Чем значение корреляционного отношения ближе к единице, тем теснее, ближе к функциональной зависимости связь между признаками.