- •Глава 6 статистические показатели
- •Понятие, формы выражения и виды статистических показателей
- •6.2 Абсолютные показатели
- •6.3 Относительные показатели
- •Сущность и значение средних показателей
- •Средняя арифметическая и ее свойства
- •Продажа акций ао «Дока-хлеб» на торгах фондовой секции тмб «Гермес»
- •Заработная плата работников предприятия за май 2002 г.
- •Другие виды средних
- •Валовой сбор и урожайность зерновых культур по Уральскому федеральному округу в 2000 г.
- •Основные понятия
- •Аналитическая статистика
- •Глава 7 показатели вариации и анализ .Частотных распределений
- •Вариация признака в совокупности и значение ее изучения
- •Доля мальчиков, родившихся у матерей до 45 лет
- •Показатели центра распределения
- •Распределение рабочих по тарифному разряду
- •Распределение коммерческих банков по сроку функционирования
- •Вычисление о2 и а по несгруппированным данным
- •Вариации альтернативного признака. Энтропия распределения
- •Виды дисперсий в совокупности, разделенной на группы. Правило сложения дисперсий
- •2. Определим средние объемы выполненных работ по предприятиям каждой формы собственности:
- •5. Найдем общую дисперсию по правилу сложения дисперсий:
- •Удельный вес основных рабояях фирмы
- •Структурные характеристики вариационного ряда распределения. Показатели дифференциации
- •Распределение оценок учеников за диктант при 100-балльной оценке*
- •7.7 Моменты распределения
- •7.8 Изучение формы распределения
- •Распределение коммерческих банков по размеру выданных кредитов
- •Теоретические распределения в анализе вариационных рядов
- •Расчет критерия Колмогорова поданным крепости одиночной нити в 500 образцах
- •Основные понятия
Вариации альтернативного признака. Энтропия распределения
В ряде случаев возникает необходимость в измерении дисперсии так называемых альтернативных признаков, тех, которыми обладают одни единицы совокупности и не обладают другие. Примером таких признаков являются: бракованная продукция, ученая степень преподавателя вуза, работа по полученной специальности и т.д. Вариация альтернативного признака количественно проявляется в значении нуля у единицы, которая этим признаком не обладает, или единицы у той, которая данный признак имеет.
Пусть/? - доля единиц в совокупности, обладающих данным признаком (р = min); q - доля единиц, не обладающих данным признаком, причем р+ q = 1. Альтернативный признак принимает всего два значения - 0 и 1 с весами соответственно q и р. Исчислим среднее значение альтернативного признака по формуле средней арифметической:
(7.30)
Дисперсия альтернативного признака определяется по формуле:
(7.31)
238
Таким образом, дисперсия альтернативного признака равна произведению доли на число, дополняющее эту долю до единицы. Корень квадратный из этого показателя, т.е. ^[pq, соответствует среднему квадратическому отклонению альтернативного признака. Предельное значение дисперсии альтернативного признака равно 0,25 при/?= 0,5.
Показатели вариации альтернативных признаков широко используются в статистике, в частности, при проектировании выборочного наблюдения, обработке данных социологических обследований, статистическом контроле качества продукции, в ряде других случаев.
Пример. В трех партиях готовой продукции, представленной на контроль качества, была обнаружена годная и бракованная продукция (табл. 7.8).
Таблица 7.8 Продукция, представленная на контроль качества
Партия
|
Готовая продукция, шт.
|
Из них продукция
|
|
годная
|
бракованная
|
||
1
|
1200 '
|
800
|
400
|
2
|
.'дмй 1000
|
840
|
160
|
3
|
".»•• 1100
|
1000
|
100
|
Определим в целом для всех партий следующие показатели:
1) средний процент годной продукции и средний процент брака;
2) дисперсию, среднее квадратическое отклонение, коэффициент вариации годной продукции.
Произведем расчет данных показателей на нашем примере. Средний процент годной продукции в трех партиях равен:
239
Средний процент бракованной продукции составш»:
/ q = 1-0,8 = 0,2 или 20%.
Дисперсия удельного веса годной продукции:
Среднее квадратическое отклонение удельного веса годной продукции;
Коэффициент вариации удельного веса годной продукции в общем выпуске продукции:
Обобщенной характеристикой различий внутри рада может служить энтропия распределения. Применительно к статистике энтропия - это мера неопределенности данных наблюдения, которая может иметь различные результаты. Энтропия зависит от числа градаций признака и от вероятности каждой из них. Энтропия показывает, имеется ли закономерность в концентрации отдельных градаций у наименьшего числа позиций или, напротив, заполненность распределения одинаковая. При этом сумма вероятностей всех возможных исходов равна единице. Энтропия измеряется в битах.
Показатель энтропии Я, представляет собой отрицательную сумму произведения вероятностей различных значений случайной величины (р) на логарифмы (при основании два) этих вероятностей:
(7.32)
Если все варианты равновероятны, то энтропия максимальна. Если же все варианты, за исключением одного, равны нулю, то энтропия равна нулю.
240
Энтропия альтернативного признака (я =2) при равновероятном распределении (р = 0,5) равна единице:
(7.33)
Пример. Расчет энтропии распределения можно показать на выпуске продукции различных сортов на одном из предприятий точного машиностроения (табл. 7.9).
Таблица 7.9 Вероятность выпуска различных сортов продукции
Сорт
|
1-й
|
2-й
|
3-й
|
Брак
|
Итого
|
Вероятность, p^
|
0,90
|
0,04
|
0,05
|
0,01
|
1,00
|
(7.34)
где р - вероятность любого возможного состояния сложной системы.
Показатель энтропии позволяет также измерять количество информации. Чем больше информации о случайном событии, тем определеннее его состояние. Чем больше вероятность случайного события ^, тем меньше информации несет его осуществление. В случае р^= 1
(7.35)
241
Следовательно, данное испытание не содержит никакой информации. Аналогично и при/» =0.
Энтропия распределения интерпретируется как мера рассредоточенное™ вариантов случайной переменной по ее возможным значениям, или как мера неопределенности значения реализации. Неопределенность значений реализации случайной переменной предусматривает наличие некоторого наблюдателя, находящегося в том или ином отношении к источнику неопределенности. Очевидно, можно представить ситуацию, когда для двух наблюдений степени неопределенности результата одного и того же наблюдения со случайными исходами существенно различаются. Например, различны результаты голосования при экспертных опросах для наблюдателя - участника голосования и наблюдателя, не участвующего в голосовании.
В связи с тем что верхнего предела энтропия распределения не имеет, целесообразно вычислить наряду с абсолютной и относительную величину неопределенности.
Относительная энтропия определяется как отношение ее фактической величины к максимальной, т.е.
(7.36)
Это отношение изменяется от 0 до 1 и может быть интерпретировано. Чем меньше относительная энтропия, тем меньше неопределенность и выше однородность.
7.5