Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ГЛАВА 6-7.doc
Скачиваний:
5
Добавлен:
07.05.2019
Размер:
6.43 Mб
Скачать

Вариации альтернативного признака. Энтропия распределения

В ряде случаев возникает необходимость в измерении дисперсии так называемых альтернативных признаков, тех, которыми облада­ют одни единицы совокупности и не обладают другие. Примером та­ких признаков являются: бракованная продукция, ученая степень пре­подавателя вуза, работа по полученной специальности и т.д. Вариация альтернативного признака количественно проявляется в значении нуля у единицы, которая этим признаком не обладает, или единицы у той, которая данный признак имеет.

Пусть/? - доля единиц в совокупности, обладающих данным при­знаком = min); q - доля единиц, не обладающих данным призна­ком, причем р+ q = 1. Альтернативный признак принимает всего два значения - 0 и 1 с весами соответственно q и р. Исчислим среднее значение альтернативного признака по формуле средней арифмети­ческой:

(7.30)

Дисперсия альтернативного признака определяется по формуле:

(7.31)

238

Таким образом, дисперсия альтернативного признака равна про­изведению доли на число, дополняющее эту долю до единицы. Ко­рень квадратный из этого показателя, т.е. ^[pq, соответствует сред­нему квадратическому отклонению альтернативного признака. Предельное значение дисперсии альтернативного признака равно 0,25 при/?= 0,5.

Показатели вариации альтернативных признаков широко исполь­зуются в статистике, в частности, при проектировании выбороч­ного наблюдения, обработке данных социологических обследова­ний, статистическом контроле качества продукции, в ряде других случаев.

Пример. В трех партиях готовой продукции, представленной на контроль качества, была обнаружена годная и бракованная продук­ция (табл. 7.8).

Таблица 7.8 Продукция, представленная на контроль качества

Партия

Готовая продукция, шт.

Из них продукция

годная

бракованная

1

1200 '

800

400

2

.'дмй 1000

840

160

3

".»•• 1100

1000

100

Определим в целом для всех партий следующие показатели:

1) средний процент годной продукции и средний процент брака;

2) дисперсию, среднее квадратическое отклонение, коэффициент вариации годной продукции.

Произведем расчет данных показателей на нашем примере. Средний процент годной продукции в трех партиях равен:

239

Средний процент бракованной продукции составш»:

/ q = 1-0,8 = 0,2 или 20%.

Дисперсия удельного веса годной продукции:

Среднее квадратическое отклонение удельного веса годной про­дукции;

о=7м=л/^16=0,4.

Коэффициент вариации удельного веса годной продукции в об­щем выпуске продукции:

Обобщенной характеристикой различий внутри рада может служить энтропия распределения. Применительно к статистике энтропия - это мера неопределенности данных наблюдения, которая может иметь раз­личные результаты. Энтропия зависит от числа градаций признака и от вероятности каждой из них. Энтропия показывает, имеется ли законо­мерность в концентрации отдельных градаций у наименьшего числа позиций или, напротив, заполненность распределения одинаковая. При этом сумма вероятностей всех возможных исходов равна единице. Эн­тропия измеряется в битах.

Показатель энтропии Я, представляет собой отрицательную сум­му произведения вероятностей различных значений случайной вели­чины (р) на логарифмы (при основании два) этих вероятностей:

(7.32)

Если все варианты равновероятны, то энтропия максимальна. Если же все варианты, за исключением одного, равны нулю, то энтропия равна нулю.

240

Энтропия альтернативного признака (я =2) при равновероят­ном распределении (р = 0,5) равна единице:

(7.33)

Пример. Расчет энтропии распределения можно показать на вы­пуске продукции различных сортов на одном из предприятий точного машиностроения (табл. 7.9).

Таблица 7.9 Вероятность выпуска различных сортов продукции

Сорт

1-й

2-й

3-й

Брак

Итого

Вероятность, p^

0,90

0,04

0,05

0,01

1,00

(7.34)

где р - вероятность любого возможного состояния сложной системы.

Показатель энтропии позволяет также измерять количество информации. Чем больше информации о случайном событии, тем определеннее его состояние. Чем больше вероятность случайного события ^, тем меньше информации несет его осуществление. В слу­чае р^= 1

(7.35)

241

Следовательно, данное испытание не содержит никакой инфор­мации. Аналогично и при/» =0.

Энтропия распределения интерпретируется как мера рассредото­ченное™ вариантов случайной переменной по ее возможным значени­ям, или как мера неопределенности значения реализации. Неопреде­ленность значений реализации случайной переменной предусматривает наличие некоторого наблюдателя, находящегося в том или ином отно­шении к источнику неопределенности. Очевидно, можно представить ситуацию, когда для двух наблюдений степени неопределенности ре­зультата одного и того же наблюдения со случайными исходами суще­ственно различаются. Например, различны результаты голосования при экспертных опросах для наблюдателя - участника голосования и на­блюдателя, не участвующего в голосовании.

В связи с тем что верхнего предела энтропия распределения не имеет, целесообразно вычислить наряду с абсолютной и относитель­ную величину неопределенности.

Относительная энтропия определяется как отношение ее фак­тической величины к максимальной, т.е.

(7.36)

Это отношение изменяется от 0 до 1 и может быть интерпретиро­вано. Чем меньше относительная энтропия, тем меньше неопреде­ленность и выше однородность.

7.5

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]