Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Алфёров А.С. Маркетинг для радиоинженеров. СПб....doc
Скачиваний:
15
Добавлен:
28.08.2019
Размер:
3.04 Mб
Скачать

5.6. Оценка согласия эмпирических и теоретических распределений

Согласие Fт(х) и Fэ(х) оценивается с целью проверки достоверности всех последующих расчетов.

Для оценок обычно применяют стандартные критерии согласия. Всего их известно до 200, но применяют практически, в основном, два: 2 (хи–квадрат) и Колмогорова. Оцениваются разности Fэ(х) и Fт(х) в сравнении с табулированными данными, по которым выясняются соответствие или несоответствие сравниваемых функций. При этом задаются ошибками первого и второго родов.

Для понимания сути этих ошибок полезно вообразить поиск адреса в полузабытом районе. Ошибка первого рода – это вход в подъезд не того дома, но напомнившего искомый. Ошибка второго рода – это незамеченный и пропущенный подъезд, являющийся искомым.

Критерий согласия комплектуется таблицами для выбора доверительных интервалов, внутри которых согласие Fт(х) и Fэ(х) не отрицается. Выбор осуществляется, исходя из доверительной вероятности . В таблицах есть значения  от 0,001 до 0,999, что вполне перекрывает любые предпочтения исследователей. Однако, у многих возникает недоумение в связи со смыслом расчетов, в которых можно произвольно менять результат, избирая . Констатация соответствия Fт(х) и Fэ(х) при  = 0,15, к примеру, ничего не скажет тем, кто привык к детерминированным моделям, поскольку при  = 0,1 соответствия уже нет.

Исследователю, работающему с критериями согласия, необходимо представить себе процесс отбора выборок из статистического ансамбля, который аппроксимируется Fт(х). Если для каждой выборки строить Fэ(х), то они будут заполнять некоторое поле графика, причем, часть из них уложится в «Прокрустово ложе» доверительных интервалов, а другая будет «перехлестывать» их.

Для исследуемого статистического ансамбля можно выбрать узкие доверительные интервалы, к примеру,  = 0,1. Тогда из 10 выборок, взятых из одного ансамбля, будет только одна, чья Fэ(х) будет полностью внутри доверительных интервалов. Если взять  = 0,9, то, соответственно, лишь 1 выборка будет с Fэ(х), не уложившейся в доверительные интервалы. При этом соответствие статистическому ансамблю Fт(х) не отрицается.

Первая ошибка, подстерегающая исследователя – это признание соответствия Fэ(х) некоей F1(х), которая предназначена для других статистических ансамблей. Это признание желаемого за действительное. Похоже на выбор рыбака – столь мелкая сетка, что захватывает ненужных мальков.

Вторая ошибка настигает исследователя, когда он отвергает соответствие Fэ(х) той самой функции F0(х), которая предназначена для анализируемого статистического ансамбля. Это отрицание реальности напоминает выбор рыбака: крупная сетка, пропускающая, кроме всего лишнего, основную часть улова.

Различия критериев можно уподобить избирательности фильтров верхних и нижних частот. Критерии согласия принято различать по мощности . 1 –  является вероятностью того, что будет признано соответствие гипотезе F1(х), в то время как на самом деле соответствует эмпирическая функция F0(х), т.е. ошибка 1 рода. Ошибка 2 рода – это отрицание соответствия F0(х), в то время как она верна.

Критерии согласия применяются в практических задачах в качестве меры соответствия эмпирического и теоретического распределений, исходя из  = 0 для представительной выборки. Кроме того, по критерию сравниваются опубликованные данные о статистических мерах, нормируются требования к случайным процессам, прогнозируются итоги оценок для малых выборок и т.п.

Недостатками мощных критериев являются чрезмерные объем и сложность вычислений и, для практических задач, отсутствие возможностей учета физико-технических данных, определяющих вариацию исследуемых значений Fэ(х).

Конкретные сведения об исследуемом предмете могут в существенной мере уменьшить риски ошибок при выборе статистических гипотез. Сравнение Fэ(х) и Fт(х) будет тем корректнее, чем подробнее будут известны причинно–следственные связи, определяющие рассеивание Fэ(х), а также граничные и начальные условия, исходя из которых выведено аналитическое выражение Fт(х).

Стремление выбирать статистические гипотезы с учетом знаний исследователя проявилось в отечественной литературе обилием гистограмм (полигонов) распределения. Именно гистограммы оказались несравненно «доходчивыми», доступными восприятию и манипуляциям. К сожалению, гистограммы лишены метрологических свойств, как отмечалось выше. Исследователи нередко делают по гистограммам далеко идущие выводы, в частности, о «бимодальности» и даже «многомодальности». В реальности могут присутствовать смеси нескольких ансамблей, но могут быть и неверно избранные теоретические распределения.

«Доходчивость» вероятностного графика – дело привычки, главное, доступность статистическим расчетам.

На вероятностном графике можно изобразить доверительные интервалы с избранной  для любого критерия согласия – по табличным значениям квантилей. Стандартные критерии согласия будут представлены кривыми, «симметричными» относительно прямой Fт(х). Кривизна эта усложняет графические расчеты.

Мощные критерии согласия содержат весовую функцию, которая увеличивает «вклад» реализации по мере удаления от центра. Графически этот прием отображается спрямлением доверительных интервалов. Аналитическое выражение весовой функции здесь не рассматривается, как и все прочие формулы. Констатируется лишь, что нет препятствий для формирования такой функции. Для критериев с табулированными квантилями доступны расчеты взаимосвязей между данными в численной форме.

Д ля вероятностного графика являются предпочтительными доверительные интервалы, параллельные прямой Fт(х) т.е. прямые, параллельные и равноудаленные от Fт(х).

Рис. 28. Построение доверительных интервалов.