орлов эконометрика
.pdf
|
|
|
|
|
|
|
|
|
|
|
|
|
ную выборку, совпадает с заданной или вхо- |
|
|
|
|
|
|
|
дит в заданное параметрическое семейство. |
|
|
|
|
|
|
|
|
||
|
2.4.16. |
Критерий одно- |
Критерий для проверки гипотезы о том, что |
Рассматривают также критерии независимости, сим- |
|
||
|
|
родности |
|
функции распределений результатов наблю- |
метрии, случайности, отбраковки и др. |
|
|
|
|
|
|
|
дений из двух или нескольких независимых |
|
|
|
|
|
|
|
простых случайных выборок совпадают (аб- |
|
|
|
|
|
|
|
солютная однородность) или отдельные их |
|
|
|
|
|
|
|
характеристики совпадают (однородность в |
|
|
|
|
|
|
|
смысле математических ожиданий, коэффи- |
|
|
|
|
|
|
|
циентов вариации и т.д.). |
|
|
|
|
|
|
|
|
||
|
2.4.17. |
Номинальный |
Число, используемое в статистических табли- |
Номинальный (заданный) уровень значимости обычно |
|
||
|
|
(заданный) уро- |
цах, с помощью которого выбирают критиче- |
берут равным 0,1; 0,05; 0,01. |
|
||
|
|
вень |
значимо- |
ское значение статистики критерия при про- |
|
|
|
|
|
сти |
|
|
верке статистической гипотезы. |
|
|
|
|
|
|
|
|
|
|
|
2.4.18. |
Реальный |
(ис- |
Уровень значимости статистического крите- |
Из-за дискретности распределения статистики крите- |
|
|
|
|
тинный) |
уро- |
рия, выбранного по номинальному уровню |
рия реальный уровень значимости может быть в не- |
|
|
|
|
вень |
значимо- |
значимости. |
сколько раз меньше номинального. |
|
|
|
|
сти |
|
|
|
|
|
|
|
|
|
|
|
||
|
2.4.19. |
Достигаемый |
Случайная величина, равная вероятности по- |
Для критической области вида {x:x>a} достигаемый |
|
||
|
|
уровень |
значи- |
падания статистики критерия в критическую |
уровень значимости есть F(Xn), где Xn - рассчитанное |
|
|
|
|
мости |
|
|
область, заданную рассчитанным по выборке |
по выборке значение статистики критерия X, а F(a) = |
|
|
|
|
|
|
значением статистики критерия. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P(X>a) - дополнение до 1 функции распределения ста- |
|
|
|
|
|
тистики критерия X. Достигаемый уровень значимо- |
|
|
|
|
|
сти - это вероятность того, что статистика критерия Х |
|
|
|
|
|
в новом независимом эксперименте примет значение |
|
|
|
|
|
большее, чем при расчете по конкретной выборке, т.е. |
|
|
|
|
|
большее, чем Xn. |
|
|
|
|
|
|
|
|
2.4.20. |
Независимые |
Выборки, объединение элементов которых |
См. п.1.1.11. |
|
|
|
выборки |
моделируется набором независимых (в сово- |
|
|
|
|
|
купности) случайных элементов. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
П1-2. Математическая статистика и ее новые разделы
Приведем краткие описания (типа статей в энциклопедических изданиях) математической статистики и ее наиболее важных для эконометрики сравнительно новых разделов, разработанных в основном после 1970 г., а именно, статистики объектов нечисловой природы и статистики интервальных данных.
Статистика математическая - наука о математических методах анализа данных, полученных при проведении массовых наблюдений (измерений, опытов). В зависимости от математической природы конкретных результатов наблюдений статистика математическая делится на статистику чисел, многомерный статистический анализ, анализ функций (процессов) и временных рядов, статистику объектов нечисловой природы. Существенная часть статистики математической основана на вероятностных моделях.
Выделяют общие задачи описания данных, оценивания и проверки гипотез. Рассматривают и более частные задачи, связанные с проведением выборочных обследований, восстановлением зависимостей, построением и использованием классификаций (типологий) и др.
Для описания данных строят таблицы, диаграммы, иные наглядные представления, например, корреляционные поля. Вероятностные модели обычно не применяются. Некоторые методы описания данных опираются на продвинутую теорию и возможности современных компьютеров. К ним относятся, в частности, кластер-анализ, нацеленный на выделение групп объектов, похожих друг на друга, и многомерное шкалирование, позволяющее наглядно представить объекты на плоскости, в наименьшей степени исказив расстояния между ними.
Методы оценивания и проверки гипотез опираются на вероятностные модели порождения данных. Эти модели делятся на параметрические и непараметрические. В параметрических моделях предполагается, что изучаемые объекты описываются функциями распределения, зависящими от небольшого числа (1-4) числовых параметров. В непараметрических моделях функции распределения предполагаются произвольными непрерывными. В статистике математической оценивают параметры и характеристики распределения (математическое ожидание, медиану, дисперсию, квантили и др.), плотности и функции распределения, зависимости между переменными (на основе линейных и непараметрических коэффициентов корреляции, а также параметрических или непараметрических оценок функций, выражающих зависимости) и др. Используют точечные и интервальные (дающие границы для истинных значений) оценки.
В статистике математической есть общая теория проверки гипотез и большое число методов, посвященных проверке конкретных гипотез. Рассматривают гипотезы о значениях параметров и характеристик, о проверке однородности (т.е. о совпадении характеристик или функций распределения в двух выборках), о согласии эмпирической функции распределения с заданной функцией распределения или с параметрическим семейством таких функций, о симметрии распределения и др.
Большое значение для эконометрики имеет раздел статистики математической, связанный с проведением выборочных обследований, со свойствами различных схем организации выборок и построением адекватных методов оценивания и проверки гипотез.
Задачи восстановления зависимостей активно изучаются более 200 лет, с момента разработки К. Гауссом в 1794 г. метода наименьших квадратов. В настоящее время наиболее актуальны методы поиска информативного подмножества переменных и непараметрические методы.
Различные методы построения (кластер-анализ), анализа и использования (дискриминантный анализ) классификаций (типологий) именуют также методами распознавания образов (с учителем и без), автоматической классификации и др.
Математические методы в статистике основаны либо на использовании сумм (на основе Центральной Предельной Теоремы теории вероятностей) или показателей различия (расстояний, метрик), как в статистике объектов нечисловой природы. Строго обоснованы обычно лишь асимптотические результаты. В настоящее время компьютеры играют большую роль в статистике математической. Они используются как для расчетов, так и для имитационного моделирования (в частности, в методах размножения выборок и при изучении пригодности асимптотических результатов).
Классическая статистика математическая лучше всего представлена в [2,4]. По историческим причинам основные российские работы публикуются в [3]. Обзор современного состояния статистики математической дан в [6].
Статистика объектов нечисловой природы - раздел математической статистики,
вкотором статистическими данными являются объекты нечисловой природы, т.е. элементы множеств, не являющихся линейными пространствами. Объекты нечисловой природы нельзя складывать и умножать на число. Примерами являются результаты измерений в шкалах наименований, порядка, интервалов; ранжировки, разбиения, толерантности и другие бинарные отношения; результаты парных и множественных сравнений; люсианы, т.е. конечные последовательности из 0 и1; множества; нечеткие множества. Необходимость применения объектов нечисловой природы возникает во многих областях научной и практической деятельности, в том числе и в социологии. Примерами являются ответы на "закрытые" вопросы в эконометрических, маркетинговых, социологических анкетах, в которых респондент должен выбрать одну или несколько из фиксированного числа подсказок, мили измерение мнений о привлекательности (товаров, услуг, профессий, политиков и др.), проводимое по порядковой шкале. Наряду со специальными теориями для каждого отдельного вида объектов нечисловой природы в статистике объектов нечисловой природы имеется и теория обработки данных, лежащих
впространстве общей природы, результаты которой применимы во всех специальных теориях.
Встатистике объектов нечисловой природы классические задачи математической статистики - описание данных, оценивание, проверку гипотез - рассматривают для данных неклассического типа, что приводит к своеобразию постановок задач и методов их решения. Например, из-за отсутствия линейной структуры в пространстве, в котором лежат статистические данные, в статистике объектов нечисловой природы
математическое ожидание определяют не через сумму или интеграл, как в классическом случае, а как решение задачи минимизации некоторой функции. Эта функция представляет собой математическое ожидание (в классическом смысле) показателя различия между значением случайного объекта нечисловой природы и фиксированным элементом пространства. Эмпирическое среднее определяют как результат минимизации суммы расстояний от нечисловых результатов наблюдений до фиксированного элемента пространства. Справедлив закон больших чисел: эмпирическое среднее сходится при увеличении объема выборки к математическому ожиданию, если результаты наблюдений являются независимыми одинаково распределенными случайными объектами нечисловой природы и выполнены некоторые математические "условия регулярности".
Аналогичным образом определяют условное математическое ожидание и регрессионную зависимость. Из доказанной в статистике объектов нечисловой природы сходимости решений экстремальных статистических задач к решениям соответствующих предельных задач вытекает состоятельность оценок в параметрических задачах оценивания параметров и аппроксимации, а также ряд результатов в многомерном статистическом анализе. Большую роль в статистике объектов нечисловой природы играют непараметрические методы, в частности, методы непараметрической оценки плотности и регрессионной зависимости в пространствах общей природы, в том числе и в дискретных пространствах.
Для решения многих задач статистики объектов нечисловой природы -
нахождения эмпирического среднего, оценки регрессионной зависимости, классификации наблюдений и др. - используют показатели различия (меры близости, расстояния, метрики) между элементами рассматриваемых пространств, вводимые аксиоматически. Так, в монографии [7] аксиоматически введено расстояние между множествами. Принятое в теории измерений как части статистики объектов нечисловой природы условие адекватности (инвариантности) алгоритмов анализа данных позволяет указать вид средних величин, расстояний, показателей связи и т.д., соответствующих измерениям в тех или иных шкалах. Методы построения, анализа и использования классификаций и многомерного шкалирования дают возможность сжать информацию и дать ей наглядное представление. К статистике объектов нечисловой природы относятся методы ранговой корреляции, статистического анализа бинарных отношений (ранжировок, разбиений, толерантностей), параметрические и непараметрические методы обработки результатов парных и множественных сравнений. Теория люсианов (последовательностей независимых испытаний Бернулли) развита в асимптотике растущей размерности.
Статистика объектов нечисловой природы как самостоятельный раздел прикладной математической статистики выделена в монографии [7]. Обзору ее основных направлений посвящен, например, сборник [8]. Ей посвящен раздел в энциклопедии [2].
Статистика интервальных данных (СИД) - раздел статистики объектов нечисловой природы, в котором элементами выборки являются интервалы в R, в частности, порожденные наложением ошибок измерения на значения случайных величин. СИД входит в теорию устойчивости (робастности) статистических процедур (см. [7]) и примыкает к интервальной математике (см. [9]). В СИД изучены проблемы регрессионного анализа, планирования эксперимента, сравнения альтернатив и принятия решений в условиях интервальной неопределенности и др. (см.[10-13]).
Развиты асимптотические методы статистического анализа интервальных данных при больших объемах выборок и малых погрешностях измерений. В отличие от классической математической статистики, сначала устремляется к бесконечности объем выборки и только потом - уменьшаются до нуля погрешности. Разработана общая схема исследования (см. [14]), включающая расчет двух основных характеристик СИД - н о т н ы (максимально возможного отклонения статистики, вызванного интервальностью исходных данных) и р а ц и о н а л ь н о г о о б ъ е м а в ы б о р к и (превышение которого не дает существенного повышения точности оценивания и статистических выводов, связанных с проверкой гипотез). Она применена к оцениванию математического ожидания и дисперсии, медианы и коэффициента вариации, параметров гамма- распределения в ГОСТ 11.011-83 [15] и характеристик аддитивных статистик, для проверки гипотез о параметрах нормального распределения, в т.ч. с помощью критерия Стьюдента, а также гипотезы однородности двух выборок по критерию Смирнова, и т.д.. Разработаны подходы СИД в основных постановках регрессионного, дискриминантного и кластерного анализов (см. [16]).
Многие утверждения СИД отличаются от аналогов из классической математической статистики. В частности, не существует состоятельных оценок: средний квадрат ошибки оценки, как правило, асимптотически равен сумме дисперсии этой оценки, рассчитанной согласно классической теории, и квадрата нотны. Метод моментов иногда оказывается точнее метода максимального правдоподобия (см. [15, 17]). Нецелесообразно с целью повышения точности выводов увеличивать объем выборки сверх некоторого предела. В СИД классические доверительные интервалы должны быть расширены вправо и влево на величину нотны, и длина их не стремится к 0 при росте объема выборки.
Многим задачам классической математической статистики могут быть поставлены в соответствие задачи СИД, в которых элементы выборок - действительные числа заменены на интервалы. В статистическое программное обеспечение включают
алгоритмы СИД, "параллельные" их аналогам из классической математической статистики. Это позволяет учесть наличие погрешностей у результатов наблюдений.
Цитированная литература
1.Колмогоров А.Н. Основные понятия теории вероятностей. 2-е изд. - М.: Наука, 1974. -
120с.
2.Вероятность и математическая статистика. Энциклопедия / Гл. ред. Ю. В. Прохоров. – М.: Изд-во «Большая Российская Энциклопедия», 1999. – 910 с.
3.Орлов А.И. Термины и определения в области вероятностно-статистических методов. – Журнал «Заводская лаборатория». 1999. Т.65. No.7. С.46-54.
4.Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. - М.: Наука, 1983.
5.Секция "Математические методы исследования" журнала "Заводская лаборатория. Диагностика материалов".
6.Орлов А.И. Современная прикладная статистика. - Журнал "Заводская лаборатория". 1998. Т.64. No.3. С. 52-60.
7.Орлов А.И. Устойчивость в социально-экономических моделях. - М.: Наука, 1979. - 296
с.
8.Анализ нечисловой информации в социологических исследованиях. - М.: Наука, 1985. -
220с.
9.Шокин Ю.И. Интервальный анализ. - Новосибирск: Наука, 1981. - 112 с.
10.Вощинин А.П. Метод оптимизации объектов по интервальным моделям целевой функции. - М.: МЭИ, 1987. - 109 с.
11.Вощинин А.П., Сотиров Г.Р. Оптимизация в условиях неопределенности. - М.: МЭИ - София: Техника, 1989. - 224 с.
12.Кузнецов В.П. Интервальные статистические модели. - М.: Радио и связь, 1991. - 352 с.
13.Сборник трудов Международной конференции по интервальным и стохастическим методам в науке и технике (ИНТЕРВАЛ-92). Тт. 1,2. - М.: МЭИ, 1992. - 216 с., 152 с.
14.Орлов А.И. О развитии реалистической статистики. - В сб.: Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. Пермь: Изд-во Пермского государственного университета, 1990, с..89-99.
15.ГОСТ 11.011-83. Прикладная статистика. Правила определения оценок и доверительных границ для параметров гамма-распределения. - М.: Изд-во стандартов, 1984. - 53 с.
16.Орлов А.И. Интервальный статистический анализ. - В сб.: Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. Пермь: Пермский государственный университет, 1993, с.149-158.
17.Орлов А.И. Интервальная статистика: метод максимального правдоподобия и метод моментов. - В сб.: Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. - Пермь: Изд-во Пермского государственного университета, 1995, с.114-124.
Приложение 2
Нечеткие и случайные множества
Вглаве 8 рассматривались такие виды объектов нечисловой природы, как нечеткие
ислучайные множества. Цель настоящего приложения - глубже изучить свойства нечетких множеств и показать, что теория нечетких множеств в определенном смысле сводится к теории случайных множеств. Для достижения поставленной цели формулируется и доказывается цепь теорем.
Вдальнейшем считается, что все рассматриваемые нечеткие множества являются подмножествами одного и того же множества Y.
П2-1. Законы де Моргана для нечетких множеств
Как известно, законами же Моргана называются следующие тождества алгебры множеств
A U B = A I B, A I B = A U B. (1)
Теорема 1. Для нечетких множеств справедливы тождества
A U B |
= |
|
A |
I |
B |
, |
|
A I B |
= |
A |
U |
B |
, |
(2) |
|||||||
|
= |
|
|
|
= |
|
+ |
|
. |
|
|||||||||||
A + B |
AB, |
AB |
A |
B |
(3) |
||||||||||||||||
Доказательство теоремы 1 состоит в непосредственной проверке справедливости соотношений (2) и (3) путем вычисления значений функций принадлежности участвующих в этих соотношениях нечетких множеств на основе определений, данных в главе 8.
Тождества (2) и (3) назовем законами де Моргана для нечетких множеств. В
отличие от классического случая соотношений (1), они состоят из четырех тождеств, одна пара которых относится к операциям объединения и пересечения, а вторая - к операциям произведения и суммы. Как и соотношение (1) в алгебре множеств, законы де Моргана в алгебре нечетких множеств позволяют преобразовывать выражения и формулы, в состав которых входят операции отрицания.
П2-2. Дистрибутивный закон для нечетких множеств
Некоторые свойства операций над множествами не выполнены для нечетких множеств. Так, A + A ¹ A, за исключением случая, когда А - "четкое" множество (т.е. функция принадлежности принимает только значения 0 и 1).
Верен ли дистрибутивный закон для нечетких множеств? В литературе иногда расплывчато утверждается, что "не всегда". Внесем полную ясность.
Теорема 2. Для любых нечетких множеств А, В и С
A I (B UC) = ( A I B) U ( A I C). |
(4) |
В то же время равенство |
|
A(B + C) = AB + AC |
(5) |
справедливо тогда и только тогда, когда при всех y ÎY
(μ A2 ( y) − μ A ( y))μ B ( y)μC ( y) = 0.
Доказательство. Фиксируем произвольный элемент y ÎY . Для сокращения записи обозначим a = μ A ( y), b = μ B ( y), c = μC ( y). Для доказательства тождества (4) необходимо показать, что
|
min(a, max(b, c)) = max(min(a, b), min(a, c)). |
(6) |
|
|
||||
Рассмотрим различные упорядочения трех чисел a, b, c. Пусть сначала |
a ≤ b ≤ c. |
|||||||
Тогда левая |
часть соотношения (6) есть |
min(a, c) = a, а правая max(a, a) = a, т.е. |
||||||
равенство (6) справедливо. |
|
|
|
|
|
|
||
Пусть |
b ≤ a ≤ c. |
Тогда |
в соотношении (6) слева |
стоит |
min(a, c) = a, |
а |
справа |
|
max(b, a) = a, т.е. соотношение (6) опять является равенством. |
|
|
|
|||||
Если |
b ≤ c ≤ a, |
то в |
соотношении |
(6) слева |
стоит |
min(a, c) = c, |
а |
справа |
max(b, c) = c, т.е. обе части снова совпадают.
Три остальные упорядочения чисел a, b, c разбирать нет необходимости, поскольку в соотношение (6) числа b и c входят симметрично. Тождество (4) доказано.
Второе утверждение теоремы 2 вытекает из того, что в соответствии с определениями операций над нечеткими множествами (см. главу 8)
μ A( B +C ) ( y) = a(b + c - bc) = ab + ac - abc
и
μ AB + AC ( y) = ab + ac - (ab)(ac) = ab + ac - a 2 bc.
Эти два выражения совпадают тогда и только тогда, когда, когда a 2 bc = abc, что и требовалось доказать.
Определение 1. Носителем нечеткого множества А называется совокупность всех точек y Y , для которых μ A ( y) > 0.
Следствие теоремы 2. Если носители нечетких множеств В и С совпадают с У, то равенство (5) имеет место тогда и только тогда, когда А - "четкое" (т.е. обычное,
классическое, не нечеткое) множество. |
|
Доказательство. По условию μ B ( y)μC ( y) ¹ 0 |
при всех y Y . Тогда из теоремы 2 |
следует, что μ A2 ( y) - μ A ( y) = 0, т.е. μ A ( y) = 1 или |
μA (y) = 0 , что и означает, что А - |
четкое множество. |
|
П2-3. Нечеткие множества как проекции случайных множеств
С самого начала появления современной теории нечеткости в 1960-е годы началось обсуждение ее взаимоотношений с теорией вероятностей. Дело в том, что функция принадлежности нечеткого множества напоминает распределение вероятностей. Отличие только в том, что сумма вероятностей по всем возможным значениям случайной величины (или интеграл, если множество возможных значений несчетно) всегда равна 1, а сумма S значений функции принадлежности (в непрерывном случае - интеграл от функции принадлежности) может быть любым неотрицательным числом. Возникает искушение пронормировать функцию принадлежности, т.е. разделить все ее значения на S (при S ¹ 0), чтобы свести ее к распределению вероятностей (или к плотности вероятности). Однако специалисты по нечеткости справедливо возражают против такого "примитивного" сведения", поскольку оно проводится отдельно для каждой размытости (нечеткого множества), и определения обычных операций над нечеткими множествами с ним согласовать нельзя. Последнее утверждение означает следующее. Пусть указанным образом преобразованы функции принадлежности нечетких множеств А и В. Как при этом преобразуются функции принадлежности A I B, A U B, A + B, AB ? Установить это невозможно в принципе. Последнее утверждение становится совершенно ясным после рассмотрения нескольких примеров пар нечетких множеств с одними и теми же суммами значений функций принадлежности, но различными результатами теоретико- множественных операций над ними, причем и суммы значений соответствующих функций принадлежности для этих результатов теоретико-множественных операций, например, для пересечений множеств, также различны.
В работах по нечетким множествам довольно часто утверждается, что теория нечеткости является самостоятельным разделом прикладной математики и не имеет отношения к теории вероятностей (см., например, обзор литературы в монографиях [1,2]). Авторы, сравнивавшие теорию нечеткости и теорию вероятностей, обычно подчеркивали различие между этими областями теоретических и прикладных исследований. Обычно сравнивают аксиоматику и сравнивают области приложений. Надо сразу отметить, что аргументы при втором типе сравнений не имеют доказательной силы, поскольку по поводу границ применимости даже такой давно выделившейся научной области, как вероятностно-статистические методы, имеются различные мнения. Напомним, что итог рассуждений одного из наиболее известных французских математиков Анри Лебега по поводу границ применимости арифметики таков: "Арифметика применима тогда, когда она применима" (см. его монографию [3, с.21-22]).
При сравнении различных аксиоматик теории нечеткости и теории вероятностей нетрудно увидеть, что списки аксиом различаются. Из этого, однако, отнюдь не следует, что между указанными теориями нельзя установить связь, типа известного сведения евклидовой геометрии на плоскости к арифметике (точнее к теории числовой системы R 2 - см., например, монографию [4]). Напомним, что эти две аксиоматики - евклидовой геометрии и арифметики - на первый взгляд весьма сильно различаются.
Можно понять желание энтузиастов нового направления подчеркнуть принципиальную новизну своего научного аппарата. Однако не менее важно установить связи нового подхода с ранее известными.
Как оказалось, теория нечетких множеств тесно связана с теорией случайных множеств. Еще в 1974 г. в работе [5] было показано, что нечеткие множества естественно рассматривать как "проекции" случайных множеств. Рассмотрим этот метод сведения теории нечетких множеств к теории случайных множеств.
Определение 2. Пусть A = A(ω ) - случайное подмножество конечного множества У. Нечеткое множество В, определенное на У, называется проекцией А и обозначается Proj A, если
μ B ( y) = P( y A) (7)
при всех y Y .
Очевидно, каждому случайному множеству А можно поставить в соответствие с помощью формулы (7) нечеткое множество В = Proj A. Оказывается, верно и обратное.
Теорема 3. Для любого нечеткого подмножества В конечного множества У существует случайное подмножество А множества У такое, что В = Proj A.
Доказательство. Достаточно задать распределение случайного множества А. Пусть У1 - носитель В (см. определение 1 выше). Без ограничения общности можно считать, что Y1 = {y1, y2 ,..., ym} при некотором m и элементы У1 занумерованы в таком порядке, что
0 < μB ( y1) ≤ μB ( y2 ) ≤ ... ≤ μB ( ym ).
Введем множества
Y (1) = Y1 ,Y (2) = {y2 ,..., ym },...,Y (t) = {yt ,..., ym },...,Y (m) = {ym }.
Положим
P( A = Y (1)) = μ B ( y1 ), P( A = Y (2)) = μ B ( y2 ) − μ B ( y1 ),...,
P( A = Y (t)) = μB ( yt ) − μB ( yt −1 ),..., P( A = Y (m)) = μB ( ym ) − μB ( ym−1 ), P( A = ) = 1 − μ B ( ym ).
Для всех остальных подмножеств Х множества У положим Р(А=Х)=0. Поскольку элемент
yt входит во множества Y(1), Y(2),…, Y(t) и не входит во множества |
Y(t+1),…, Y(m), то из |
приведенных выше формул следует, что P( yt A) = μ B ( yt ). Если |
y Y1 , то, очевидно, |
P( y A) = 0. Теорема 3 доказана. |
|
Распределение случайного множества с независимыми элементами, как следует из рассмотрений главы 8, полностью определяется его проекцией. Для конечного случайного множества общего вида это не так. Для уточнения сказанного понадобится следующая теорема.
Теорема 4. Для случайного подмножества А множества У из конечного числа элементов наборы чисел P( A = X ), X Y , и P( X A), X Y , выражаются один через другой.
Доказательство. Второй набор выражается через первый следующим образом:
P( X Í A) = ∑P( A = X ').
X ':X Í X '
Элементы первого набора выразить через второй можно с помощью формулы включений и исключений из формальной логики, в соответствии с которой
P( A = X ) = P( X Í A) - ∑P( X U{y} Í A) + ∑P( X U{y1 , y2 } Í A) - ... ± P(Y Í A). В этой формуле в первой сумме у пробегает все элементы множества Y\X, во второй сумме переменные суммирования у1 и у2 не совпадают и также пробегают это множество, и т.д. Ссылка на формулу включений и исключений завершает доказательство теоремы 4.
В соответствии с теоремой 4 случайное множество А можно характеризовать не
только распределением, |
но и |
набором чисел |
P( X A), X Y . В этом наборе |
|
P( A) = 1, а других |
связей |
типа |
равенств |
нет. В этот набор входят числа |
P({y} A) = P( y A), следовательно, |
фиксация |
проекции случайного множества |
||
эквивалентна фиксации k = Card(Y) параметров из (2k-1) параметров, задающих распределение случайного множества А в общем случае.
Будет полезна следующая теорема.
Теорема 5. Если Proj A = B, то Pr oj A = B.
Для доказательства достаточно воспользоваться тождеством из теории случайных множеств P( A = X ) = P( A = X ), формулой для вероятности накрытия P( y A) из главы 8, определением отрицания нечеткого множества и тем, что сумма всех P(A=X) равна 1.
П2-4. Пересечения и произведения нечетких и случайных множеств
Выясним, как операции над случайными множествами соотносятся с операциями над их проекциями. В силу законов де Моргана (теорема 1) и теоремы 5 достаточно рассмотреть операцию пересечения случайных множеств.
Теорема 6. Если случайные подмножества А1 и А2 конечного множества У
независимы, то нечеткое множество Pr oj( A1 Ç A2 ) является |
|
произведением нечетких |
||
множеств Proj A1 и Proj A2 . |
|
|
|
|
Доказательство. Надо показать, что для любого y Y |
|
|
||
P( y Î A1 Ç A2 ) = P( y Î A1 )P( y Î A2 ). |
(8) |
|||
По формуле для вероятности накрытия точки случайным множеством (глава 8) |
||||
P ( y Î A1 Ç A2 ) |
= |
∑P (( A1 Ç A2 ) = X ). |
|
(9) |
|
X : yÎ X |
|
|
|
Как известно, распределение пересечения случайных множеств |
|
A1 Ç A2 можно выразить |
||
через их совместное распределение следующим образом: |
|
|
||
P( A1 Ç A2 = X ) = |
∑ |
P( A1 = X 1 , A2 = X 2 ). |
(10) |
|
X1 , X 2 :X1 Ç X 2 =X |
|
|
||
Из соотношений (9) и (10) следует, что вероятность накрытия для пересечения случайных множеств можно представить в виде двойной суммы
P(yÎA ÇA ) = |
∑ |
∑ |
P(A = X ,A = X ). |
(11) |
1 2 |
1 1 2 2 |
|
X:yÎX X1,X2:X1ÇX2 =X
