- •Решение:
- •Итерация 2:
- •Итерация 3:
- •Решение:
- •Найдем третий центр. В качестве с3 выберем тот элемент Zj, который находится на наибольшем расстоянии от ближайшего из центров.
- •Задание 4. Постройте дендрограмму, соответствующую исходным данным Задания 2. Сделайте чертеж.
- •Решение:
- •Список использованной литературы
Задание 4. Постройте дендрограмму, соответствующую исходным данным Задания 2. Сделайте чертеж.
Данную дендрограмму, я строила в программе Statistica:

С данными, указанными выше на рисунке, я получила следующую дендрограмму:

Задание 5. Для заданных значений параметров нормальных законов распределения (m1, σ1) и (m2, σ2), характеризующих два класса объектов наблюдения С1 и С2:
|
Вариант |
m1 |
σ1 |
m2 |
σ2 |
p1 |
p2 |
|
5 |
--3 |
1 |
--1 |
0.5 |
0.9 |
0.1 |
1)определите условные по классу плотности вероятности результатов наблюдений
![]()
2) постройте решающее правило по критерию максимального правдоподобия;
3) рассчитайте теоретические величины вероятностей ошибок распознавания первого и второго рода по этому критерию;
4) для заданных значений априорных вероятностей p1 и p2 появления классов С1 и С2 определите условные плотности полной вероятности результатов наблюдений и апостериорные вероятности классов С1 и С2;
5) постройте решающее правило по критерию максимальной апостериорной вероятности;
6) рассчитайте теоретические величины вероятностей ошибок распознавания первого и второго рода;
7) сравните эффективности решающих правил, построенных по критериям максимального правдоподобия и максимальной апостериорной вероятности.
Решение:
-
Исходные данные: число классов объектов – 2, закон распределения признаков объектов – нормальный. Параметры распределения (математическое ожидание m и среднеквадратическое отклонение σ):
m1=-3; σ1=1 (класс 1); m2=--1; σ2=0.5 (класс 2);
-
Для построения графиков условных по классу ак(к=1,2) плотностей вероятности признаков х:

Определим пользовательскую функцию трех аргументов:
![]()
Сформируем массив
N
точек N=200,
по оси Ох, располагающихся с равным
шагом в диапазоне [xmin,xmax].
Верхнюю xmax
и верхнюю
xmin
границы диапазона определим по правилу
«трех сигм», согласно которому случайная
величина х, распределенная по нормальному
закону, находится на интервале значений
m
3
σ
с вероятностью более 0,997. Считаем, что
случайные значения параметра х будут
лежать в диапазоне [x1min,
x1max],
если наблюдается класс 1
,
и в диапазоне [x2min,
x2max],
если наблюдается класс 2
,
где
x1min=m1-3*σ1=3-3=0, x1max=m1+3*σ1=3+3=6
x2min=m2-3*σ2=1-1.5=-0.5, x2max=m2+3*σ2=1+1.5=2.5
Определим нижнюю и верхнюю границы значений параметра х:
xmin:=min(x1min,x2min);
xmax:=max(x1max,x2max).
Для заданных данных xmin=-0.5, xmax=6.
Разделим интервал [xmin,xmax] на (N-1) часть и определим координаты точек разделения:
![]()
Сформируем массивы
значений условных по классу плотностей
вероятности
,
соответствующие точкам xi:
fx1i:=f(xi,m1,σ1), fx2i:=f(xi,m2,σ2).
Построим графики условных плотностей вероятности

-
Для определения порогов принятия решения по критерию максимального правдоподобия, нужно решить уравнение:

Отсюда
.
Обозначим:
![]()
![]()
d1=1, d2=0.25, a=0.75, b=-0.5, c=2.35
Вычислим пороги принятия решения xg1 и xg2, xg1< xg2^
![]()
Получим: xg1=2.07 xg2=1.41
-
Изобразим на графике полученные границы раздела между классами xg1 и xg2. Если какой-либо из порогов лежит в областях маловероятных значений параметра х для всего множества классов
,
то следует переопределить нижнюю и
(или) верхнюю границы х. -
Для оценки эффективности решающего правила, рассчитаем теоретические величины вероятностей ошибок распознавания.
Вероятность отнести наблюдаемый признак к классу а1, когда он в действительности принадлежит классу а2:
.
Вероятность принятия решения в пользу класса а2, когда в действительности наблюдается класс а1:
![]()
Получим Р21=0,056 и Р12= 0,127
Вероятность правильного распознавания определим как:
P:=1-0.5*(P21+P12)
Получим Р=0,908

-
Для построения решающего правила по критерию максимальной апостериорной вероятности зададим априорные вероятности р1 и р2 появления классов а1 и а2, р1+р2=1:
р1:=0,9. р2:=0,1
-
По алгоритму, построим в интервале [xmin, xmax] график плотностей полных вероятностей появления класса а1 и а2.
fx1i=p1*f(xi,m1,σ1), fx2i=p2*f(xi,m2,σ2), и график апостериорных вероятностей классов а1 и а2.
![]()
![]()
![]()


-
Для определения порогов принятия решения о классе объекта по критерию максимальной апостериорной вероятности, решим квадратное уравнение:

Приведем его к виду:
x2(σ22-
σ12)+x(2m2
σ12-2m2
σ12)+m12
σ12-
m22
σ22-2
σ12
σ22Ln(
)=0.
Обозначим:
d1=
σ12,
d2= σ22,
a=d2-d1, b=2*m2*d1-2*m1*d2, c=m12*d2-m22*d1-2*d1*d2*ln(
)
d1=1, d2=0.25, a=0.75, b=0.5, c=0.5
Вычислим пороги принятия решения xg1 и xg2, xg1<xg2:
![]()
Получим xg1=0,41 xg2=-1,08
-
Для визуализации границ раздела между классами, переопределим границы области признака x: xmin, xmax.

-
Рассчитываем теоретические вероятности ошибок распознавания первого и второго рода:
.
![]()
Получим: Р21=0,035 и Р12=0,115
Вероятность
правильного распознавания для случая,
когда априорные вероятности классов
известны и р1
р2
0,5:
Р:=1(-р1*Р12+р2*Р21)
Р:=0,893
-
На основании полученных теоретических оценок вероятностей правильного распознавания можно сделать следующие выводы:
-
если сведения об априорных вероятностях классов отсутствуют, то это равносильно предположению о равных вероятностях появления классов:
![]()
где
-априорная
вероятность класса ai;
K-количество
классов;
-
случай,
когда априорные вероятности классов
одинаковы, является наихудшим для
статистического (при прочих равных
условиях).
