ТПР ПОДГОТОВКА К ЗАЧЕТУ

.txt

Скачиваний:

Добавлен:

11.05.2020

Размер:

6.01 Кб

Скачать

☆

Корреляция - взаимосвязь, соотношение

пп - прогнозир п-р
п - признак

сигма кв - дисперсия - мера разброса значений случайной величины относительно её мат ожид
М мат ожид - средн значение случ величины
сигма - средн квадратичн отклонение случ величины (корень сигма кв)
мода - самое вероятное значение случ велич, частое

-------------
Эвристич алг класифик прогнозир:
-------------

n(решK1) и n(решK2) - общие числа реш об отнес
n(решK1/K1) и n(решK2/K2) - верн реш отнес к фактически принадлеж к К1 и К2
n(решK1/K2) - ошибочн реш отнес К2 к К1 (n(K2/решK1)) (негодн к годн - потребитель)
n(решK2/K1) - ошибочн реш отнес К1 к К2 (n(K1/решK2)) (годн к негодн - изготовитель)

P(K1) и P(K2) - априорные вероятности оказаться годн любого наугад
P(решK1) и P(решK2) - априорные вероятности реш об отнес к К1 и К2
P(решK1/K2) и P(решK2/K1) - вероятности принятия ошиб реш К2 к К1 и К1 к К2

К1 при Уш < Ушкл a < aгр годн
К2 при Уш > Ушкл a > aгр негодн

-------------
Метод теор статист оценок (метод оптимал оценив)
-------------

количественная мера точности прогнозирования - дисперсия ошибки в оценке пп

дисп усл плотн < дисп безусловн плотн

чем сильнее зависимость между кажд из случ велич и пп (и чем меньше п зависимы между собой), тем существенее различие между усл (одномерной) и безусл плотностями

оптимальн оценка y_opt - мода (при нем плотность максимальна) - имеет наименьшую дисперсию ошибки по сравнению с мат ожид и медианой

для определ точности прогнозирования необх выявить степень рассеивания оценки y_opt относит факт y

ошибка вычисл по безусл пл имеет большую дисп

чем больше п с пп корелированы, тем меньше дисперс условн плотности (ошибки прогнозир)

задача индивидуал прогнозир относит легко реш аналитически если многомерн плотности распредел подчин норм закону (в норм распредел мода = мат ожид)

условн мат ожид пп зависит от принятого значения п

условн дисперс не зависит от п и определяется степенью корреляции между п и пп

чем больше дисп пп, тем больше дисп ошибки при том же r
если r = 0, дисперс ошибки прогн = дисперсии пп
если |r| = 1, дисперс ошибки прогн = 0 при любой дисперсии пп

Чем больше |r|, тем сильнее проявл влияние п на оценку (на моду)

многомерная совместная плотность распределения значений признаков - определяет степень зависимости п и пп

если пп с каждым из п независим, то прогнозирование безсмысленно, и многомерная совместная плотность распределения превращается в:
одномерн плотность распредел значений плотности пп W(y) * совместн плотность распредел п W(x1...xk)

-------------
Алгоритм оптимал класификации
-------------

y >= yгр - годн K1
y < yгр - негодн K2

xj <= Xкл, то xj к К1
xj > Xкл, то xj к К2

Хкл - порогов знач призн

степень связи между класом и призн экз определ видом совместн усл плотн

критерий оптимал - минимум средн риска (критерий Байеса)

средн риск минимален когда отношение правдоподобия (T) > П (порог знач правдоподобия, не завис от знач призн)

T >= П - экз в К1
T < П - экз в К2
если К = 1 (класифик по 1му призн) то можн класифик по Хкл самого признака (Т(Хкл) = П)

W(y/решК1) - условн плотн распредел пп при y >= yгр и х <= Хкл (экз относ к К1)

W(y/решК2) - условн плотн распредел пп при y < yгр и х > Хкл (экз относ к К2)

W(х/К1) - условн плотн распредел п при экз принадлеж К1
W(х/К2) - условн плотн распредел п при экз принадлеж К2

I - K1K1 (true годн к годн)
II - K2K1 (негодн к годн - риск потребителя)
III - K1K2 (годн к негодн - риск изготовителя)
VI - K2K2 (true негодн к негодн)