
Добавил:
nickop
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз:
Предмет:
Файл:ТПР ПОДГОТОВКА К ЗАЧЕТУ
.txt Корреляция - взаимосвязь, соотношение
пп - прогнозир п-р
п - признак
сигма кв - дисперсия - мера разброса значений случайной величины относительно её мат ожид
М мат ожид - средн значение случ величины
сигма - средн квадратичн отклонение случ величины (корень сигма кв)
мода - самое вероятное значение случ велич, частое
-------------
Эвристич алг класифик прогнозир:
-------------
n(решK1) и n(решK2) - общие числа реш об отнес
n(решK1/K1) и n(решK2/K2) - верн реш отнес к фактически принадлеж к К1 и К2
n(решK1/K2) - ошибочн реш отнес К2 к К1 (n(K2/решK1)) (негодн к годн - потребитель)
n(решK2/K1) - ошибочн реш отнес К1 к К2 (n(K1/решK2)) (годн к негодн - изготовитель)
P(K1) и P(K2) - априорные вероятности оказаться годн любого наугад
P(решK1) и P(решK2) - априорные вероятности реш об отнес к К1 и К2
P(решK1/K2) и P(решK2/K1) - вероятности принятия ошиб реш К2 к К1 и К1 к К2
К1 при Уш < Ушкл a < aгр годн
К2 при Уш > Ушкл a > aгр негодн
-------------
Метод теор статист оценок (метод оптимал оценив)
-------------
количественная мера точности прогнозирования - дисперсия ошибки в оценке пп
дисп усл плотн < дисп безусловн плотн
чем сильнее зависимость между кажд из случ велич и пп (и чем меньше п зависимы между собой), тем существенее различие между усл (одномерной) и безусл плотностями
оптимальн оценка y_opt - мода (при нем плотность максимальна) - имеет наименьшую дисперсию ошибки по сравнению с мат ожид и медианой
для определ точности прогнозирования необх выявить степень рассеивания оценки y_opt относит факт y
ошибка вычисл по безусл пл имеет большую дисп
чем больше п с пп корелированы, тем меньше дисперс условн плотности (ошибки прогнозир)
задача индивидуал прогнозир относит легко реш аналитически если многомерн плотности распредел подчин норм закону (в норм распредел мода = мат ожид)
условн мат ожид пп зависит от принятого значения п
условн дисперс не зависит от п и определяется степенью корреляции между п и пп
чем больше дисп пп, тем больше дисп ошибки при том же r
если r = 0, дисперс ошибки прогн = дисперсии пп
если |r| = 1, дисперс ошибки прогн = 0 при любой дисперсии пп
Чем больше |r|, тем сильнее проявл влияние п на оценку (на моду)
многомерная совместная плотность распределения значений признаков - определяет степень зависимости п и пп
если пп с каждым из п независим, то прогнозирование безсмысленно, и многомерная совместная плотность распределения превращается в:
одномерн плотность распредел значений плотности пп W(y) * совместн плотность распредел п W(x1...xk)
-------------
Алгоритм оптимал класификации
-------------
y >= yгр - годн K1
y < yгр - негодн K2
xj <= Xкл, то xj к К1
xj > Xкл, то xj к К2
Хкл - порогов знач призн
степень связи между класом и призн экз определ видом совместн усл плотн
критерий оптимал - минимум средн риска (критерий Байеса)
средн риск минимален когда отношение правдоподобия (T) > П (порог знач правдоподобия, не завис от знач призн)
T >= П - экз в К1
T < П - экз в К2
если К = 1 (класифик по 1му призн) то можн класифик по Хкл самого признака (Т(Хкл) = П)
W(y/решК1) - условн плотн распредел пп при y >= yгр и х <= Хкл (экз относ к К1)
W(y/решК2) - условн плотн распредел пп при y < yгр и х > Хкл (экз относ к К2)
W(х/К1) - условн плотн распредел п при экз принадлеж К1
W(х/К2) - условн плотн распредел п при экз принадлеж К2
I - K1K1 (true годн к годн)
II - K2K1 (негодн к годн - риск потребителя)
III - K1K2 (годн к негодн - риск изготовителя)
VI - K2K2 (true негодн к негодн)
пп - прогнозир п-р
п - признак
сигма кв - дисперсия - мера разброса значений случайной величины относительно её мат ожид
М мат ожид - средн значение случ величины
сигма - средн квадратичн отклонение случ величины (корень сигма кв)
мода - самое вероятное значение случ велич, частое
-------------
Эвристич алг класифик прогнозир:
-------------
n(решK1) и n(решK2) - общие числа реш об отнес
n(решK1/K1) и n(решK2/K2) - верн реш отнес к фактически принадлеж к К1 и К2
n(решK1/K2) - ошибочн реш отнес К2 к К1 (n(K2/решK1)) (негодн к годн - потребитель)
n(решK2/K1) - ошибочн реш отнес К1 к К2 (n(K1/решK2)) (годн к негодн - изготовитель)
P(K1) и P(K2) - априорные вероятности оказаться годн любого наугад
P(решK1) и P(решK2) - априорные вероятности реш об отнес к К1 и К2
P(решK1/K2) и P(решK2/K1) - вероятности принятия ошиб реш К2 к К1 и К1 к К2
К1 при Уш < Ушкл a < aгр годн
К2 при Уш > Ушкл a > aгр негодн
-------------
Метод теор статист оценок (метод оптимал оценив)
-------------
количественная мера точности прогнозирования - дисперсия ошибки в оценке пп
дисп усл плотн < дисп безусловн плотн
чем сильнее зависимость между кажд из случ велич и пп (и чем меньше п зависимы между собой), тем существенее различие между усл (одномерной) и безусл плотностями
оптимальн оценка y_opt - мода (при нем плотность максимальна) - имеет наименьшую дисперсию ошибки по сравнению с мат ожид и медианой
для определ точности прогнозирования необх выявить степень рассеивания оценки y_opt относит факт y
ошибка вычисл по безусл пл имеет большую дисп
чем больше п с пп корелированы, тем меньше дисперс условн плотности (ошибки прогнозир)
задача индивидуал прогнозир относит легко реш аналитически если многомерн плотности распредел подчин норм закону (в норм распредел мода = мат ожид)
условн мат ожид пп зависит от принятого значения п
условн дисперс не зависит от п и определяется степенью корреляции между п и пп
чем больше дисп пп, тем больше дисп ошибки при том же r
если r = 0, дисперс ошибки прогн = дисперсии пп
если |r| = 1, дисперс ошибки прогн = 0 при любой дисперсии пп
Чем больше |r|, тем сильнее проявл влияние п на оценку (на моду)
многомерная совместная плотность распределения значений признаков - определяет степень зависимости п и пп
если пп с каждым из п независим, то прогнозирование безсмысленно, и многомерная совместная плотность распределения превращается в:
одномерн плотность распредел значений плотности пп W(y) * совместн плотность распредел п W(x1...xk)
-------------
Алгоритм оптимал класификации
-------------
y >= yгр - годн K1
y < yгр - негодн K2
xj <= Xкл, то xj к К1
xj > Xкл, то xj к К2
Хкл - порогов знач призн
степень связи между класом и призн экз определ видом совместн усл плотн
критерий оптимал - минимум средн риска (критерий Байеса)
средн риск минимален когда отношение правдоподобия (T) > П (порог знач правдоподобия, не завис от знач призн)
T >= П - экз в К1
T < П - экз в К2
если К = 1 (класифик по 1му призн) то можн класифик по Хкл самого признака (Т(Хкл) = П)
W(y/решК1) - условн плотн распредел пп при y >= yгр и х <= Хкл (экз относ к К1)
W(y/решК2) - условн плотн распредел пп при y < yгр и х > Хкл (экз относ к К2)
W(х/К1) - условн плотн распредел п при экз принадлеж К1
W(х/К2) - условн плотн распредел п при экз принадлеж К2
I - K1K1 (true годн к годн)
II - K2K1 (негодн к годн - риск потребителя)
III - K1K2 (годн к негодн - риск изготовителя)
VI - K2K2 (true негодн к негодн)