2.3 Алгоритм Вітербі

Алгоритм Вітербі — алгоритм пошуку найбільш відповідного списку станів (званого шляхом Вітербі), який в контексті ланцюгів Маркова отримує найбільш ймовірну послідовність подій, що відбулися.

Він є алгоритмом динамічного програмування. Алгоритм використовується в CDMA і GSM цифрового зв'язку, в модемах і космічних комунікаціях. Він знайшов застосування в розпізнаванні мови та письма, комп'ютерній лінгвістиці та біоінформатиці, а також в алгоритмі згорткового декодування Вітербі.

Алгоритм робить кілька припущень:

спостережувані і приховані події повинні бути послідовністю. Послідовність найчастіше впорядкована за часом;
дві послідовності повинні бути вирівняні: кожна спостережувана подія має відповідати рівно одній прихованій події;
обчислення найбільш вірогідної прихованої послідовності до моменту t повинно залежати тільки від спостережуваної події в момент часу t, і найбільш вірогідної послідовності до моменту t - 1.

Є набір спостережуваних величин (власне, звук) та ймовірнісна модель, які співвідносяться прихованому стану (фонеми) і спостережуваним величинам. Алгоритм Вітербі дозволяє відновити найбільш ймовірну послідовність прихованих станів.

Для реалізації алгоритму Вітербі необхідно вибрати послідовність станів Q = {q1, q2, ... qτ}, яка з найбільшою ймовірністю породжує зазначену послідовність.

Вводяться змінні:

(2.17)

δt (i) = max P (q_t = S_i| q₁q₂ ... q_t_-1, o₁o₂ ... o_t, λ),

тобто максимальну ймовірність того, що при заданних спостереженнях до моменту t послідовність станів завершиться в момент часу t в стані S_i, а також введемо змінну ψ_t (i) для зберігання аргументів, що максимізує δ_t (i).

Отже, алгоритм Вітербі:

1 крок. Для всіх i від 1 до N:

(2.18)

δ₁(i)=π_ib_i(o₁)

ψ₁(i)=0

2 крок. Для всіх j від 1 до N і t від 2 до T:

(2.19)

(2.20)

δ_t(j)=	max	\|δ_t-1(i)a_ij\|b_j(o_t)
	^i=1..N

ψ_t(j)=	arg max	\|δ_t-1(i)a_ij\|
	^i=1..N

(2.21)

(2.22)

крок. Отримуємо найбільшу ймовірність спостереження послідовності o₁o₂ ... o_T, яка досягається при проходженні якоїсь оптимальної послідовності станів Q* = {q*₁, q*₂, ... q*_T}, для якої на цей момент відомо тільки останній стан:

P^*=	max	\|δ_T(i)\|
	^i=1..N

q^*_T,=	arg max	\|δ_T(i)\|
	^i=1..N

4 крок. Відновлюємо оптимальну послідовність станів (зворотній прохід). Для всіх t від T-1 до 1 ( крок =-1):

(2.23)

^*_t = ψ_t+1(q^*_t+1)

Алгоритм Вітербі досить простий у реалізації (використовується динамічне програмування) і працює за час, пропорційний добутку кількості станів ПMM на число фреймів. Однак не завжди нам досить знати найвірогідніший шлях; наприклад, при тренуванні акустичної моделі потрібна оцінка ймовірності кожного стану на кожному фреймі. Для цього використовується алгоритм Forward-Backward.

Однак акустична модель - це всього лише одна зі складових системи. Що робити, якщо словник розпізнавання складається не з двох слів, як в розглянутому вище прикладі, а з сотень тисяч або навіть мільйонів? Багато хто з них будуть дуже схожі за вимовою або навіть збігатися. Разом з тим, при наявності контексту роль акустики падає: невиразно вимовлені, зашумлені або неоднозначні слова можна відновити «за змістом». Для обліку контексту знову-таки використовуються ймовірнісні моделі. Наявність фіксованого контексту задає розподіл ймовірностей для наступного слова, яке відображає як семантику, так і морфологію. Такий тип мовних моделей називається n-gram language models.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 2011 12 13 14 15 16 17 18 19 20 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.05.2025953.86 Кб0Диплом Н 3.doc
#
01.05.20251.38 Mб0ДИПЛОМ ПОДШИВ..doc
#
01.07.20253.34 Mб0Диплом Присняк 1.doc
#
17.03.20162.75 Mб42Диплом.doc
#
22.08.2019241.6 Кб9ДИПЛОМ.docx
#
01.07.2025690.8 Кб0ДИПЛОМНА "Ефективність застосування ПММ для поб...docx
#
01.04.20257.98 Mб1дипломна робота_18_30_30_01_13.doc
#
12.05.20151.9 Mб131дипломна.docx
#
10.11.2018257.02 Кб4дисертация.doc
#
10.11.2018686.08 Кб41Дискретка-методичка.doc
#
17.03.20163.51 Mб150Дискретна математика.pdf