Решение задачи 1, распознавание

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Донецкий национальный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Lections_raspozn.docx

Скачиваний:

Добавлен:

01.07.2025

Размер:

595.66 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 1613 14 15 16 > Следующая >>>

Решение задачи 1, распознавание

Наиболее простое решение состоит в том, чтобы посчитать вероятность появления последовательности наблюдений для каждой возможной последовательности состояний модели, а затем сложить эти вероятности. Пусть Q={Q₁,Q₂,…Q_s}- множество всех возможных последовательностей состояний той же длины, что последовательность O. Их число будет равно S=N^τ -1, где N – число состояний, τ – длина последовательности. Пусть i-я последовательность Q_i представляет ряд состояний {q_i1,q_i2,…,q_iτ}. Тогда для i-й последовательности состояний вероятность появления последовательности наблюдений O равна:

	τ		τ
P(O\|Q_i,λ)=	∏	P(o_j\|q_ij,λ)=	∏	b_qij(o_j)
	j=1		j=1

Вероятность же появления самой i-й последовательности состояний равна

	τ
P(Q_i\|λ)=π_qi1	∏	a[q_i,j-1,q_i,j]
	j=2

По определению скрытой Марковской модели вероятности наблюдения в каждом из состояний зависит только от самого состояния и не зависит от предыдущих состояний. Поэтому вероятность появления указанной последовательности наблюдений O для нашей модели можно рассчитать так:

	N^τ-1		N^τ-1		τ
P(O\|λ)=	∑	P(O\|Q_i,λ) P(Q_i\|λ)=	∑	(π_qi1 b_qi1(o₁)	∏	a[q_i,j-1,q_i,j] b_qij(o_j))
	i=1		i=1		j=2

Очевидно, что нам потребуется (2τ -1) N^τ умножений и N^τ -1 сложений, что уже для N=10 состояний и длины последовательности наблюдений τ=10 дает число вычислений, равное 19*10¹⁰+10¹⁰-1=2*10¹¹-1. Это очень много. К счастью, существуют более эффективные алгоритмы решения этой задачи. Наиболее известны два – алгоритм прямого хода и алгоритм обратного хода.

Алгоритм прямого хода.

Вводится переменная α_t(i) – вероятность того, что к моменту времени t система будет находиться в i-м состоянии, а последовательность порожденных ею до этого момента наблюдений равна о₁,о₂,…,o_t.

Алгоритм следующий.

1 шаг. Для всех i от 1 до N

α₀(i)=π_i b_i(o₁)

2 шаг. Для всех t от 1 до τ и для всех j от 1 до N

	N
α_t(j) =[	∑	α_t-1(i)a_ij] b_j(o_t)
	i=1

3 шаг.

	N
P(O\|λ)=	∑	α_t(i)
	i=1

Алгоритм обратного хода.

Вводится переменная τ_t(i) – вероятность того, что к моменту времени t система будет находиться в i-м состоянии, а последовательность порожденных ею после этого наблюдений равна о_t+1, о_t+2,…o_τ-1,o_τ

Алгоритм следующий.

1 шаг. Для всех i от 1 до N

β_τ(i)=1

2 шаг. Для всех t, идущих в обратном порядке от τ-1 до 1 и для всех i от 1 до N

	N
β_τ(i)=	∑	a_ij b_j(o_t+1) β_τ+1(j)
	j=1

3 шаг.

	N
P(O\|λ)=	∑	π_i b_i(o₁) β₁(i)
	i=1

Для осуществления распознавания на основе скрытых моделей Маркова необходимо построить кодовую книгу, содержащую множество эталонных наборов для характерных признаков речи (например, коэффициентов линейного предсказания, распределения энергии по частотам и т.д.). Для этого записываются эталонные речевые фрагменты, разбиваются на элементарные составляющие (отрезки речи, в течении которых можно считать параметры речевого сигнала постоянными) и для каждого из них вычисляются значения характерных признаков. Одной элементарной составляющей будет соответствовать один набор признаков из множества наборов признаков словаря.

На рисунке каждая запись кодовой книги относится к одному набору, каждое поле записи – содержит значение одного признака.

Построив кодовую книгу, мы должны настроить модель распознавания. Одна скрытая модель Маркова λ={A,B,π} ставится в соответствие некоторой распознаваемой единице речи, как правило, слову.

Фрагмент речи разбивается на отрезки, в течении которых параметры речи можно считать постоянными. Для каждого отрезка вычисляются характерные признаки и подбирается запись кодовой книги с наиболее подходящими характеристиками. Номера этих записей и образуют последовательность наблюдений O={o₁,o₂,…o_τ} для модели Маркова. Каждому слову словаря соответствует одна такая последовательность. Далее A – матрица вероятностей переходов из одного минимального отрезка речи (номера записи кодовой книги) в другой минимальный отрезок речи (номер записи кодовой книги). В – вероятности выпадения в каждом состоянии конкретного номера кодовой книги. В нашем случае ?i=1 при i=0, ?i=0 при i>0.

На этапе настройки моделей Маркова мы применяем алгоритм Баума-Уэлча для имеющегося словаря и сопоставления каждому из его слов матрицы A и B.

При распознавании мы разбиваем речь на отрезки, для каждого вычисляем набор номеров кодовой страницы и применяем алгоритм прямого или обратного хода для вычисления вероятности соответствия данного звукового фрагмента определенному слову словаря. Если вероятность превышает некоторое пороговое значение – слово считается распознанным.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 1613 14 15 16 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
14.11.20198.96 Mб23Latinin_S.M._Vishcha_matem._Navch.-metod._rek.2...doc
#
11.09.2019139.26 Кб3Lat_-amer_lektsia.doc
#
13.04.2015691.88 Кб37Lavrik_Osnovi_zhurnalistiki.pdf
#
13.07.2019384.51 Кб11Lec7_end.doc
#
18.11.2019732.16 Кб11lections for students.doc
#
01.07.2025595.66 Кб0Lections_raspozn.docx
#
09.08.2019197.91 Кб12lecture 2.rtf
#
23.08.201926.81 Кб2Lecture 4 (14.03.12 - 21.03.12).docx
#
20.08.2019220.09 Кб14LECTURE_5.rtf
#
24.08.20194.27 Mб5lecture_6.rtf
#
13.04.2015324.1 Кб17Lekcii_po_istorii_zarubezhnoj_literatury-182.doc