Оглавление.

Введение. Общие вопросы компьютерного распознавания и порождения речи.

1. Программирование звука в Windows.

2. Основы цифровой обработки звуковых сигналов.

3. Определение параметров речевого сигнала.

4. Алгоритмы распознавания.

5. Использование Microsoft Speech API 5.1 для синтеза и распознавания речи.

6. Использование Microsoft Speech API 4.0 для синтеза речи.

Ссылки.

Об авторе.

Компьютерное распознавание и порождение речи

Глава 4. Алгоритмы распознавания.

Назад В начало главы Дальше

Решение задачи 3. Алгоритм Баума-Уэлча.

Необходимо подобрать параметры скрытой модели Маркова так, чтобы максимизировать вероятность данной последовательности наблюдений.
Вводятся переменные

ξt(i,j) = P(qt=Si,qt+1=Sj|O,λ)

которые показывают вероятность того, что при заданной последовательности наблюдений O система в моменты времени t и t+1 будет находиться соответственно в состояниях Si и Sj. Используя прямую и обратную переменные запишем:

αt(i)aijbj(ot+1t+1(j)αt(i)aijbj(ot+1t+1(j)
ξt(i,j)=____________________=________________________
P(O|λ)
αt(i)aijbj(ot+1t+1(j)
NN

Введем переменные вероятности того, что при заданной последовательности наблюдений O система в момент времени t будет находиться в состоянии Si:

N
γt(i)=ξt(i,j)
j=1

При этом мы можем вычислить ожидаемое число переходов из состояния Si: равно

T-1
γt(i)
t=1

а ожидаемое число переходов из состояния Si в состояние Sj:
T-1
ξt(i,j)
t=1

Исходя из этого можно получить формулы для переоценки параметров модели Маркова:

π*it(i)

T-1
ξt(i,j)
t=1
a*ij=_________________
T-1
γt(i)
t=1

T-1
γt(j)
t=1,ot=k
b*ij(k)=_________________
T-1
γt(j)
t=1

Выражение
T-1
γt(j)
t=1,ot=k

в формуле для b*ij (k) означает что суммируются только те γt(j) , для которых значение состояния равно k, то есть Ot = k.
После переоценки параметры модели либо выясняется, что она уже была оптимальной до переоценки либо обязательно улучшаются ее параметры (то есть правдоподобность модели после переоценки выше, чем до переоценки во всех случаях, когда модель можно оптимизировать).


Распознавание речи. Обработка текстов на естественном языке.
Hosted by uCoz