Оглавление.Введение. Общие вопросы компьютерного распознавания и порождения речи.1. Программирование звука в Windows. 2. Основы цифровой обработки звуковых сигналов. 3. Определение параметров речевого сигнала. 4. Алгоритмы распознавания. 5. Использование Microsoft Speech API 5.1 для синтеза и распознавания речи. 6. Использование Microsoft Speech API 4.0 для синтеза речи. Ссылки. Об авторе. |
Компьютерное распознавание и порождение речиГлава 3. Определение параметров речевого сигнала.
Подход 2. Автокорелляционный метод. Изменим пределы суммирования в исходном выражении для cij :
Если далее мы разделим выражение для cij на N, то получим функцию автокорреляции R(?), вычисленную для τ=|i-j|
где j=1..p. В матричном виде система уравнений Юла-Уокера примет вид:
где A – вектор коэффициентов ai , С – вектор значений R(i),
Матрица R симметрична относительно главной диагонали и является матрицей Теплица, то есть каждая строка получается из предыдущей сдвигом вправо на одну позицию. Для подобных матриц система линейных уравнений может быть решена по более простому по сравнению с классическими методом Левинсона-Дарбина, алгоритм которого требует порядка p2 операций ( то есть значительно быстрее классических, применяемых при ковариационном методе).
1. Начальные условия:
2. Для l=1 по p цикл l-1 2.1. k[l] = (?a[i]R[l-1]-R[l])/E i=1 2.2. a[l] = -k[l] 2.3. Для j=1 по l-1 цикл 2.3.1. a[j]=a[j]+k[l]a[l-j] 2.4. E=E(1-k[l]2) На выходе алгоритма получаем оценку ошибки E и вектор коэффициентов линейного предсказания a[i].
//Функция вычисляет коэффициенты линейного предсказания для сигнала х длиной
|