Оглавление.Введение. Общие вопросы компьютерного распознавания и порождения речи.1. Программирование звука в Windows. 2. Основы цифровой обработки звуковых сигналов. 3. Определение параметров речевого сигнала. 4. Алгоритмы распознавания. 5. Использование Microsoft Speech API 5.1 для синтеза и распознавания речи. 6. Использование Microsoft Speech API 4.0 для синтеза речи. Ссылки. Об авторе. |
Компьютерное распознавание и порождение речиГлава 3. Определение параметров речевого сигнала.
3.4. Коэффициенты линейного предсказания.Суть линейного предсказания в нахождении коэффициентов ak (k=1..p) для формулы:
Фактически, имея некоторый сигнал, мы имеем статистическую выборку которую можно представить в виде таблицы:
То есть нахождение коэффициентов линейного предсказания сводится к вычислению коэффициентов линейной регрессии для данной статистической выборки и мы можем пользоваться методами математической статистики. Минимизируем сумму квадратов ошибок для каждого из вычисляемых отсчетов.
А минимизируемая функция равна
Продифференцируем E по ak и приравняем частные производные нулю для нахождения экстремума:
Заменив для удобства восприятия j на i, а k на j получим систему p линейных уравнений c p неизвестными :
где
Эта система называется системой уравнений Юла-Уокера. Погрешность найденных коэффициентов оценивается как:
Есть два основных подхода для решения системы уравнений Юла-Уокера. |