Оглавление.

Введение. Общие вопросы компьютерного распознавания и порождения речи.

1. Программирование звука в Windows.

2. Основы цифровой обработки звуковых сигналов.

3. Определение параметров речевого сигнала.

4. Алгоритмы распознавания.

5. Использование Microsoft Speech API 5.1 для синтеза и распознавания речи.

6. Использование Microsoft Speech API 4.0 для синтеза речи.

Ссылки.

Об авторе.

Компьютерное распознавание и порождение речи

Глава 2. Основы цифровой обработки звуковых сигналов.

Назад В начало главы Дальше

2.4. Соотношения между частотным доменом и доменом времени.

Произведением двух сигналов x1[n] и x2[n] называется сигнал y[n] такой, что для всех n y[n]= x1[n] x2[n], то есть сигнал, значение амплитуд которого в каждом отсчете равно произведению амплитуд исходных сигналов в отсчетах с этим же номером. Умножению двух сигналов в частотном домене соответствует их свертка в домене времени. И наоборот: свертке двух сигналов в частотном домене соответствует их умножение в домене времени. То есть, если сигналу x1[n] в домене времени соответствует X1[m] в частотном домене, а сигналу x2[n] – X2[m], то сигналу y[n]= x1[n] x2[n] в домене времени будет соответствовать Y[m]= X1[m]* X2[m] (здесь и далее под звездочкой подразумевается свертка), а сигналу y[n]= x1[n] *x2[n] будет соответствовать Y[m]= X1[m]X2[m] в частотном домене.


Распознавание речи. Обработка текстов на естественном языке.
Hosted by uCoz