Оглавление.

Введение. Общие вопросы компьютерного распознавания и порождения речи.

1. Программирование звука в Windows.

2. Основы цифровой обработки звуковых сигналов.

3. Определение параметров речевого сигнала.

4. Алгоритмы распознавания.

5. Использование Microsoft Speech API 5.1 для синтеза и распознавания речи.

6. Использование Microsoft Speech API 4.0 для синтеза речи.

Ссылки.

Об авторе.

Компьютерное распознавание и порождение речи

Глава 3. Определение параметров речевого сигнала.

В начало главы Дальше

Имея цифровое представление речевого сигнала, мы можем задуматься о метриках, то есть параметрах этого сигнала, с помощью которых программа может распознавать звуки, слова и предложения приблизительно с тем же результатом, который дают здоровый слуховой аппарат и здоровый мозг человека. То есть нам нужны параметры, которые позволяют:

  1. отделить речь от промежутков “молчания”,
  2. определить конкретный звук и сложить из звуков слова,
  3. определить начало и конец фразы, предложения и их характер (повествование, вопрос).
  4. определить особенности речи диктора.
Параметры речевого сигнала, как правило, быстро меняются в течение времени, поэтому принято снимать их на отрезке звукового сигнала 10-20 мс, считая что сигнал на таком отрезке примерно стационарен (постоянен).

Основные параметры речевого сигнала таковы:


Распознавание речи. Обработка текстов на естественном языке.
Hosted by uCoz