ОГЛАВЛЕНИЕ
Стр.
Предисловие к русскому изданию 5
Предисловие 6
Введение 9
Цель книги 9
Речевой сигнал 9
Обработка сигналов 10
Цифровая обработка сигналов 11
Цифровая обработка речи 12
Цифровая передача и хранение речевого сигнала 14
Системы синтеза речи 15
Системы верификации и идентификации диктора 15
Системы распознавания речи 15
Устранение дефектов речи 15
Улучшение качества речевого сигнала 16
Заключение 16
Основы цифровой обработки сигналов 15
Введение 16
Сигналы и системы в дискретном времени 16
Описание преобразований сигналов и систем 19
Прямое и обратное г-преобразование 19
Преобразование Фурье 21
Дискретное преобразование Фурье 22
Основы цифровой фильтрации 24
Системы с конечными импульсными характеристиками 26
Системы с бесконечными импульсными характеристиками 27
Дискретизация 30
Теорема дискретизации 30
Прореживание и интерполяция днекретизированного сигнала 32
Заключение 37
Задачи 37
Цифровые модели речевых сигналов 41
Введение 41
Процесс образования речи 42
Механизм речеобразования 42
Акустическая фонетика 45
Акустическая теория речеобразования 59
Распространение звуков 59
Однородная труба без потерь (пример) 63
Потерн в голосовом тракте 66
Излучение через губы 71
Передаточная функция голосового тракта для гласных 74
Влияние носовой полости 77
Возбуждение звуков в голосовом тракте 78
Модели сигнала, основанные на акустической теории 82
Модели с трубами без потерь 83
Распространение звуковых волн в соединении труб без потерь 83
Граничные условия 86
Связь с цифровыми фильтрами 88
Передаточная функция модели с трубами без потерь 92
Цифровые модели речевых сигналов 97
Голосовой тракт 99
Излучение 101
Возбуждение 102
Полная модель 104
Заключение 105
Задачи 105
Методы обработки речевых сигналов во временной области 110
Введение 110
Текущая обработка речевых сигналов 110
Кратковременная энергия и кратковременное среднее значение сигнала 113
Кратковременная функция среднего числа переходов через нуль 119
Разделение речи и пауз на основе функции кратковременной энергии
и среднего числа переходов через нуль 123
Оценивание периода основного тона на основе параллельной обработки 128
Кратковременная автокорреляционная функция 133
Кратковременная функция среднего значения разности 141
Оценивание периода основного тона но автокорреляционной функции 143
Медианное сглаживание и обработка речи 150
Заключение 154
Приложение Сокращение объема вычислений при расчете автокорреляционной функции 154
Задачи 156
Цифровое представление речевых сигналов 160
Введение 160
Дискретизация речевых сигналов 161
Обзор статистических моделей речевых сигналов 162
Квантование мгновенных значений 166
Равномерное квантование 168
Мгновенное командирование 174
Оптимальное квантование 178
Адаптивное квантование 183
Адаптации по входному сигналу 185
Адаптация по выходному сигналу 190
Общие замечания 194
Общая теория разностного квантования 194
Дельта-модуляция 202
Линейная дельта-модуляция 202
Адаптивная дельта-модуляция 206
Предсказание высокого "порядка в дельта-модуляции 211
Разностная ИКМ 212
АРИКМ с адаптивным квантованием 213
АРИКМ с адаптивным предсказанием 215
Сравнение систем 220
Преобразования способов кодирования 222
Преобразование Л ДМ в ИКМ 223
Преобразование ИКМ—АРИКМ 225
Заключение 226
Задачи 226
Кратковременный анализ Фурье 231
Введение 231
Определения и свойства 232
Интерпретация преобразования Фурье 233
Интерпретация посредством линейной фильтрации 241
Частоты дискретизации Хп (е'«) по времени и частоте 244
Кратковременный синтез методом суммирования выходов гребенки фильтров 247
Кратковременный синтез методом суммирования с наложением 255
Влияние преобразований кратковременного спектра на синтез 256
Аддитивное преобразование 261
Обзор методов кратковременного анализа и синтеза речи 262
Проектирование гребенок цифровых фильтров 263
Соображения практического характера 263
Проектирование гребенок с БИХ-фильтрами 271
Проектирование гребенок с КИХ-фильтрами 273
Реализация метода суммирования выходов гребенки фильтров с помощью БПФ 281
Методы анализа 281
Методы синтеза 285
Спектрографическое отображение 289
Выделение основного тона 294
Анализ через синтез 297
Спектральный анализ, синхронный с основным тоном 297
Анализ полюсов и нулей модели с помощью анализа через синтез 300
Оценивание глоттальных колебаний, синхронное с основным тоном 301
Системы анализа-синтеза 302
Цифровое кодирование кратковременного преобразования Фурье 303
Фазовый вокодер 312
Полосный вокодер 319
Заключение 323
Задачи 323
Гомоморфная обработка речи 329
Введение 329
Гомоморфные относительно свертки системы 329
Свойства комплексного кепстра 333
Вычислительные аспекты 337
Комплексный кепстр речи 340
Оценивание основного тона 344
Оценивание формант 351
Гомоморфный вокодер 358
Заключение 363
Задачи 363
Кодирование речевых сигналов на основе линейного предсказании 365
Введение 365
Методы анализа на основе линейного предсказания 366
Автокорреляционный метод 370
Коварционный метод 372
Заключение 374
Вычисление коэффициента усиления модели 374
Решения уравнений линейного предсказания 377
Решение на основе разложения Холецкого для ковариационного метода 377
Алгоритм Дарбина для рекурсивного решения автокорреляционных уравнений 380
Постановка задачи и ее решение на основе лестничного фильтра 382
Сравнение методов решения уравнений линейного предсказания 386
Погрешность предсказания 390
Другие выражения для нормированного среднего квадрата погрешности предсказания 394
Экспериментальное определение погрешности предсказания 395
Зависимость нормированной погрешности предсказания от положения интервала анализа 399
Анализ линейного предсказания в частотной области 401
Спектральная трактовка среднего квадрата погрешности предсказания 402
Сравнение кратковременного спектрального анализа с оценкой спектра на основе линейного предсказания 405
Селективное линейное предсказание 406
Сравнение методов линейного предсказания с методами анализа через синтез 407
Применение анализа на основе линейного предсказания к моделям речевого тракта в виде труб без потерь 408
Соотношении между различными параметрами речи 410
Корни полинома передаточной функции предсказателя 410
Кепстр 411
Импульсная характеристика полюсной системы 411
Автокорреляционная функция импульсной характеристики 411
Коэффициенты автокорреляции полиномиальной передаточной функции предсказателя 412
Коэффициенты частной корреляции 412
Логарифм отношения площадей 413
Синтез речевого сигнала по параметрам линейного предсказания 413
Применение параметров линейного предсказания 416
Оценивание основного тона на основе коэффициентов линейного предсказания 416
Формантный анализ с использованием коэффициентов линейного предсказания 418
Вокодер на основе линейного предсказания 420
Полувокодер с линейным предсказанием 422
Заключение 424
Задачи 424
Цифровая обработка речи в системах речевого общения человека с машиной 429
Введение 429
Системы с речевым ответом 430
Основные аспекты построения систем с речевым ответом 431
Многоканальная цифровая система с речевым ответом 435
Система синтеза речи на основе последовательного объединения слов, закодированных формантами 436
Применение систем с речевым ответом 439
Системы распознавания-дикторов 442
Система верификации диктора 444
Система идентификации диктора 450
Системы распознавания речи 455
Система распознавания изолированных цифр 456
Система распознавания слитной последовательности цифр 459
Меры различимости в пространстве параметров линейного предсказания 464
Система распознавания с большим объемом словаря 466
Комбинированная система речевого общения с машиной 468
Заключение 469
Список литературы 472
Дополнительная литература 486
Предметный указатель 489