
Рисунок 1 – Модель цифрового полосового вокодера
В модели полосового вокодера будем использовать 12 полос. Речевой сигнал поступает
на гребёнку полосовых фильтров.
К выходам полосовых фильтров подключены выпрямители (функция возведения в квадрат) и сглаживающие
фильтры НЧ. Тем самым получаем сигналы
Рисунок 2 – Участок модели
В результате
через канал связи передаются: частота основного тона, тип сигнала, средние
интенсивности сигнала в выбранных полосах частот
Сигнал с ключа поступает на умножители. С выходов умножителей сигналы поступают на гребёнку полосовых фильтров, таких же, какие использовались на передающем конце. Совокупность схем и узлов преобразования сигнала в пределах каждой из частотных полос называется спектральным каналом полосного вокодера. Выходные сигналы спектральных каналов суммируются в выходном усилителе и формируют выходной речевой сигнал.
В модели речевого вокодера в качестве детектора основного тона будет использоваться оператор Тигра (рис. 3). Оператор Тигра обладает рядом привлекательных черт, таких как простота, эффективность и хорошая восприимчивость к изменению сигнала (в том числе и резкому изменению). Посредством этого метода синусоидальные колебания подавляются и остаются только изменения амплитуды.
Рисунок 3 – Модель оператора Тигра (ДОТ)
Рассмотрим поведение оператора Тигра на гласных и звонких согласных звуках. Оператору Тигра на вход подается сигнал, отфильтрованный по полосе 80-450 Гц (полоса, в которой может присутствовать основной тон).
Гласные звуки (для примера фонема [а]):
Рисунок 4 – Реализация гласного звука
На данном рисунке с отсчета 5900 по отсчет 6500 находится гласная [а]. Нетрудно заметить, что оператор Тигра очень хорошо отслеживает моменты прихода импульса основного тона.
Звонкие согласные (для примера фонема [в]):
Рисунок 5 – Реализация согласного звука
На данном рисунке с отсчета 7100 по отсчет 7450 находится звонкий согласный [в]. Легко видеть, что оператор Тигра адекватно выделяет импульсы основного тона.
Звонкие согласные (для примера фонема [н]):
Рисунок 6 – Реализация согласного звука
В данном случае оператор Тигра ведет себя неустойчиво. На рисунке можно видеть, что с отсчета 28900 по отсчет 29200 пики оператора Тигра становятся неочевидными. Верхушка смазывается, появляется несколько максимумов, расположенных рядом друг с другом. Определить в данном случае, какой из них значимый, довольно трудно.
Недостатки
оператора Тигра
Оператор Тигра содержит производные (как первую, так и вторую):
Нужно учитывать, что дифференцирование подчеркивает высокие частоты. То есть, взятие производной ухудшает соотношение «сигнал-шум», а соответственно взятие второй производной усиливает этот эффект. Также следует помнить о той погрешности оценки мгновенного значения производной, которую мы получаем за счет дискретизации сигнала. Если мы будем рассматривать сигнал, оцифрованный на 16 кГц, то оператор Тигра будет вести себя абсолютно адекватно. На практике чаще всего имеется сигнал, оцифрованный на 8 кГц (телефонный канал). Теоретически, путем нетривиального усреднения можно добиться улучшения результата, но тогда теряется временное разрешение.
В качестве направлений дальнейших исследований планируется анализ помехоустойчивости вокодера, а также усовершенствование детектора частоты основного тона и детектора тон/шум.
Список литературы
- Рихтер С.Г. Цифровое радиовещание. — М.: Горячая линия—Телеком, 2004.
- Попов О.Б., Рихтер С.Г. Цифровая обработка сигналов в трактах звукового вещания. — М.: Горячая линия—Телеком, 2007.
- Рихтер С.Г. Кодирование и передача речи в цифровых системах подвижной радиосвязи / С.Г. Рихтер. — М.: Горячая линия — Телеком, 2009.
- Скляр Б. Цифровая связь. Теоретические основы и практическое применение. Изд. 2-е, испр. Пер. с англ. — М.: Издательский дом «Вильяме», 2003.
- Витерби А.Д., Омура Д.К. Принципы цифровой связи и кодирования. Пер. с англ. / Под ред К.Ш. Зигангирова. — М.: Радио и связь, 1982.
- Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов. — М.: Радио и связь, 1981.
- Сапожков М.А., Михайлов В.Г. Вокодерная связь. — М.: Радио и связь, 1983.