Самостоятельная работа по теме: «Исследование работы речевых вокодеров для систем подвижной радиосвязи»
     Вокодер является сложной системой, входные воздействия на которую могут рассматриваться как случайный процесс, поэтому для исследования свойств вокодера и качества его функционирования целесообразно использовать имитационное моделирование. В качестве инструмента моделирования использовался математический пакет Matlab/Simulink благодаря высокому уровню программирования и возможности создания имитационной модели. Разработанная имитационная модель полосового вокодера (рис. 1) состоит из подсистем анализатора и синтезатора, то есть кодера и декодера. Модель тестировалась аудио файлами формата wav с образцами речи разной интонации и темпа.
 

Рисунок 1 – Модель цифрового полосового вокодера

     В модели полосового вокодера будем использовать 12 полос. Речевой сигнал поступает на гребёнку полосовых фильтров. К выходам полосовых фильтров подключены выпрямители (функция возведения в квадрат) и сглаживающие фильтры НЧ. Тем самым получаем сигналы , характеризующие амплитуду речевого сигнала в заданной полосе частот и являющиеся медленно меняющимися по сравнению с исходным речевым сигналом. Кроме того, на передающем конце речевой сигнал поступает на детектор основного тона (ДОТ) (Subsystem1 - рис. 2). На его выходе формируется сигнал, характеризующий частоту основного тона . Обнаружитель «Тон-шум» (Subsystem - рис. 2) определяет характер речевого сигнала: вокализованный или фрикативный. Для вокализованных звуков состав спектра звуков речи дискретный, и характер сигнала определяется как «тон». Для невокализованных звуков (например, шипящие) состав спектра звуков речи непрерывный: характер сигнала «шумовой». Формируемый на выходе обнаружителя сигнал обозначим: 0, если звук шумовой; 1, если вокализованный. Следует заметить, что обнаружитель «Тон-шум» и детектор основного тона должны взаимодействовать друг с другом. Если сегмент речевого сигнала идентифицирован как шумовой, то нет смысла осуществлять оценку частоты основного тона.


Рисунок 2 – Участок модели

     В результате через канал связи передаются: частота основного тона, тип сигнала, средние интенсивности сигнала в выбранных полосах частот . В мультиплексоре перечисленные сигналы (кодовые посылки) объединяются и преобразуются в форму, приемлемую для передачи по каналу связи. На приёмной стороне выполняется разделение сигналов посредством демультиплексора и преобразование их в форму, необходимую для работы синтезатора речевого сигнала. 

     Сигнал с ключа поступает на умножители. С выходов умножителей сигналы поступают на гребёнку полосовых фильтров, таких же, какие использовались на передающем конце. Совокупность схем и узлов преобразования сигнала в пределах каждой из частотных полос называется спектральным каналом полосного вокодера. Выходные сигналы спектральных каналов суммируются в выходном усилителе и формируют выходной речевой сигнал.

     В модели речевого вокодера в качестве детектора основного тона будет использоваться оператор Тигра (рис. 3). Оператор Тигра обладает рядом привлекательных черт, таких как простота, эффективность и хорошая восприимчивость к изменению сигнала (в том числе и резкому изменению). Посредством этого метода синусоидальные колебания подавляются и остаются только изменения амплитуды.


Рисунок 3 – Модель оператора Тигра (ДОТ)

     Рассмотрим поведение оператора Тигра на гласных и звонких согласных звуках. Оператору Тигра на вход подается сигнал, отфильтрованный по полосе 80-450 Гц (полоса, в которой может присутствовать основной тон).

Гласные звуки (для примера фонема [а]):


Рисунок 4 – Реализация гласного звука

     На данном рисунке с отсчета 5900 по отсчет 6500 находится гласная [а]. Нетрудно заметить, что оператор Тигра очень хорошо отслеживает моменты прихода импульса основного тона.

Звонкие согласные (для примера фонема [в]):


Рисунок 5 – Реализация согласного звука

     На данном рисунке с отсчета 7100 по отсчет 7450 находится звонкий согласный [в]. Легко видеть, что оператор Тигра адекватно выделяет импульсы основного тона.

Звонкие согласные (для примера фонема [н]):


Рисунок 6 – Реализация согласного звука

     В данном случае оператор Тигра ведет себя неустойчиво. На рисунке  можно видеть, что с отсчета 28900 по отсчет 29200 пики оператора Тигра становятся неочевидными. Верхушка смазывается, появляется несколько максимумов, расположенных рядом друг с другом. Определить в данном случае, какой из них значимый, довольно трудно. 

Недостатки оператора Тигра

Оператор Тигра содержит производные (как первую, так и вторую):


     Нужно учитывать, что дифференцирование подчеркивает высокие частоты. То есть, взятие производной ухудшает соотношение «сигнал-шум», а соответственно взятие второй производной усиливает этот эффект. Также следует помнить о той погрешности оценки мгновенного значения производной, которую мы получаем за счет дискретизации сигнала. Если мы будем рассматривать сигнал, оцифрованный на 16 кГц, то оператор Тигра будет вести себя абсолютно адекватно. На практике чаще всего имеется сигнал, оцифрованный на 8 кГц (телефонный канал). Теоретически, путем нетривиального усреднения можно добиться улучшения результата, но тогда теряется временное разрешение.

     В качестве направлений дальнейших исследований планируется анализ помехоустойчивости вокодера, а также усовершенствование детектора частоты основного тона и детектора тон/шум. 

Список литературы

  1. Рихтер С.Г. Цифровое радиовещание. — М.: Горячая линия—Телеком, 2004.
  2. Попов О.Б., Рихтер С.Г. Цифровая обработка сигналов в трактах звукового вещания. — М.: Горячая линия—Телеком, 2007.
  3. Рихтер С.Г. Кодирование и передача речи в цифровых системах подвижной радиосвязи / С.Г. Рихтер. — М.: Горячая линия — Телеком, 2009. 
  4. Скляр Б. Цифровая связь. Теоретические основы и практическое применение. Изд. 2-е, испр. Пер. с англ. — М.: Издательский дом «Вильяме», 2003.  
  5. Витерби А.Д., Омура Д.К. Принципы цифровой связи и кодирования. Пер. с англ. / Под ред К.Ш. Зигангирова. — М.: Радио и связь, 1982.
  6. Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов. — М.: Радио и связь, 1981. 
  7. Сапожков М.А., Михайлов В.Г. Вокодерная связь. — М.: Радио и связь, 1983.