Цифровая обработка сигналов. Основные понятия и определения. Сигналы и их спектральное представление, страница 37

Замечание: Здесь и далее под битом понимается один элемент передаваемого цифрового сигнала.

В то же время, желательно более экономично использовать частотный ресурс канала; кроме того, КВ-каналы вообще не допускают таких скоростей, их возможности значительно скромнее: скорость передачи в КВ-каналах не превосходит 2400 бит/с. Этот пример показывает, что необходимо так преобразовывать информацию, содержащуюся в речевом сигнале, чтобы скорость передачи сократилась в 40 раз (!), т.е. коэффициент сжатия должен быть по крайней мере равен 40. Вообще, ничего удивительного в самой возможности сжатия речевого сигнала нет, поскольку в процессе сжатия устраняется некоторая избыточность, содержащаяся в речевом сигнале. Степень устранения избыточности при передаче отражается на качестве восстанавливаемого (синтезируемого) сигнала.

Устройства кодирования речи называются вокодерами (от англ. voice – голос, coder – кодировщик). Для их построения используются свойства голосового тракта.

Основным элементом модели голосового тракта (рисунок 11.3) является адаптивный фильтр с дискретно меняющимися во времени коэффициентами, фильтр подстраивает свою частотную характеристику под спектр короткого отрезка передаваемого речевого сигнала. Таким адаптивным фильтром является фильтр ЛП порядка K. Возбуждение подобного шума возможно основным тоном или шумом. Моделирование возбуждения осуществляется перестраиваемым генератором частот. Для моделирования сигнала возбуждения служит перестраиваемый генератор частот (генератор основного тона – частоты колебаний голосовых связок) и специальный генератор белого шума (генератор шума).

Вокодер (рисунок 11.3) состоит из двух частей: анализатора и синтезатора.

Анализатор определяет параметры речи, синтезатор по принятым параметрам восстанавливает речь.

Анализатор обрабатывает цифровой речевой сигнал покадрово. Кадры вырезаются друг за другом с помощью гладкой функции типа “окна” (треугольного или Хэмминга). Длительность одного кадра и количество отсчетов речевого сигнала, содержащихся в одном кадре, определяется стандартом и находится в пределах от 15 мс до 30 мс. При частоте дискретизации 8 кГц в одном кадре содержится от 120 до 240 отсчетов соответственно.

К параметрам речевого сигнала, анализируемого на кадре, относятся:

-  параметры линейного предсказания (математически эквивалентные коэффициентам ЛП);

-  тип возбуждения голосового тракта: тон/шум;

Рисунок 11.3-Обобщенная структурная схема вокодера с линейным предсказанием

 

-  период основного тона и энергия сигнала возбуждения.

В синтезаторе происходит обратный процесс: по параметрам линейного предсказания восстанавливаются коэффициенты  (конечно, они будут несколько отличаться от вычисленных на передаче, но устойчивость гарантируется), формируется полюсный фильтр, возбуждаемый либо шумом от генератора (если передавался неогласованный звук), либо основным тоном от генератора основного тона, вырабатывающим частоту ОТ по принятым параметрам.


Литература

1.  Голд Б., Рэйдер Ч. Цифровая обработка сигналов/Пер. с англ.; –М.: Сов. радио, 1973

2.  Рабинер Л., Гоулд Б. Теория и применение цифровой обработки сигналов/Пер. с англ. –М.: Мир, 1978

3.  Купринов М.С., Матюшкин Б.Д. Цифровая обработка сигналов: процессоры, алгоритмы, средства проектирования. –СПб.:Политехника, 1999

4.  Баскаков С.И. Радиотехнические цепи и сигналы: Учебник для вузов по спец. “Радиотехника” –М.:Высшая школа, 2000

5.  Адаптивные фильтры/Пер. с англ.; Под. ред. К.Ф. Коэупа и П.М. Гранта. –М.:Мир, 1988

6.  Иванов М.Т., Серженко А.Б., Ушаков В.П. Теоретические основы радиотехники. Учебное пособие. –М.: Высшая школа, 2002

7.  Серженко А.Б. Цифровая обработка сигналов –СПб.: Питер, 2002