Исследование искажений сигнала, возникающих при его эффективном кодировании (сжатии), страница 2

Далее сигнал проходит через фильтр МФ с числом звеньев Рм , моделирующий голосовой тракт. С помощью вектора коэффициентов Kм фильтра формируется требуемая огибающая спектра сегмента модели речевого сигнала. Чем больше величины Рм и Рa, тем точнее моделируется сегмент речевого сигнала и меньше средняя энергия Ee сигнала остатка предсказания на выходе АФ.

С выхода фильтра МФ сигнал S[n] проходит через временное окно ВО, которое выделяет лишь определенный временной отрезок сигнала – сегмент.

Размер сегмента задается числом N анализируемых временных отсчетов сигнала. Часто используемые формы окна – прямоугольное и окно Хэмминга. Простое по реализации – прямоугольное окно, а окно Хэмминга обеспечивает более высокую точность оценки огибающей спектра сигнала по сравнению с прямоугольным. Установка типа окна осуществляется по команде «П/Х». После ВО сигнал попадает на анализирующий фильтр АФ (с количеством звеньев Pa) и далее - на измеритель средней энергии остатка e[n] предсказания ИЭ.

Вычисляемый при работе анализирующего фильтра АФ набор из Paкоэффициентов частной корреляции Kа далее используется для формирования частотной характеристики синтезирующего фильтра СФ. Выход СФ представляет собой синтезированный – восстановленный по набору коэффициентовKа – сигнал, использующий тот же сигнал возбуждения, что и при формировании модели сигнала. Если вектор Ка точно описывает огибающую спектра сигнала, то синтезированный сигнал SÙ[n] мало отличается от исходного Sвх[n].

Оценка огибающей кратковременного спектра производится с некоторыми погрешностями, которые обусловливают искажения синтезированного сигнала. Погрешность растет с уменьшением количества звеньев Pa , что подтверждается зависимостью средней энергии остатка предсказания на выходе АФ от Pa .

Ee(Pа) = ES (1 – K12) (1 – K22)… (1 – KPa2),               (1.2)

где ES – средняя энергия сигнала на входе АФ; K1,…KPa – коэффициенты частной корреляции в АФ. Чем больше количество КЧК, тем меньше энергия остатка предсказания и тем меньше погрешность.

Снижение погрешности путем чрезмерного увеличения Pa приводит к неоправданному  росту объема   вычислений.  На  практике  обычно   Pa = = 8…12.

Длительность ВО целесообразно установить равной небольшому количеству периодов наиболее низкочастотного основного тона (основной тон характеризует колебания голосовых связок). Чрезмерное уменьшение N приводит к значительным отличиям кратковременного спектра от долговременного в частотных точках кратных частоте основного тона, по которым определяется огибающая спектра. Чрезмерное увеличение N приводит к нарушению условия квазистационарности РС на анализируемом сегменте сигнала.

Частотная характеристика окна Хэмминга характеризуется меньшим уровнем боковых лепестков по сравнению с прямоугольным окном. Поэтому кратковременный спектр сегмента сигнала, полученный с помощью окна Хэмминга, в меньшей степени отличается от долговременного спектра РС нежели в ситуации с прямоугольным окном. Этим обстоятельством и объясняется преимущественное использование окна Хэмминга на практике. Следует однако учитывать, что ширина главного лепестка частотной характеристики окна Хэмминга примерно в два раза больше лепестка частотной характеристики прямоугольного окна. Поэтому разрешающая способность по частоте у окна Хэмминга ниже.

Искажения сигнала, возникающие при его сжатии, можно оценить объективными и субъективными методами. Определяющей является субъективная оценка искажений на слух, так как именно она характеризует восприятие человеком синтезированных звуков речи. Используются также визуальные оценки искажений по осциллограммам и спектрограммам сигнала. Можно также сравнивать осциллограммы остатка предсказания и сигнала возбуждения в модели речевого сигнала. Чем более они похожи, тем меньше искажения. Однако субъективные оценки трудно поддаются математическому описанию, поэтому их использование в алгоритмах кодирования затруднительно.

Объективная оценка искажений сигнала производится путем определения дисперсии остатка предсказания на выходе анализирующего фильтра. Чем меньше дисперсия, тем точнее фильтр определяет огибающую спектра сигнала.