Математическая постановка задачи оптимального проектирования цифровых фильтров. Основные типы фильтров частотной селекции и их применение, страница 22

Z-образ речевого сигнала            S(Z)=V(Z)*H(Z)         V(Z)-сигнал           возбуждения

Подпись:                                p        j
Пусть H(Z)=G/(1-∑ajZ  )=G/A(Z)
                              j=1                       p        -j
A(Z)=1-F(Z)                  где  F(Z)=∑ ajZ                               
                                                        j=1

Отметим, что F(Z)-передаточная функция КИХ фильтра порядка p с линейным предсказанием.

                                                     

y(n)=a1x(n-1)+a2x(n-2)+….+apx(n-p) ≈ x(n)

Подпись: aj  j=1,p   Предполагается что коэффициенты

подбираются таким образом, чтобы обеспечить прогноз на один период дискретизации с наименьшей погрешностью. Поэтому данный метод и называют кодированием с линейным предсказанием.

При этом речевой сигнал S(n) восстанавливается на приемной стороне по следующему выражению:

Таким образом, синтезирующий фильтр является БИХ фильтром порядка p.

Подпись:                          p
 S(n)=GV(n)+∑a(k)S(n-k)
                      k=1

Метод “анализа через синтез”.

Общая идея заключается  в следующем:

Новый подход использует процедуру оптимизации типа замкнутая петля, для нахождения возбуждающего сигнала V(n), которая подается на вход моделирующего фильтра синтезатора и создает оптимальный речевой сигнал при этом  скорость передачи может быть понижена до 4,8 кбит/с.

Базовая структура системы кодирования включает в себя следующие блоки:

-анализатор формирующий с помощью LPC фильтра первый остаток                                                                                                  

сигнала предсказания   ε1(n)  

-Возбуждающий генератор обеспечивающий генерацию вторичного возбуждения V2(n)

-Тоновый синтезирующий фильтр, выполняющий долгосрочное               предсказание для вокализованных звуков

        

-LPC фильтр синтезатора синтезирующий оценку речевого сигнала                                                

S^(n)

-Блок минимизации ошибки     ε2(n)=S(n)-S^(n)

Алгоритм работы системы включает следующие операции:

1.Текущий кадр выборок речевого сигнала S(n) заносятся в буфер и                с использованием фильтра с линейным предсказанием формируется LPC-коэффициенты.

2.Используется вычислительные LPC коэффициенты формируются остаток предсказания  ε1(n) которая подается на возбуждающий генератор.

3.При генерации вторичного возбуждения  V2(n) текущий кадр разбивается на подкадры для каждого подкадры для каждого подкадра:

а)рассчитываются параметры тонового синтезирующего фильтра, такие как, задержка и масштабирующий множитель, а также параметры LPC синтезир. фильтра.

б)определяются наилучшие вторичные возбуждения  V2(n),

которые минимизируют ошибку ε2(n).

4.Окончательное синтезирование на передающей стороне              производится  путем пропускания вторичного кадра возб., через каскадно соединенные тоновый и LPC фильтры.

5.Шаги с 1 по 4 повторяются для следующего кадра                                                                                     

последовательности.

Принципиальное отличие данного метода от классических вокодеров, состоит в том, что в данном случае, возбуждение не разделяется на вокализованные и не вокализованные звуки, при этом сигнал возбуждения  V2(n) может носить любой характер от псевдоимпульсного до шумоподобного.

Кодер стандарта G.723.1.

Оптимизирован для сжатия речи с высоким качеством на установленные скорости 5,3 и 6,3 кбит/с. Преобразует речь или другие аудио сигналы в кадры длительностью 50 мс.

Предназначен  для работы с цифровыми сигналами, которые передаются по ТФ каналу при частоте дискретизации 8 кГц и разрядностью представления 16 бит. При этом текущий кадр разбивается на 4 подкадра по 60 выборок в каждом. Для каждого подкадра используется LPC фильтр 10-го порядка. Кроме того для каждых 2-х подкадров (120 выборок) вычисляется основного тона.       

Новые методы кодирования с линейным предсказанием.

Известны следующие разновидности методов линейного предсказания.

1.С возбуждением от остатка RELP

2.С многоимпульсным возбуждением MPELP

3.С кодовым возбуждением (от кода) CELP

4.Вокодеры типа линейной спектральной пары LSP

Кодеры с возбуждением от остатка RELP.

Остаток предсказания ε(nT1) пропускается через ФНЧ с полосой 800 Гц при передаче на скорости 9,6 кбит/с и 600 Гц на скорости 4,8 кбит/с. В первом случае сигнал остатка предсказания дискретизируется с частотой 7,2 кГц и с этой же частотой передачи в КС т.е. γ=1 остальные 2,4 кГц/с используется для передачи вектора LPC параметров А¯.