Математическая постановка задачи оптимального проектирования цифровых фильтров. Основные типы фильтров частотной селекции и их применение, страница 21

В современных алгоритмах компрессии используется специальная процедура обработки, позволяющая управлять величиной искажения квантования субполос при недостаточном числе доступных для кодирования бит.

Для обеспечения правильного декодирования сжатого сигнала к декодеру также передается некоторая дополнительная информация. Цифровые потоки основной и дополнительной информации декодируются, при этом наиболее важная часть сигнала может подвергаться помехоустойчивому кодированию.

3.11. Аудиокодеки: психоакустическая модель стандарта MPEG.

Самое широкое распространение получила SMR – модель (отношение сигнал/маска). С помощью данной модели для каждой субполосы кодирования n вычисляется отношение SMR(n). Оно представляет собой отношение энергии звукового сигнала к максимально возможному значению энергии искажения квантования в субполосе кодирования, при котором они еще маскируются полезным сигналом.

Значение функции SMR(n) для всех субполос кодирования образует глобальный порог маскирования, определяющий требуемое количество бит для кодирования в каждой полосе кодирования.

Рассмотрим психоакустическую модель, обычно используемую для компрессии Layer 3. Характерными особенностями модели данного уровня являются:

1. Разделение спектра выборки звукового сигнала на полосы психоакустического анализа (М полос, несовпадающие с критическими полосами слуха). Критическая полоса слуха – полоса частот, в пределах которой слух интегрирует сигнал возбуждения в одной полосе, не различая его тонкую структуру внутри полосы. Таких полос 24, которые определены стандартом MPEG. При этом число полос М = 62 для частоты дискретизации 48 кГц, М = 63 при 44.1 кГц, М = 59 при 32 кГц.

2. Все расчеты одновременно выполняются как для длинных (N = 1024), так и для коротких выборок (N = 256) звукового сигнала.

Реализация психоакустической модели включает в себя следующие операции:

1. Вычисление М – точечного БПФ с использованием оконной функции Ханна. В результате каждой k – ой спектральной компоненте Ỳ(k), при k = 0, N-1, вычисляется амплитуда и фаза:

R(k) = | Ỳ(k) |, φ(k) = arg Ỳ(k).

2. Вычисление предсказанных значений R’(k) и φ’(k), для каждой спектральной компоненты. Для этого в памяти кодера хранятся массивы модуля и фаз спектральных составляющих двух предшествующих блоков отсчета звукового сигнала.

3. Расчет меры непредсказуемости для каждой k – ой спектральной компоненты текущего блока выборок. Она учитывает наличие корреляции между текущим и двумя предшествующими блоками выборок. На основании меры непредсказуемости делается вывод о степени близости сигнала в каждой полосе анализа к тону или шуму, маскирующие свойства которых различны.

4. Рассчитывается энергия и взвешенное значение меры непредсказуемости текущего блока выборок в каждой полосе анализа. В каждую полосу анализа попадает несколько спектральных компонент.

5. Расчет развертывающей функции – индивидуальная кривая маскировки, которая учитывает избирательные свойства слуха в различных частотных диапазонах. Далее рассчитываются свертки энергии сигнала в полосе анализа и взвешенных значений меры непредсказуемости с вычислением ранее развертывающей функции с целью учета влияния соседних полос.

6. Рассчитывается ОСШ SNR*(m) в полосе анализа m = 0, N-1, представляющее собой наименьшее значение отношения энергий полезного сигнала и шума, при котором еще маскируется полезный сигнал для заданной полосы анализа. Чем меньше ОСШ, тем больше уровень шума в полосе анализа.

7. Рассчитывается максимально допустимая энергия шума (глобальный порог маскировки) в полосе анализа, при котором он еще маскируется полезным сигналом.

8. Расчет максимально допустимой энергии шума в полосе кодирования (их число = 32).

9. Вычисляется энергия сигнала в полосах кодирования и рассчитывается отношение полезного сигнала к допустимому значению энергии шума SMR для каждой из полос кодирования.  

3.12.Кодирование с линейным предсказанием: метод «анализа через синтез».

Кодирование с линейным предсказанием.

Генератор сигнала                            LPC-коэффициенты с линейным возбуждения                                              предсказанием