В современных алгоритмах компрессии используется специальная процедура обработки, позволяющая управлять величиной искажения квантования субполос при недостаточном числе доступных для кодирования бит.
Для обеспечения правильного декодирования сжатого сигнала к декодеру также передается некоторая дополнительная информация. Цифровые потоки основной и дополнительной информации декодируются, при этом наиболее важная часть сигнала может подвергаться помехоустойчивому кодированию.
Самое широкое распространение получила SMR – модель (отношение сигнал/маска). С помощью данной модели для каждой субполосы кодирования n вычисляется отношение SMR(n). Оно представляет собой отношение энергии звукового сигнала к максимально возможному значению энергии искажения квантования в субполосе кодирования, при котором они еще маскируются полезным сигналом.
Значение функции SMR(n) для всех субполос кодирования образует глобальный порог маскирования, определяющий требуемое количество бит для кодирования в каждой полосе кодирования.
Рассмотрим психоакустическую модель, обычно используемую для компрессии Layer 3. Характерными особенностями модели данного уровня являются:
1. Разделение спектра выборки звукового сигнала на полосы психоакустического анализа (М полос, несовпадающие с критическими полосами слуха). Критическая полоса слуха – полоса частот, в пределах которой слух интегрирует сигнал возбуждения в одной полосе, не различая его тонкую структуру внутри полосы. Таких полос 24, которые определены стандартом MPEG. При этом число полос М = 62 для частоты дискретизации 48 кГц, М = 63 при 44.1 кГц, М = 59 при 32 кГц.
2. Все расчеты одновременно выполняются как для длинных (N = 1024), так и для коротких выборок (N = 256) звукового сигнала.
Реализация психоакустической модели включает в себя следующие операции:
1. Вычисление М – точечного БПФ с использованием оконной функции Ханна. В результате каждой k – ой спектральной компоненте Ỳ(k), при k = 0, N-1, вычисляется амплитуда и фаза:
R(k) = | Ỳ(k) |, φ(k) = arg Ỳ(k).
2. Вычисление предсказанных значений R’(k) и φ’(k), для каждой спектральной компоненты. Для этого в памяти кодера хранятся массивы модуля и фаз спектральных составляющих двух предшествующих блоков отсчета звукового сигнала.
3. Расчет меры непредсказуемости для каждой k – ой спектральной компоненты текущего блока выборок. Она учитывает наличие корреляции между текущим и двумя предшествующими блоками выборок. На основании меры непредсказуемости делается вывод о степени близости сигнала в каждой полосе анализа к тону или шуму, маскирующие свойства которых различны.
4. Рассчитывается энергия и взвешенное значение меры непредсказуемости текущего блока выборок в каждой полосе анализа. В каждую полосу анализа попадает несколько спектральных компонент.
5. Расчет развертывающей функции – индивидуальная кривая маскировки, которая учитывает избирательные свойства слуха в различных частотных диапазонах. Далее рассчитываются свертки энергии сигнала в полосе анализа и взвешенных значений меры непредсказуемости с вычислением ранее развертывающей функции с целью учета влияния соседних полос.
6. Рассчитывается ОСШ SNR*(m) в полосе анализа m = 0, N-1, представляющее собой наименьшее значение отношения энергий полезного сигнала и шума, при котором еще маскируется полезный сигнал для заданной полосы анализа. Чем меньше ОСШ, тем больше уровень шума в полосе анализа.
7. Рассчитывается максимально допустимая энергия шума (глобальный порог маскировки) в полосе анализа, при котором он еще маскируется полезным сигналом.
8. Расчет максимально допустимой энергии шума в полосе кодирования (их число = 32).
9. Вычисляется энергия сигнала в полосах кодирования и рассчитывается отношение полезного сигнала к допустимому значению энергии шума SMR для каждой из полос кодирования.
Кодирование с линейным предсказанием.
Генератор сигнала LPC-коэффициенты с линейным возбуждения предсказанием
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.