Сжатие аудиоданных, страница 3


данных мы хотим «отбросить», тем более гибким должен быть алгоритм их обра­ботки по отношению к явлению маскирования. Такие системы сжатия называют­ся психоакустическими, и, как вы увидите, некоторые из них действительно очень искусны.

MPEG-сжатие уровня I

Без натяжки можно сказать, что не имевшая особого успеха система фирмы Philips для записи на цифровые компакт-кассеты (Digital Compact Cassette -DCC) обладала первым непрофессиональным цифровым форматом для магнито­фонов. До появления формата DCC развитие цифрового аудио плелось в хвосте видеотехнологии. Компакт-диски (CD) возникли на базе лазерных дисков фир­мы Philips и DAT-устройств1, использующих метод вращающихся записывающих головок, который создавался для однодюймовых видеомагнитофонов формата В и С и позднее применялся в видеомагнитофонах формата U-Matic, а также быто­вых кассетных видеомагнитофонах. При разработке цифровых компакт-кассет фирма Philips не пошла по пути совершенствования видеотехнологии, как это делали многие другие производители. Внутри магнитофонов формата DCC име­лось несколько движущихся высокоточных деталей, но не использовался прин­цип схватывания лентой магнитной головки и не было вращающихся головок. До появления формата DCC требовался подходящий носитель для записи полного сигнала цветного телевизионного изображения, чтобы сохранить полный объем информации, необходимый для цифрового аудиосигнала высокого качества. Значительный технологический прорыв, совершенный фирмой Philips для сжа­тия двух высококачественных стереофонических цифровых аудиоканалов в поток данных с окончательной скоростью передачи 384 кбод, был достигнут за счет того, что большая часть (75%) цифровых аудиоданных просто отбрасывалась! Фирма Philips назвала свой метод преобразования скорости передачи битов (или сжатия по скорости данных) прецизионным адаптивным поддиапазонным кодированием (Precision Adaptive Sub-band Coding - PASC). PASC был принят в качестве базово­го алгоритма сжатия аудио для MPEG-кодирования видео/аудио (уровень I).

В MPEG- (уровень I) или PASC-аудиокодировании вся аудиополоса делится на 32 частотных поддиапазона с помощью цифрового волнового фильтра. Филь­тры относительно просты и обеспечивают хорошее временное разрешение при приемлемом частотном разрешении. На первый взгляд может показаться, что подобный процесс приведет к росту объема обрабатываемых данных как мини­мум в 32 раза. В действительности это не так, поскольку полоса пропускания бло­ка фильтров для любой частотной полосы составляет 1/32 от исходной частоты дискретизации. Если сказанное вам кажется странным, перечитайте главу 4, где описывается дискретное преобразование Фурье, и вы увидите, что здесь осущест­вляется очень похожий процесс. Обратите внимание: когда периодический сиг­нал дискретизируется п раз и преобразуется, в результате получается п частот­ных составляющих. Представьте себе расчет преобразования сигнала, период которого содержит 32 отсчета: тридцать два отдельных вычисления дадут столько же значений.