Для объективной оценки можно также использовать сумму квадратов разностей между преобразованными значениями исходных значений КЧК и значениями КЧК, определенными при анализе. Эта оценка характеризует искажения огибающей кратковременного спектра сигнала.
Порядок выполнения работы
1. Провести анализ смоделированного сегмента речевого сигнала для заданного звука при различных значениях порядка Pa анализирующего фильтра (порядка предсказания). Построить графики зависимостей искажений A(Pa) огибающей кратковременного спектра и нормированной средней энергии остатка предсказания от порядка анализирующего фильтра.
где Eе(Рa) – средняя энергия остатка предсказания.
При анализе невокализованных звуков следует проводить усреднение 100 результатов измерения (кнопка «Усреднение»).При нажатии данной кнопки происходит статистическое усреднение следующих параметров сигнала и вывод обработанных данных на дисплей:
- дисперсия,
- степень искажения спектра сигнала.
2. Сравнить «осциллограммы» смоделированного для анализа сегмента сигнала и сегмента, синтезированного по КЧК, определенным при анализе для различных значений порядка Рa предсказания.
По результатам сравнения определить минимальное значение Рa= Рmin ,
при котором отличия сравниваемых сигналов являются незначительными (экспертная оценка). При определении Рмин считать, что при P=10 искажения сигнала незначительны. Чем меньше P, тем меньшим числом параметров описывается сигнал, и следовательно, коэффициент сжатия больше.
Зафиксировать «осциллограммы» для Рa= Рmin, а также для Рa = 1 (случай максимальных искажений сигнала).
При частоте основного тона 1Гц и N = 511 зафиксировать спектрограммы для Рa= Рmin и Рa= 1, которые представляют огибающие кратковременных спектров синтезированного сигнала для различных значений порядка предсказания.
3. Сравнить «осциллограммы» остатка предсказания и сигнала возбуждения моделирующего фильтра для различных значений порядка предсказания. Зафиксировать «осциллограммы» для Рa= Рmin.
4. Для Рa = 10 построить график зависимости погрешности определения КЧК от размера временного окна A(N), используя кнопку «Статистический анализ» в программном окне. Пределы изменения N: (50…500). Результаты анализа можно сохранить в файле graph_AN.txt для последующей обработки (файл сохраняется в той же папке, где находится исполняемый файл лабораторной работы).
5. Провести экспертную оценку искажений речевого сигнала, возникающих при его сжатии, на слух:
- создать или использовать готовый тестовый звуковой файл;
- «пропустить» его через речевой кодек для Рa = Рmin и записать в файл декодированный сигнал;
- повторить предыдущий пункт работы для Рa = 10;
- прослушать созданные записи речевых сигналов и оценить изменение
уровня искажений сигнала при изменении порядка предсказания.
Оценка качества звука проводится по двум критериям: разборчивость и узнаваемость диктора по голосу. Каждый критерий оценивается по трехбалльной шкале: «плохо», «удовлетворительно», «хорошо».
Кодирование-декодирование звукового файла проводится с помощью программы C_DCMP.EXE (в папке CODEC2). Имена файлов в процессе выполнения программы следует вводить полностью (с расширением WAV). Декодированный звук прослушивается с помощью программы Cool Edit при открытии файла с параметрами: частота дискретизации 8кГц, глубина квантования 8 бит, тип сигнала – «моно».
Содержание отчета
1. Структурная схема процесса исследования анализирующего фильтра.
2. Значения исследуемых зависимостей, их графики.
3. «Осциллограммы».
4. Выводы по работе.
Контрольные вопросы
1. Почему нельзя устанавливать длительность временного окна чрезмерно большую?
2. Какова форма сигнала на выходе анализирующего фильтра высокого порядка в случае вокализованного звука?
3. Почему при анализе речевого сигнала обычно используется окно Хэмминга?
4. Если окно Хэмминга и прямоугольное окно имеют равные длительности, то какое из них имеет большую разрешающую способность по частоте?
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.