Определение частоты колебаний голосовых связок диктора (Исследование измерителя основного тона речевого сигнала)

Страницы работы

Содержание работы

2. Лабораторная работа

Определение частоты колебаний голосовых связок диктора

(Исследование измерителя основного тона речевого сигнала)

Цель работы. Исследовать точность работы измерителя основного тона.

Краткие теоретические сведения

При идентификации личности широко применяются биометрические методы. В частности, при идентификации личности по голосу измеряется частота вибраций голосовых связок (частота основного тона речевого сигнала) при производстве вокализованных звуков (то есть тех звуков, в создании которых участвуют голосовые связки). Назначение измерителя основного тона (ИОТ) — классификация сегментов (коротких отрезков) речевых сигналов на невокализованные и вокализованные, а также определение периода (частоты) основного тона в последнем случае.

Принцип работы ИОТ основан на анализе автокорреляционной функции сигнала или связанной с ней функции с целью определения их периода. В последнее время широко используется кратковременная функция среднего значения разности AMDF(AverageMagnitudeDifferenceFunction):

   , где R – нормирующий делитель; Х[n] – значение входного сигнала ИОТ в момент времени nTд; Tд – период дискретизации; N – число выборок в сегменте сигнала. В общем случае Х[n] – сумма периодического и случайного компонентов, поэтому данная функция является случайной. Типичная форма ее математического ожидания для вокализованных звуков изображена на рис. 2.1 (сплошная линия). Штриховыми линиями указана зона наиболее вероятных значений y(k).

Период Тот основного тона определяется расстоянием между двумя минимумами функции. Измерительный порог rи служит для фиксации минимумов. Минимальные значения функции определяются лишь для тех значений k, которые обеспечивают  выполнение  условия  y(k) ≤ rи.   Из рис. 2.1. следует, что чем больше разброс значений y(k), меньших rи, тем больше разброс значений измеренного периода (ТminТmax), а следовательно, и больше погрешность измерения. Если шумовая составляющая в сигнале достаточно велика, то принимается решение о невокализованности звука. При этом наименьшее значение функции превышает «классификационный» порог rк. Необходимо отметить, что значения y(k) в точках локальных минимумов определяются не только периодичностью исследуемого сигнала, то есть соотношением шумового и детерминированного компонентов в данном случае, но и уровнем формант (области «всплеска» мощности в спектре сигнала).


Рис. 2.1

Если форманты достаточно мощные, то появляются дополнительные глубокие «провалы» в функции, которые могут привести к грубым ошибкам измерения периода основного тона Тот. Поэтому часто на вход ИОТ подается не сам сегмент сигнала, а его остаток предсказания на выходе анализирующего фильтра. В остатке предсказания формантная структура сигнала значительно разрушена при сохранении периодичности, обусловленной импульсами основного тона. 

Так как наиболее вероятные значения частоты основного тона лежат в пределах (50…500)Гц, то для повышения точности измерения перед вычислением AMDF сигнал пропускают через фильтр нижних частот (ФНЧ) с частотой среза 1 кГц.

Схема обработки сигналов в лабораторной работе

На рис. 2.2 приведена схема обработки сигналов, проводимой в лабораторной работе. Фильтр нижних частот ФНЧ, вычислитель AMDF и измеритель И, где определяется признак вокализованности сегмента «Т/Ш» и временной интервал между соседними минимумами AMDF, составляют измеритель основного тона ИОТ. С помощью генераторов: шума – ГШ, импульсов – ГИ и гармонических колебаний – Г формируется модель сегмента сигнала на входе ИОТ с различным отношением сигнал - шум. Оно изменяется с помощью перемножителя П в зависимости от коэффициента усиления G. По команде «И/С» (импульс – синусоидальный сигнал) ключ подключает либо ГИ – при этом моделируется ситуация, когда на входе ИОТ присутствует остаток предсказания, либо Г – при этом моделируется случай анализа вокализованного сегмента непосредственно.

 


Рис. 2.2

В лабораторной работе имеется также возможность подачи на вход ИОТ сигнала из файла Ф записанного заранее реального звука. При этом можно оценить качество работы ИОТ с реальными сигналами. Подключение файла Ф осуществляется по команде «М/Ф» (модель – запись реального сигнала). Фильтр нижних частот ФНЧ, вычислитель функции AMDF и измеритель периода основного тона И образуют собственно структуру ИОТ.

В лабораторной работе предусмотрена возможность наблюдения «осциллограмм» сигналов на входе ИОТ, а также графика AMDF.

Порядок выполнения работы

1.  Для заданной формы входного сигнала определить зависимость минимального значения AMDF от отношения сигнал – шумymin(c/ш). Построить график зависимости.

Порядок выполнения данного пункта работы:

-установить значение порога классификации достаточно большим (примерно 1,5), чтобы результаты последующего анализа AMDF соответствовали вокализованным звукам;

-значение коэффициента усиления Кус установить достаточно большим, чтобы минимум AMDF составил примерно 0,1 от максимума AMDF. Зафиксировать значение минимума AMDF как результат произведения максимального модуля на относительное значение минимума AMDF (провести три замера и найти среднее значение минимума);

-уменьшить Кус и вновь зафиксировать значение минимума AMDF как результат произведения максимального модуля на относительное значение минимума AMDF (провести три замера и найти среднее значение минимума);

-повторить указанные действия, пока минимум AMDF не увеличится примерно до 0,5 от максимума. Построить требуемый график (получив 7 – 10 точек).

2. Найти такое наибольшее значение Кус, при котором каждые 5 замеров частоты основного тона из 10 замеров в несколько раз отличаются от заданного значения частоты основного тона – имеют место сбои в определении частоты основного тона. Зафиксировать соответствующее значение минимума AMDF. Эта ситуация соответствует границе разделения звуков на вокализованные и невокализованные.

3. Установить порог классификации равным определенному выше значению минимума AMDF. Зафиксировать «осциллограммы» входного сигнала ИОТ, выходного сигнала ФНЧ и график AMDF для данного случая.

4. Найти вокализованные сегменты заданного звукового файла и сопоставить их с осциллограммами речевого сигнала в звуковом редакторе COOLEDIT.95. По результатам сравнения скорректировать найденное ранее значение классификационного порога.

5. Зафиксировать график AMDF и «осциллограммы»  для заданного вокализованного сегмента реального звукового сигнала. Установив найденный порог классификации, определить частоту основного тона.

Содержание отчета

1. Структурная схема процесса обработки сигнала при исследовании измерителя основного тона.

2. Таблицы и графики определенных зависимостей, «осциллограммы» сигналов.

3. Выводы по работе.

Контрольные вопросы

1. К чему приведет чрезмерное уменьшение значения порога классификации?

2. С какой целью при определении периода основного тона вводится измерительный порог?

3. К чему приведет исключение фильтра нижних частот из состава измерителя основного тона?

Похожие материалы

Информация о работе

Тип:
Отчеты по лабораторным работам
Размер файла:
59 Kb
Скачали:
0