Аспекты теории речеобразования. Принципы записи и воспроизведения звука моно- и стереосистем (Информация к лабораторным занятиям № 1,2), страница 2

                                                         (9)

                                                  (10)

где

kh=23·10-3 Вт/(м·град);

ср=103 Дж/(кг·град) – удельная теплоемкость;

μ=1.86·10-7 Н·с/м2 – коэффициент вязкости;

η=1.4 – коэффициент адиабаты;

Per – периметр трубки;

и при нормальном атмосферном давлении и температуре 370С:

c=350 м/c – скорость звука;

ρ=1.14 кг/м3 – плотность среды.

При формировании модели речевого тракта с помощью схемы на Т-образных фильтрах обычно выбирают значения длины участка речевого тракта  l до 10-2 м.

С помощью выше приведенных выражений можно оценить, как преобразуется спектр источника и формируется звук. Наиболее существенное значение в таком анализе является выделение формант, поскольку две первые из них играют ключевую роль при приеме речи. Третья и четвертая форманты играют незначительную роль в качестве передачи гласных и служат в основном для определения индивидуальности говорящего.

На рисунке 3 представлены примеры расположения формант звуков э, и, а, у русского языка. Они показывают, что, в отличие от первой, второй и третьей формант, четвертая практически не изменяет своего частотного расположения. Но уровень варьируется для всех четырех. В этих частотных и амплитудных изменениях формант и заключается формирование/различение звуков речеобразующим/слуховым аппаратом человека. 

Рисунок 3. Расположения формант некоторых звуков русского языка

Во временной области выделить отдельные звуки оказывается значительно сложнее, наглядность такого способа много меньше, чем спектрального. Наиболее демонстративная его часть заключается в анализе формантных переходов, пример которых приведен на рисунке 4. На них отчетливо видно движение формантных частот и полос.

Рисунок 4. Примеры формантных переходов

Хотя анализ временных характеристик звука получил слабое развитие и, как следствие, применение, он позволил сделать ряд значимых выводов. Например, было установлено, что важными оказываются как скорость, так и интервал формантного перехода. Причем для разных видов звуков они имеют неодинаковое значение. Это объясняет изменение различимости отдельных слов при увеличении/уменьшении темпа разговора, а также сложности произношения.

Также известными и достоверными считаются данные о длительности отдельных звуков. Эти значения варьируются от 0.05 до 0.26 с, причем гласные в 2 и более раз длиннее согласных.

Результаты, полученные экспериментальным путем с помощью спектрального и временного методов анализа, позволяют выделить некоторые другие интересные факты о речевых сигналах:

1)  эмоциональная окраска вносит значительные отличия от обыденного состояния: а) при возбуждении человек говорит в темпе, превышающем привычный на 15-25% и с уровнем на 3.5-6 дБ больше, причем частотный спектр сдвигается вверх вместе с формантами; б) при утомлении темп снижается на 15-45%, уровень – на 2.5-3.5 дБ, частотный спектр сдвигается в сторону меньших частот; 

2)  в критических ситуациях уровень речевого сигнала может повышаться на 8-12 дБ, а частота основного тона увеличиваться на 200%;

3)  корреляционная функция речевого сигнала может быть аппроксимирована функцией

                                                          (11)

при среднем интервале корреляции 42 мс и максимальном его значении 82 мс;

4)  энергетический спектр речевого сигнала может быть аппроксимирован функцией

                                                       (12)

причем 99.7% мощности переменной составляющей находится в диапазоне до 14 Гц;

5)  речевой поток оценивается всего в 55 бит/с;

6)  исходя из спектра реального сигнала (рис. 5.1), был стандартизирован типовой телефонный канал 0.3-3.4 кГц (рис. 5.2), позволяющий одновременно экономно и без значительных потерь в различимости и естественности звучания передавать сигнал;

Рисунок 5. Спектры речевого (1) и телефонного (2) сигналов

7)  динамический диапазон речи без обработки достигает значений 42-45 дБ, при телефонных разговорах – 35-40 дБ.


Принципы записи и воспроизведения звука моно- и стереосистем

Существуют два основных класса систем записи и воспроизведения звука: стерео и моно. Первые обычно также разделяют на двухканальные, трехканальные, квадрофонические (четырехканальные) и многоканальные.