Анализируем изменения частоты во времени
Такие различия во временной развертке, как в бил и пил, хорошо видны на графиках временной зависимости типа изображенного на рис. 1.8. Различие в частоте, как в и и у, отражаются на спектрах, подобных тем, что представлены на рис. 1.6. Однако ни один из графиков не смог бы показать акустическое различие между звуками б и г. Здесь дело заключается в изменении частоты во времени. Чтобы правильно описать различие между б и г, нам нужен третий и последний график, называемый спектрограммой.
На верхней панели на рис. 1.9 представлен простой пример, изображающий звуковой тон, который со временем переходит от низкочастотного к высокочастотному и обратно, как в одобрительном свисте при виде чего-то впечатляющего. Вспомните звук сирены или представьте себе, что водите пальцем по клавиатуре фортепиано.
Различие между согласными в слогах ба и га определяется изменением частот полос акустической энергии во времени (нижняя панель). Верхняя полоса гармоник для ба и га одинаковая: она изменяется во времени от низкой до высокой частоты, пока не выравнивается на звуке а. Но на нижней полосе два слога различаются. В случае ба частота изменяется от низкой до высокой, а затем выравнивается. В случае га звук начинается на относительно более высокой частоте, а затем снижается. Частотная модуляция (ЧМ, или FM, от frequency modulation) важная характеристика звука, которая отражает это изменение частоты во времени.
Рис. 1.9. Спектрограмма (график изменения частоты во времени). Вверху: частота увеличивается, затем уменьшается. Внизу: слоги ба и га. Частоты обеих волн акустической энергии изменяются со временем, пока не стабилизируются на гласном звуке а.
Таким образом, в обоих наших примерах с парами согласных звуков (б/п и б/г) временная развертка является важнейшим фактором, который необходимо учитывать. В случае слогов ба и па время является необходимым и достаточным элементом для выявления различия. В случае слогов ба и га различие определяется взаимодействием обоих факторов времени и частоты. Хотя мы способны уловить и выделить эти звуковые различия, замедлив произнесение и произведя измерения, на практике они произносятся слишком быстро, чтобы мы могли осознанно воспринимать отличающие их параметры. Удивительно быстро. Подумайте об этом: знали ли вы о разнице между ба и га в контексте компонентов звука до того, как я вам об этом рассказала? Понимали ли вы, что пара мгновенных частотных модуляций может превратить пегого дога в беглого бога? Я совершенно определенно не могу определить на слух, что какая-то энергетическая полоса поднимается в ба и опускается в га. И эта скорость и тонкость объясняют сложность восприятия согласных звуков и требуют применения фонетического алфавита (Антон, Борис, Василий, Григорий). Тонкость и сложность дифференцирования и трудности в восприятии этих звуков у некоторых людей имеют интересные последствия для речи и даже для чтения, как мы увидим далее.
При обсуждении временных параметров мы сконцентрировались на речи. И это не случайно. Речь функционирует в гораздо более быстрых рамках, чем другие звуки, включая музыку. Например, allegro это музыкальный темп в диапазоне 120170 ударов в минуту (уд/мин). Для простоты давайте рассмотрим музыкальную пьесу в темпе аллегро в ритме 150 уд/мин. Это соответствует двум с половиной ударам (четвертным нотам) в секунду. Так что каждая четвертная нота длится целых 400 миллисекунд (тысячных долей секунды), одна восьмая 200 мс, а одна шестнадцатая 100 мс. Пьеса Полет шмеля исполняется в еще более быстром темпе presto и интересна тем, что обычно для восприятия двух нот раздельно нам требуется целых 100 мс. Заставив шестнадцатые доли главной темы звучать по 8085 мс, Римский-Корсаков превратил ноты в нечто напоминающее жужжание шмеля. Однако с речью совсем другая история. Согласные в обычной речи длятся так же коротко или еще короче примерно от 20 до 40 мс. И мы можем почти бесконечно произносить речь, наполненную согласными звуками. К счастью для всех музыкантов, исполнявших Полет шмеля, эта пьеса короткая.
Другие компоненты звука
Интенсивность это мера амплитуды изменений давления воздуха, которую мы воспринимаем как громкость: сколько воздуха сдвигает гитарная струна на рис. 1.1 и насколько высоки создаваемые ею волны, изображенные на рис. 1.3. В абсолютном измерении звук производит едва заметные изменения давления воздуха. Однако мы воспринимаем изменения давления в широчайшем диапазоне от тишайших до самых громких звуков, различающихся по физическому давлению воздуха в десять триллионов раз. Поэтому, чтобы отобразить наше восприятие громкости звука с помощью каких-то удобных показателей, мы используем логарифмическую шкалу, переводя количество перемещенного воздуха в знакомые всем единицы интенсивности звука децибелы (дБ). В результате диапазон в десять триллионов раз можно выразить в единицах от 0 дБ (это порог слышимости, ниже предела чувствительности самых чувствительных микрофонов) до 140 дБ самого громкого звука, который мы в состоянии вынести.
Возможно, термины амплитудная и частотная модуляция (АМ и ЧМ) ассоциируются у вас только с настройкой радиоприемника. Однако АМ и ЧМ чрезвычайно важны для нашего звукового пространства и особенно для речи. АМ это флуктуации интенсивности звука (амплитуды): громкий-тихий-громкий-тихий. Автомобильная сигнализация часто работает в режиме от громкого к тихому. Колебания голосовых складок при их открытии и закрытии осуществляют амплитудную модуляцию того, что мы произносим на нашей высоте голоса (на основной частоте). На рис. 1.4 отражена обычная форма АМ: один и тот же сигнал модулируется по амплитуде с разными скоростями.
Частотная модуляция отражает изменение частоты во времени. Когда в речи мы переходим от гласных к согласным и наоборот, полосы акустической энергии поднимаются и опускаются. Это и есть частотная модуляция (изменение на рис. 1.9).
Еще один компонент звука, который стоит упомянуть, это фаза. В начале главы мы обсуждали давление молекул воздуха справа от гитарной струны. Молекулы воздуха слева от струны на рис. 1.1, которые мы не показали, рассеиваются, когда молекулы справа сжимаются, и наоборот. В каждый конкретный момент времени движение струны одновременно сжимает и рассеивает соседние молекулы воздуха. Два человека, сидящие по разные стороны от гитары, слышат музыку, которая по сигналу и давлению различается по фазе на 180 градусов. Графики доходящих до них волн как бы перевернуты по отношению друг к другу. В зависимости от того, где вы находитесь, звук гитары достигает ваших ушей в разное время, или в разной фазе. Эти фазы важны для локализации источника звука, а сложение и погашение фаз играют роль в идентификации звуков в шумном пространстве или при наличии ревербераций (эха).
И, наконец, явление фильтрации. Фильтрация это избирательное усиление или ослабление некоторых частот звукового сигнала. Мы фильтруем звук миллион раз в день как преднамеренно, так и непреднамеренно. Любимая песня звучит по-разному, когда вы слушаете ее на домашней стереосистеме, в машине, через компьютер, через наушники или через мобильный телефон. Каждая система воспроизведения звука имеет свои фильтры, которые либо тщательно изготовлены специалистами по звуку, либо просто удовлетворяют таким параметрам товара, как размер и стоимость, или каким-то иным показателям. Ваш голос и голоса ваших друзей звучат по-разному на улице и в кафе. Фильтрация, вызванная твердой поверхностью стен, потолка и ванны, объясняет, почему мы любим петь под душем. Готические соборы имеют фигурные каменные поверхности, вызывающие многократное отражение звука на более высоких частотах, что обеспечивает особую акустическую атмосферу для музыки и речи. Попробуйте послушать звук своего мобильного телефона, переходя из комнаты в комнату. Кроме того, что звук фильтруется во внешнем пространстве, мы сами тоже преднамеренно фильтруем звуки, издаваемые ртом, языком и губами, чтобы произнести слова, требующиеся для передачи сообщения.