Аудиофилам и пр. Тема весьма интересная и печальная. Первая статья - более популярная, во второй - чуть больше внимания в сторону процесса звукозаписи/мастеринга.
В оригиналах статей - есть ещё картинки.

1. Киви Берд Война без победителей (30.10.2008)
Спойлер
На форуме при сайте одной из известнейших рок-групп недавно появилась петиция (уже подписанная многими тысячами поклонников) примерно такого содержания.

Новый альбом Death Magnetic - это фантастическая работа "Металлики", однако многие из нас разочарованы скверным качеством аудиозаписи на диске. Всем, кто послушал сэмплы из игры Guitar Hero 3, совершенно ясно, что этот же альбом звучит в сотни раз лучше в видеоигре, чем на CD или виниле! Пожалуйста, подпишите петицию за то, чтобы альбом выпустили еще раз в перемикшированном или ремастированном виде, в зависимости от истоков появления этой проблемы. А также за то, чтобы следующие альбомы "Металлики" не страдали от подобных просчетов и не участвовали в той войне за громкость, что охватила современную музыку.

Ключевыми словами и в этой, и в массе других подобных историй, касающихся качества записи современной музыки, являются слова "война за громкость", или loudness war на языке оригинала. Но может быть, мы - меломаны, потребители, слушатели - сгущаем краски?..

В августе 2006 года один из дискуссионных рассылочных листов музыкальной индустрии распространил необычное письмо, посвященное мастерингу коммерческих аудио-CD. Необычность письма, в одночасье разлетевшегося по форумам любителей музыки, заключается в том, что его автором был не артист или звукоинженер, а один из топ-менеджеров индустрии Анжело Монтоне, вице-президент подразделения A&R ("артисты и репертуар") лейбла One Haven Music, входящего в группу компаний Sony Music. Написал же Монтоне следующее:

С музыкой происходит нечто чудовищное... Эти вещи насаждаются A&R-департаментами последние лет восемь: повальное злоупотребление сжатием динамического диапазона, к которому мастеринг-инженеры принуждаются вопреки их воле, профессионализму и всем разумным доводам. Ошибочное мнение, будто "супергромкая" запись будет звучать лучше и словно по волшебству превратит песню в хит, привело к тому, что большинство релизов от главных лейблов в последние годы стали акустическим нападением на слушателей... Вы когда-нибудь слышали один из тех тестовых звуковых сигналов, что передаются по ТВ-каналу в периоды, когда станция не работает в эфире? Вы обращали внимание, как быстро и сколь болезненно вас начинает раздражать этот звук? И это именно то, что вы делаете с песней, когда подвергаете ее сверхсжатию. Вы уничтожаете всю динамику...

Еще один впечатляющий штрих к той же теме можно найти на сайте, посвященном профессиональной звукозаписи. Там большой резонанс вызвала статья мастеринг-инженера Боба Спира (Bob Speer). Написанная еще в 2001 году, она недавно пополнилась свежими данными, доказывающими, что актуальность материала ничуть не утрачена.

"Что произошло с динамическим диапазоном?! - недоумевает Спир. - Вот тот вопрос, который следует задавать музыкальным лейблам, продюсерам, артистам и, не в последнюю очередь, инженерам звукозаписи и мастеринга. То есть всем тем, кто в ответе за происходящее с музыкой. Большинство из того, что мы слушаем сегодня, - это не более чем искажения, сопровождаемые ритмом. И не потому, что музыка плохая. Замечательная музыка страдает из-за до предела ужатого динамического диапазона, который лишает ее силы, эмоций и прозрачности. Большинство выпускаемой сегодня музыкальной продукции - это вообще не музыка. Это скорее антимузыка, потому что сама жизнь выдавливается из нее технологиями сверхсжатия на этапах трекинга, микширования и мастеринга. Неудивительно, что все меньше людей желают платить за нее деньги.

В эту подборку цитат можно было бы включить и высказывания знаменитых музыкантов, возмущенных тем, что происходит со звукозаписью. Но одна из главных причин того, что ситуация не меняется уже десятилетие, а давно известная проблема лишь обостряется, - это, увы, зачастую и позиция самих музыкантов. Ибо именно они и их менеджеры, прекрасно сознавая, что качеству звука будет нанесен непоправимый ущерб, все равно голосуют за то, чтобы финальная запись была "не тише, чем у других".

Короче говоря, в уродование "продукта" вносят вклад все "участники процесса", снизу доверху. И дабы понять, почему союз дивного мира музыки и компьютерных технологий породил такое страшилище, рассмотрим техническую сторону проблемы.

Психоакустика и физиология

Для мейнстрима поп-музыки громкость всегда была весьма и весьма желательным качеством. Да и вообще, почти любая музыка звучит лучше, когда она громкая. Она более эффектна, вы можете расслышать больше деталей и получаете лучшее ощущение музыкального пространства. Наконец, чем громче песня в целом, тем больше она выделяется на фоне окружающего шума повседневной жизни и тем больше привлекает внимание (что принципиально важно для успешных продаж).

Однако громкость и динамика музыки - это далеко не одно и то же. Громкость - вещь относительная. Исследования в области психоакустики, изучающей разнообразные аспекты восприятия звуков человеком, показывают, что люди судят об общей громкости звука не по пиковым моментам максимумов, а на основе среднего уровня громкости. По данной причине, если у двух сравниваемых песен самые громкие моменты имеют один и тот же уровень при замерах аппаратурой, для человека более громкой в целом будет восприниматься та песня, у которой более высок средний уровень громкости.

Сверхсжатие в картинках

Очевидным признаком давней войны за громкость являются перемены, происходящие с графиками звуковых колебаний песен за последние два десятка лет. Хорошим примером могут служить графики для треков с дисков отличной канадской группы Rush за период с 1985 по 2002 год (подготовленные Рипом Роуэном и опубликованные еще шесть лет назад). Группа сочиняет и исполняет сложный и умный прог-рок, профессионально занимается звукозаписью не один десяток лет, однако устоять перед охватившим всех поветрием оказалось не под силу даже самым авторитетным музыкантам Канады.

Из приведенной иллюстрации хорошо видно, что постепенно изменяется не только средняя амплитуда, но и все больше и больше усиливается компрессия динамического диапазона. В итоге между средним уровнем сигнала и пиками максимумов остается чрезвычайно мало различий. Альбом 2002 года "Vapor Trails", по признанию поклонников, из-за такого сверхсжатия слушать просто невыносимо. И хотя сами песни и исполнение очень хороши, запись была загублена буквально на всех этапах производства, так что переиздать альбом с новым ремастерингом в принципе невозможно. Только если отыграть и записать все заново.

При этом внутреннее ухо человека автоматически "гасит" чересчур громкие звуки, чтобы себя защитить. Так что на бессознательном уровне, как свидетельствуют специалисты, мозг сам связывает компрессию звука с громкостью. А громкие звуки, с эволюционной точки зрения, заслуживали повышенного внимания для физического выживания. Иначе говоря, звук со сжатым динамическим диапазоном, вероятно, воздействует на психику как более важный и захватывающий.

Каким образом все эти идеи нашли свое отражение в эволюции музыкальной индустрии? Динамическим диапазоном принято называть разницу между самыми тихими и самыми громкими звуками, которые может слышать человек. Или, в приближении к сути проблемы, это разница между самыми тихими и самыми громкими звуками в музыкальной записи. Динамический диапазон измеряют в децибелах(дБ). Для сравнения можно указать, что динамический диапазон музыки на живых концертах достигает 120 дБ, на записях кассетных магнитофонов около 40 дБ, у виниловых пластинок где-то 70 дБ, а на аудио-CD до 96 дБ (теоретически, во всяком случае).

Теория и практика

Инженеры и звукорежиссеры затратили десятилетия на то, чтобы максимально правдоподобно воссоздавать волнующую музыкальную атмосферу живых концертных исполнений в записи с ограниченным динамическим диапазоном. В аналоговую эпоху это было особенно сложно. Самые тихие звуки требовалось удержать выше уровня шума, в то время как самые громкие сигналы было необходимо, напротив, держать ниже уровня искажений. Поэтому самые тихие звуки всячески усиливали, а громкие сигналы гасили, ограничивая тем самым динамический диапазон аналоговой записи ради заметного повышения ее качества.

А затем в музыкальную индустрию пришло чудо под названием "цифровая запись". Доступный для записи динамический диапазон волшебно расширился почти до сотни децибел, то есть качество звукозаписи уже практически могло конкурировать с живыми концертами. Но, увы, так представлялось только в теории. Потому что на практике музыкальная индустрия выбрала иной путь.

Вместо того чтобы использовать преимущества новой технологии в существенном расширении динамического диапазона, было начато движение в прямо противоположном направлении. Боссы индустрии решили, что чем музыка громче, тем она лучше. В результате чуть ли не все, от исполнителей до инженеров и продюсеров, включились в какую-то совершенно абсурдную гонку за странной целью - выпустить на рынок альбом с таким звуком, чтобы громче не было ни у кого. Единственный же путь для изготовления все более громких компакт-дисков - это больше и больше сжимать динамический диапазон сигнала, максимально подтягивая уровень самых тихих звуков к уровню самых громких. Давным-давно записи подобного рода стали именовать "горячими" (hot), и на сегодняшний день так записывают почти всю коммерческую музыку. С ужасающими результатами для прослушивания, естественно, поскольку от первоначальной музыки остаются лишь "искажения с ритмом".

Нарастающая усталость

Как свидетельствуют специалисты по психоакустике, суть волнующего воздействия музыки идет от вариаций в ритме, тембре, высоте и громкости звуков. Если же удерживать один или несколько из данных параметров постоянными, это быстро начинает казаться монотонным. Как показывают исследования, уже через несколько минут постоянная громкость звука вызывает у человека нарастающее ощущение усталости. Хотя мало кто из слушателей понимает это на сознательном уровне, бессознательно у многих возникает побуждение нажать на кнопку перехода к следующей песне.

Музыка, как и речь, обладает выраженной динамикой. Бывают моменты тихие и моменты громкие, которые служат для выделения и подчеркивания друг друга и более глубокой передачи смысла за счет чередования относительных уровней громкости. Например, если в разговоре кто-то говорит тихо, а затем неожиданно переходит на крик, то громкость крика доносит некое дополнительное сообщение, будь это сигнал срочности, удивления или гнева. Если же динамический диапазон песни очень сильно сжат ради достижения дополнительной громкости, то итоговый звук становится "непрерывным выкрикиванием того, что хотят сказать". Из-за этого теряется сила воздействия музыки.

Комментируя эти нюансы восприятия, известный мастеринг-инженер Том Койн выразился так: "Ограничение динамического диапазона, это, грубо говоря, насилие над ушами. Конечно, если вам пятнадцать лет, классно когда музыка так и долбит по башке. Однако мало кто захочет, чтобы это продолжалось на протяжении всего альбома".

Все пошло с винила

Звукозаписывающие компании начали вступать в битву за громкость с начала 1960-х годов - когда было обнаружено, что более громкие песни из музыкальных автоматов-джукбоксов, как правило, привлекают большее внимание публики. Поэтому было сочтено, что для большей конкурентоспособности пластинки весьма желательно добавлять песням громкости. Однако физические особенности виниловых пластинок естественным образом ограничивали желания продюсеров и возможности инженеров по наращиванию громкости.

Виниловая пластинка представляет собой лаковую поверхность, в которой прорезаны тонкие канавки V-образной формы для вибрационной записи аналогового звука. Создание всякой пластинки в студии звукозаписи включает в себя процесс, именуемый мастерингом, когда песни выравниваются по уровню звука и размещаются в подходящем порядке, чтобы вписаться в требования заданного носителя. Мастеринг для винила всегда был отысканием равновесия между громкостью и временем воспроизведения. Чем громче хотелось сделать песню, тем реже нужно было размещать канавки, способные зафиксировать более размашистую амплитуду записи. Выигрыш в громкости означал принесение в жертву времени воспроизведения, что особо критично было для долгоиграющих пластинок-лонгплеев, где на сторону обычно умещалось лишь до шести песен длительностью три-четыре минуты.

Поскольку для экономии на стоимости производства количество виниловых дисков в альбоме не превышало одного-двух, то в противоборстве громкости и времени воспроизведения, как правило, выигрывало время. Аналоговые компрессоры той эпохи обычно представляли собой усилители выходного сигнала, применяемые по отдельности к каждому из каналов многодорожечной звукозаписи. Это позволяло регулировать индивидуально звук каждого трека (вокал, клавишные, гитары, ударные и т. д.), добавляя в общую картину прозрачности или изменяя звучание с помощью дополнительных эффектов обработки.

Однако в некоторых случаях (впервые, вероятно, при выпуске хитовых синглов студией "черной" музыки Motown Records) компрессоры стали использовать для искусственного повышения громкости до уровней куда выше среднего. Мастеринг-инженеры сокращали динамический диапазон песни так, чтобы трек целиком можно было усилить до максимального уровня и при этом еще не выйти за физически допустимые пределы винилового носителя. Такой способ получил название "горячий" мастеринг и, как правило, применялся к синглам, где каждая сторона пластинки содержала всего по одной песне, поэтому канавки можно было прорезать менее плотно, чем на лонгплеях.

Признаки недовольства новыми подходами к музыке обозначились довольно давно. В декабре 2001 года несколько выдающихся профессионалов из индустрии звукозаписи были собраны в качестве авторитетного жюри, чтобы выбрать лучший по качеству аудиозаписи CD для вручения премии Грэмми лучшему звукоинженеру. Прослушав больше двухсот компакт-дисков, выпущенных за прошедший год, жюри не смогло выбрать ни одного диска, достойного Грэмми, при опоре на те критерии, которыми их снабдили организаторы конкурса. Практически всё из музыки, что им довелось прослушать, было чудовищно искажено - вследствие чрезмерной компрессии динамического диапазона.

Однако жюри вывернулось из этой щекотливой ситуации весьма остроумно. Было решено отыскать пластинку с наименьшим количеством инженерных вмешательств. В итоге победителем был объявлен диск, признанный лучшим не за великое инженерное мастерство, а просто за то, что здесь меньше всего вторгались в поток естественных звуков. По зрелом размышлении и все остальные признали, что именно в этом и состоит, наверное, мастерство настоящего звукоинженера. Победителем тогда, кстати, стала пластинка Норы Джонс "Come Away With Me". А грандиозный коммерческий успех этой очень "старомодной" записи среди массовой публики предельно наглядно продемонстрировал, что не только для специалистов, но и для обычных слушателей хорошая музыка - это вовсе не обязательно музыка громкая.

В ожидании перемен

Одна из причин востребованности сверхсжатых записей среди массовой публики заключается в особенностях современного "потребления музыки" (как бы нехорошо это ни звучало). Количество аудиофилов, ценящих тонкие нюансы музыкальной картины и слушающих записи на высококачественной аппаратуре, сравнительно невелико. Можно даже сказать ничтожно в сравнении с теми легионами, которые слушают музыку на ходу через MP3-плеер, а также из дешевых автомобильных или компьютерных аудиосистем. Для основной массы людей это фоновая музыка, которая тем более привлекательна, чем лучше она забивает шум окружающей жизни. В качестве такого "звукового барьера" сверхсжатые записи с ровным уровнем звучания подходят идеально. Для красивого и сравнительно безболезненного выхода из войны за громкость, охватившей музыкальную индустрию, есть несколько вариантов. Например, предлагают сверхсжатые версии альбомов распространять лишь через Сеть, а на CD выпускать исключительно "аудиофильские" версии записи с полноценным динамическим диапазоном.

Существенно иной вариант, всерьез рассматриваемый ныне музыкальными продюсерами - это совместно разработать и принять общий для индустрии стандарт, регулирующий базовые параметры качественной звукозаписи. Как это уже давно сделано киноиндустрией применительно к звуковым дорожкам фильмов. Другое техническое решение подразумевает перенос режима сжатия на конечное оборудование пользователя. Тогда сами слушатели могли бы выбирать, какой динамический диапазон записи подходит им для воспроизведения в каждой конкретной ситуации. Более дешевый вариант того же самого - это выпуск двух отдельных, двухсторонних или двухслойных дисков, с двумя вариантами одной и той же аудиозаписи.

Вариантов решения проблемы, короче говоря, довольно много. Было бы лишь желание что-то менять.

Из еженедельника "Компьютерра" № 39

Чтобы увидеть ссылку вы должны зарегистрироваться


2. 12-битный мастеринг
Спойлер
В Интернете ведется много споров о том, какой хост "звучит" лучше, а какой хуже. Музыкальное сообщество убедило себя в том, что, например, Samplitude "звучит" лучше, чем Cubase. А программно-аппаратный комплекс Pro Tools HD с 48-битной шиной звуковых данных звучит лучше, чем Nuendo с 32-битным представлением звука. Но способно ли человеческое ухо в принципе услышать какую-либо разницу? Интереса ради я решил провести провокационный опрос на форуме сайта Чтобы увидеть ссылку вы должны зарегистрироваться какой из двух WAV-файлов с одинаковыми фрагментами музыки звучит хуже и что в нем не так (какая применена обработка)? Один из вариантов фрагмента был в 16-битном разрешении, а второй - в 12-битном. Участники форума об этом не знали. Результаты опроса потрясающие: за две недели никто толком и не понял, что один из файлов 12-битный, а многие из опрошенных проголосовали за то, что 16-битный файл звучит хуже 12-битного. Почему так? Давайте разбираться.

Подробности опроса

Немного подробнее об условиях опроса. Мною были подготовлены два файла: 1.wav и 2.wav. Файл 2.wav был исходным, он не подвергался никакой обработке. Файл 1.wav изначально являлся копией файла 2.wav. Затем я понизил разрядность файла 1.wav до 12 бит без применения дитеринга с помощью плагина бит-крашера. При этом сам файл остался 16-разрядным, но младшие четыре разряда звуковых отсчетов "обнулились", т. е. не были задействованы для представления полезного сигнала. Специалисты знают о существовании битоскопов - программных или аппаратных индикаторов, которые отображают факт смены значений разных битов в звуковых отсчетах. Чтобы "обмануть" специалистов, я подмешал к файлу 1.wav очень тихий высокочастотный, практически ультразвуковой шум, у которого основная энергия сосредоточена в области 19 кГц. Сам по себе этот шум не слышен для человеческого уха, но он "загружает" младшие четыре разряда в 16-разрядном сигнале. Таким образом, отличить 12-битный звук от 16-битного можно было только на слух.

С необходимыми файлами и ходом обсуждения вы можете познакомиться на форуме сайта Чтобы увидеть ссылку вы должны зарегистрироваться в разделе "Мастеринг" (тема называется "Тест-провокация").

В квалификации участников тестирования сомнений нет. Все они так или иначе связаны со звукозаписью. Многие из них ранее неоднократно "выступали" на форуме с дельными и толковыми советами при обсуждении самых различных проблем, связанных с обработкой звука. Если рядовые слушатели вообще не ощущают никакой разницы между двумя файлами, то большинство участников тестирования эту ускользающую разницу ощутили и описали ее в привычных для себя терминах.

Интрига заключается в том, какому файлу участники тестирования отдали предпочтение. Из 18 высказавшихся участников четыре человека разницу не ощутили. Семь участников тестирования сообщили, что файл 1.wav (т. е. 12-битный) звучит приятнее: "объемно", "тепло", "округло", "ламповое звучание". Еще семь человек посчитали, что все-таки файл 2.wav (т. е. 16-битный) звучит лучше: более "прозрачно", "шире динамика". Предполагались различные варианты обработки вплоть до применения мастерингового процессора T.C. Electronic Finalizer 96K. Однако никто так и не понял, что файл 1.wav является 12-битным. Никто толком не догадался, какой именно файл был обработан.

Ежедневно форум посещает около 300 человек. К моменту подведения итогов насчитывалось более 4 000 просмотров темы. Но, как видите, высказались только 18 участника. Можно считать, что остальным было не интересно или просто нечего было сказать. В первые дни опроса я, по своей наивности, полагал, что вот-вот кто-нибудь найдет правильный ответ. Однако этого не происходило. Люди стали конструировать ответы методом простого угадывания - перечислением всех известных обработок. Спустя две недели один из участников выдал ответ, приближенный к правильному. Ему и была засчитана победа.

Война за громкость

В последние годы обострилась проблема высоких громкостей фонограмм. Очень хорошо эта проблема описана в статье "Война без победителей" в интернет-издании "Компьютерра-Онлайн" (Чтобы увидеть ссылку вы должны зарегистрироваться). Если коротко, то суть проблемы заключается в том, что из года в год громкость фонограмм постоянно повышается. Считается, что чем громче песня звучит, тем лучше это для ее популяризации. В результате происходит постоянная гонка громкостей, заказчики требуют от исполнителей (звукорежиссеров, инженеров мастеринга) "сделать громче, чем у конкурентов".

Если сравнить звучание CD, изданных году в 1989 и изданных в году 2009, то разница по громкости будет колоссальной. Группы-долгожители музыкального олимпа переиздают свои старые альбомы с припиской remastered, т. е. мастеринг выполнен заново и, естественно, с существенным повышением громкости. Причем, старые альбомы переиздаются не только на CD, но и на относительно новых носителях - DVD, SACD, на подходе Blu-ray. Непосвященный слушатель может спросить: "Что плохого в том, что музыка переиздается на новых носителях более громкой? Ведь при необходимости громкость можно уменьшить". Беда заключается в том, что повышение громкости получается за счет существенного сужения динамического диапазона и, соответственно, искажения формы и спектра звукового сигнала. При высокой громкости искажения становятся чересчур заметными на слух, что не радует некоторых слушателей. Проблема усугубляется тем, что во многих случаях сами специалисты по мастерингу искренне верят в то, что сужение динамического диапазона вовсе не страшно, ведь благодаря хитрым приемам мастеринга фонограмма продолжает, как они говорят, "дышать".

Самая малость теории (всего одна формула)

Теоретически возможный динамический диапазон цифрового сигнала с линейным квантованием по уровню рассчитывается по формуле D = 20lg(2N), где N - количество разрядов квантования. Для 24-разрядного сигнала D = 144 дБ, для 16-разрядного сигнала D = 96 дБ, для 12-разрядного D = 72 дБ, для 8-разрядного D = 48 дБ. Для сравнения: динамический диапазон симфонического оркестра в среднем составляет 80 дБ, хора - 45 дБ, эстрадной музыки (рок, поп и т. п.) - 35 дБ. То есть 16-разрядного сигнала теоретически достаточно для того, чтобы "вместить" в себя динамический диапазон даже симфонического оркестра, не говоря уже о других источниках "музыкального сигнала". Однако при слишком маленьком уровне сигнала (когда оркестр играет очень тихо), становится существенной погрешность квантования. Для компенсации этого явления используется дитеринг (ditering) - искусственное зашумление сигнала в пределах 1-2 младших битов. А чтобы этот шум был как можно меньше заметен на слух, используется нойз-шейпинг (noise shaping) - специальный алгоритм, при котором энергия дитерингового шума оказывается смещенной в область высоких частот. В результате 16-битный CD с применением дитеринга и нойз-шейпинга позволяет записать звучание симфонического оркестра с сохранением достаточно высокого динамического диапазона.

Динамический диапазон отрывка музыки в тестовом файле 2.wav составляет около 20 дБ. Данную запись можно без потери субъективного качества звука втиснуть в 12-разрядный сигнал. При этом останется еще достаточный запас по уровню сигнала для того, чтобы не слышать шум квантования. Если взять любой современный коммерческий трек музыкальных жанров поп, рок, хаус, транс и др., то он будет гораздо громче моего примера, а его динамический диапазон, соответственно, еще уже. Например, динамический диапазон на протяжении большей части трека Мадонны "Hung Up" (на рис. 1 показана его сигналограмма) составляет около 12 дБ, трек ATB "Ecstasy" - около 11 дБ. Это означает, что для данных треков и 12 бит многовато, можно вполне обойтись и 10 битами. Упомянутые треки лет десять назад считались бы бракованными, но не сегодня. Для сравнения, у трека группы Queen "A Kind Of Magic" (рис. 2) динамический диапазон около 35 дБ. В подавляющем большинстве современных треков я отчетливо слышу нелинейные искажения, вызванные чрезмерным сужением динамического диапазона. Однако это не беспокоит большинство людей, которые слушают музыку преимущественно в машине или краем уха по телевизору на кухне.


Рис. 1. Сигналограмма трека Мадонны "Hung Up" (2005 г.)
Рис. 2. Сигналограмма трека группы Queen "A Kind Of Magic" (1986 г.)

Основным назначением мастеринга изначально являлась адаптация трека под конкретный носитель (виниловый диск, компакт-кассету, CD, FM-радио). Для CD можно было оставить динамический диапазон побольше, для винилового диска чуть меньше, для компакт-кассеты - еще меньше. Но в наше время назначение мастеринга изменилось. Теперь его основная задача - обеспечить как можно большую громкость за счет сокращения динамического диапазона. В результате произошло следующее: динамический диапазон современных треков сократился до того, что эти треки фактически оказались адаптированными для 12-, 10-, а в отдельных случаях и для 8-битных цифровых носителей. По этой причине никто не смог осознать тот факт, что тестовый файл является 12-битным. После сжатия динамического диапазона в ходе мастеринга этот файл оказался адаптированным для 12-битного носителя.

Не верите? Попробуйте сами!

Попробуйте поэкспериментировать самостоятельно, например с помощью звукового редактора Adobe Audition 3 в режиме Edit (редактирование одиночной волновой формы). Возьмите какой-нибудь фирменный CD. Командой главного меню File > Extract Audio from CD импортируйте нужный трек с диска. Выделите однородный по громкости участок фонограммы (не вступление и не затухание в конце трека) длительностью несколько минут. Командой Window > Amplitude Statistics откройте окно со статистической информацией по выделенному фрагменту. Перейдите на вкладку Histogram (рис. 3). Здесь отображается похожая на гору гистограмма распределения уровней сигнала. Горизонтальная ось соответствует различным уровням сигнала, а вертикальная - как часто эти уровни имеют место быть. По ширине основания гистограммы можно оценить динамический диапазон сигнала. В моем примере присутствуют сигналы с уровнями примерно от -5 до -18 дБ. Соответственно динамический диапазон - около 13 дБ.

Рис. 3. Гистограмма распределения уровней сигнала

Разыщите в своей фонотеке и импортируйте в программу современные треки с динамическими диапазонами 20 дБ и уже.

Далее понадобится VST-плагин бит-крашер. Бит-крашер - это эффект, при котором искусственно понижается разрядность звука и выполняется ресэмплинг без предотвращения элайсинга (трансформации в слышимую частотную область компонентов сигнала, частоты которых изначально были выше половины частоты дискретизации). Можно использовать D16 Group Audio Software Decimort, описанный в первом номере журнала за 2009 год. Можно воспользоваться iZotope Ozone 4 (см. второй номер журнала за 2009 год), в нем тоже имеется функция понижения разрядности. Откройте окно VST-плагина (команда Effects > VST > название плагина). Какой бы вы плагин не использовали, на его панели нужно отключить все обработки, кроме возможности понижения разрядности. В моем примере (рис. 4) задействован единственный регулятор BITS. Кнопкой / запустите предварительное прослушивание результатов обработки VST-плагином. Понижайте разрядность, начиная от 16 бит и до тех пор, пока искажения не станут ощутимыми на слух. В своем примере без ощутимых искажений я понизил разрядность до 10 бит.

Рис. 4. Понижение разрядности с помощью Decimort

Выводы

Какие можно сделать выводы? При современной манере мастеринга, когда сильно сжимается динамический диапазон фонограммы, многие вещи просто теряют свой смысл.

1.Нет смысла в применении каких-то утонченных эффектов, дорогостоящих аппаратных обработок и синтезаторов. Все те прелести, которые хорошо звучат в студии, будут "убиты" на этапе мастеринга.

2.Нет смысла в применении нойз-шейпинга и дитеринга.

3.Нет смысла в использовании 24-, 32-, 48-, 64-битных форматов представления звука на этапе записи многоканального проекта. Применение этих форматов позволяет минимизировать ошибки округления, накапливающиеся в ходе применения многократных обработок. Однако при прослушивании фонограммы с узким динамическим диапазоном слушатель будет "оглушен" ею - перестанет ощущать тонкости ее звучания, да и тонкостей этих не останется. Вполне достаточно использовать 16-битный формат для треков проекта и 24-битный для звукового файла, в который будет экспортирован проект перед мастерингом.

4.Нет смысла обращаться в специализированную мастеринговую студию. В домашней или проджект-студии с помощью подручных программных средств с заводскими пресетами вы сможете угробить звучание своих треков ничуть не хуже, чем это сделано с треками современных поп-звезд. Совсем не обязательно для этого пользоваться дорогостоящими раритетными аналоговыми фильтрами и оптическими компрессорами.

5.16-битного разрешения для представления цифрового звука более чем достаточно (даже много!). Нет никакой необходимости в переиздании громких композиций на DVD-Audio и SACD.

6.Гонка за громкостью должна чем-то закончиться, поскольку громкость нельзя повышать бесконечно. Ведь в предельном повышении громкости сигнал превратится в некую прямоугольную волну. Вероятно, что гонка эта закончится уже в этом 2009 году. Динамический диапазон в 10 дБ дальше ужимать уже просто некуда. Производителям музыки придется искать какие-то иные пути увеличения популярности своей продукции, например путем повышения ее художественной ценности.

На фоне того факта, что даже при достаточно умеренной по современным меркам громкости люди не в состоянии отличить 12-битный звук от 16-битного, особенно бредовой выглядит идея использования аналоговых сумматоров (специальных аналоговых микшеров с ограниченным функционалом) для микширования цифровых треков в многоканальных проектах. Изначально эти устройства позволяли решить проблему одновременной записи нескольких аппаратных источников звука (обычно синтезаторов) при наличии у звуковой карты только одного стереофонического входа. Т. е. дешевле купить 8-канальный сумматор, чем 8-канальную звуковую карту или полноценный 8-канальный микшер. Однако позже проблема была перевернута с ног на голову, т. к. кто-то сказал, что "теплый" аналоговый микс звучит лучше "сухого" цифрового. Идея некоторым людям понравилась, и теперь они покупают многоканальные звуковые интерфейсы ценовой категории от 20 000 рублей ради того, чтобы пропустить треки через аналоговый сумматор ценовой категории около 10 000 руб. Этому, безусловно, рады и производители звуковых интерфейсов, и производители аналоговых сумматоров. Справедливости ради отмечу, что существуют гораздо более дорогие аналоговые сумматоры, в которых применены схемотехнические решения от некоторых еще более дорогих микшеров с уникальным звучанием, которые уже стали классическими. Однако, опять-таки, при современной манере мастеринга смысл в применении этих пультов пропадает. Утонченное звучание их аналоговых фильтров все равно будет уничтожено.

Выводы достаточно жесткие и могут заставить некоторых людей нервничать. Ничего не поделаешь, господа. Посещайте чаще форум сайта Чтобы увидеть ссылку вы должны зарегистрироваться, чтобы в будущем не пропускать подобные скандальные темы, опросы и тестирования. Если бы вы в первый же день тестирования зашли на сайт и написали: "В файле 1.wav понижена разрядность", то данной статьи попросту бы не было, т. к. не было бы повода для ее написания.

Еще один важный вывод. Людям нравится звук с разрядностью менее 16 бит! Слушатели воспринимают его как "ламповый", "теплый" и т. д. Не зря же звукорежиссеры со стажем испытывают ностальгию по стареньким звуковым модулям и сэмплерам, в которых звуковой сигнал представлялся менее чем 16 битами с частотой сэмплирования менее чем 44,1 кГц. Я все чаще замечаю, что современные танцевальные композиции звучат так, словно к ним был применен бит-крашер. И всех это устраивает, никто не возражает.

Что тут еще можно сказать? Противостоять "заскокам" мировой музыкальной индустрии могут только сами слушатели - они могут голосовать кошельками: не покупать диски с узеньким динамическим диапазоном или требовать возврата денег за уже купленные диски. Далее, по цепочке от покупателя, через магазины и промежуточных поставщиков, некое неудобство должно дойти до музыкального лейбла, выпустившего слишком громкий диск. Я заметил, что уже несколько лет не голосую своим кошельком - практически не покупаю CD. Но пока остальные слушатели своими кошельками не проголосовали, пользуйтесь моментом, применяйте 12-битный мастеринг! И пусть заказчик радуется "теплому", "ламповому" звуку

Статья была опубликована в журнале "Звуковые виртуальные студии" № 3, 2009

Чтобы увидеть ссылку вы должны зарегистрироваться