Читать «Как музыка стала свободной. Конец индустрии звукозаписи, технологический переворот и «нулевой пациент» пиратства» онлайн - страница 15
Стивен Уитт
Перед Гриллом стояла задача подобрать материал для теста, и он прочесал всю свою колоссальную коллекцию, отобрав все мыслимые стили музыки: фанк, джаз, рок, ритм-н-блюз, метал, классику, вообще всё, кроме рэпа. Рэп он не любил. Грилл хотел обработать всё алгоритмом Бранденбурга, дабы быть уверенным в том, что он работает в любом случае.
Используя щедрый исследовательский бюджет Фраун гофера, Грилл принялся собирать всякие необычные шумы. Он нашел записи голосов, быстро болтающих, с тяжелым акцентом. Нашел птичьи крики и шум толпы, клацанье кастаньет и расстроенные клавесины. Свой излюбленный экземпляр коллекции он добыт во время поездки в головной офис компании Boeing в Сиэтле — там, в сувенирном магазинчике он нашел сборник аудиосэмплов рёва реактивных двигателей. Также по просьбе Грилла Фраунгофер закупил несколько пар наушников Stax, по тысяче долларов за каждую. Это японского производства «электроакустические ушные динамики» размером с кирпич, которым ещё требовался отдельный усилитель. Штука очень дорогая и крайне непрактичная, но Грилл считал, что она — самое тонкое устройство в истории аудиотехники. Любое звуковое несовершенство в этих наушниках обнаруживалось с предельной ясностью, так что можно было выявлять проблемы и решать их.
Алгоритм сжатия, подобно сокращающемуся лучу света, мог нацеливаться на разные размеры конечного файла. Сжатые вполовину, файлы звучали пристойно. В четверть — ок, нормально. В марте 1988 года Бранденбург «изолировал» запись соло фортепиано, а потом запрограммировал такой большой коэффициент сжатия, на который только мог решиться: то есть вот этот безумный 1/12 от CD, придуманный Зайтцером. Файл получился полным ошибок. Бранденбург потом говорил, что пианист звучал «как пьяный». Но, несмотря на это, такой вот опыт непростого прослушивания придал ему уверенности — он впервые понял, как можно достичь цели, поставленной Зайтцером.
С развитием мощностей процессоров, дело пошло быстрее. Год алгоритм Бранденбурга применяли к широкому спектру записанной музыки. Вехой для команды стала «Увертюра 1812 года» Чайковского, следующей — Трейси Чапман, а потом ещё одной — песня Глории Эстефан (Грилл был двинут на «латино»). В конце 1988 года команда совершила первую сделку: доставила mp3-кодировщик первому в истории пользователю mp3 — крошечной миссионерской радиостанции на далёком марианском острове Сайпан.
Однако, один вид аудиозаписей всё ещё не поддавался хорошей оцифровке — то, что Грилл, не слишком хорошо знавший английский, называл «одиноким голосом», имея в виду, конечно, один голос без аккомпанемента. Изолированную человеческую речь невозможно было психоакустически замаскировать. Хаффмановский принцип распознавания тоже не годился, потому что в человеческой речи главное — динамика: взрывные звуки, шипящие, сильный приступ. Алгоритм сжатия Бранденбурга справлялся с симфониями, гитарными соло, артиллерийским орудием, даже с «Оуе mi canto», а с выпуском новостей — всё ещё нет.