Читать «Как музыка стала свободной. Конец индустрии звукозаписи, технологический переворот и «нулевой пациент» пиратства» онлайн - страница 11
Стивен Уитт
Несколько лет Зайтцер бился с патентным экспертом, доказывая, насколько важны открытия Цвикера, но без практических доказательств всё это оказалось совершенно безнадёжным. В конце концов, заявку свою Зайтцер отозвал, но от идеи не отказался. Цвикер уже определил недостатки восприятия уха, так что оставалось измерить их математическим способом. У Зайтцера это так и не получилось, как и у других исследователей. Но он наставил на этот путь и воодушевил своего юного протеже: студент, будущий инженер-электрик, Карлхайнц Бранденбург показался ему одним из самых умных людей, с кем он когда-либо общался.
Бранденбург заподозрил, что десять лет настольного тенниса со странным специалистом по слуху просто лишили Зайтцера рассудка. В цифровую эпоху информация хранится в битах: ноль и единица. Цель сжатия — использовать как можно меньше бит. Одна секунда стереозвука на компакт-диске требовала более 1,4 миллиона бит, но Зайтцер хотел уместить ее в 128 тысяч.
Бранденбург счёл эту цель абсурдной: это как собрать автомобиль за 200 долларов. Но, тем не менее, она показалась ему достойной его амбиций. Следующие три года он работал над этой задачей, пока, наконец, в начале 1986 года не набрёл на направление, которое никто не изучал. Назвав свою идею «анализ синтезом», он следующие несколько недель почти не спал — писал математические инструкции определения этих драгоценных бит. Начал он с нарезки аудио. С помощью «сэмплера» он нарезал входящий звук на тоненькие «щепочки» длительностью в одну секунду. Затем «банком фильтров» рассортировывал их по частотам (банк фильтров делал со звуком то же, что призма со светом). В результате появилась сетка времени и частоты, состоящая из микроскопических фрагментов звука, рассортированных в узкие высотные «ленты» — аудиовариант пикселей. Затем Бранденбург обучил компьютер упрощать эти «аудиопиксели», используя четыре трюка из психоакустического арсенала Цвикера.
Первый. Цвикер доказал, что человеческое ухо лучше всего воспринимает определённый высотный диапазон, который примерно совпадает с человеческим голосом. За этими пределами — особенно выше — слух уже воспринимает хуже. То есть для записи краёв спектра можно использовать меньше бит.
Второй. Цвикер продемонстрировал, как близкие по высоте тоны уничтожают друг друга. Конкретно: нижний тон подавляет верхний, так что когда вы оцифровываете музыку с пересекающимися инструментами, например, виолончелью и скрипкой, играющими одновременно, то скрипку можно записать меньшим количеством бит.
Третий. Согласно опытам Цвикера, слух не воспринимает звук после громкого щелчка. Так что если вы оцифровываете музыку с, например, ударами по тарелке в каждом такте, то в первые миллисекунды после удара можно оставить меньше бит.
Четвёртый и самый странный. Ухо не воспринимает также и звук до громкого удара. Дело в том, что уху требуется несколько миллисекунд, чтобы обработать услышанный звук, и удар этот процесс прерывает. То есть, если снова говорить о тарелке, то нескольким миллисекундам до удара требуется меньше бит.