Запись голоса через микрофон на компьютер
1.1. Работа с микрофоном
Качество записи и воспроизведения звуков реальных источников зависит от бесконечного количества факторов, но выделить основные составляющие все-таки можно и нужно:
> аналого-цифровой преобразователь (АЦП);
>• цифро-аналоговый преобразователь (ЦАП);
> тракт микширования и усиления звуковых сигналов;
> помещение, в котором производится запись;
> микрофон.
Не станем сейчас рассматривать первые три пункта этого перечня, о них речь пойдет ниже.
В библиотеках все еще можно найти книги [1, 17, 38, 41, 49, 67, 69], в которых перечисляются и обосновываются требования к помещениям, предназначенным для звукозаписи, приводятся варианты планировки студий, разъясняются меры, направленные на снижение уровня электрических и акустических помех. На этом вопросе мы также не станем задерживать ваше внимание, ибо, к сожалению, все подобные рекомендации стоят умопомрачительно дорого и в домашних условиях вряд ли реализуемы. Ясно одно:
живой звук с помощью микрофона надо записывать в помещении, где уровень шумов (в том числе и вызванных работающим компьютером) минимален. Правда, применение компьютерной обработки звукового сигнала позволяет частично избавиться от записанных посторонних звуков и шумов, что оставляет некоторую надежду на получение терпимого (для демо-версий) качества записи, выполненной в необорудованном помещении. Желательно также, чтобы уровень звуков, отраженных от стен и предметов обстановки, был минимальным. Общеизвестно, что для этого следует оборудовать помещение звукопоглощающими материалами. В работе [38] для этих целей рекомендуется использовать ковры.
Запись звука с микрофона при наличии перспективы дальнейшей обработки с помощью редакторов класса Cool Edit с точки зрения распределения уровней и времени реверберации звуковых волн смягчает требования к помещению студии. Не следует заботиться столь же тщательно, как и при аналоговых методах обработки записываемого сигнала, о том, чтобы помещение студии обеспечивало заданную естественную реверберацию. Пусть лучше отраженные сигналы совсем не попадают на микрофон. Звуковые редакторы позволяют имитировать акустические свойства практически любых помещений.
Из перечисленных выше элементов, влияющих на качество записи звука, сначала мы рассмотрим микрофон. Микрофон может не только ослабить влияние недостатков помещения, но и сделать их еще заметнее.
1.1.1. Микрофоны и их основные параметры
Работ, в которых рассказывается о принципах действия микрофонов различного типа, их характеристиках и применении довольно много. Вот только некоторые: [1, 17, 38, 75]. Однако большинство из них изданы относительно давно и к настоящему времени стали малодоступны. Когда эти книги издавались, проблема выбора микрофона существовала лишь теоретически. Ныне ситуация противоположная: микрофонов в ярких упаковках сколько угодно в любом ларьке с радиотехническим уклоном, не говоря уж о специализированных магазинах. Глаза разбегаются. Что выбрать? Давайте разберемся в этом, не слишком глубоко вдаваясь в технические аспекты.
Принцип действия микрофона заключается в преобразовании звуковых колебаний в электрические таким образом, чтобы содержащаяся в звуке информация не претерпевала заметных изменений. Для этого микрофон должен отвечать следующим требованиям:
> при рабочих уровнях звука микрофон должен вырабатывать электрический сигнал, в достаточной мере превышающий уровень собственных электрических шумов;
> вырабатываемый сигнал не должен иметь существенных искажений;
?• микрофон должен практически без изменений передавать все звуковые частотные составляющие, содержащиеся в сигнале в пределах частотного диапазона аппаратуры, к которой он подключен.
Микрофоны отличаются по способу преобразования колебаний звукового давления в колебания электрические. С этой точки зрения различают электродинамические, электромагнитные, электростатические, пьезоэлектрические, угольные и полупроводниковые микрофоны. Электродинамические микрофоны делятся на катушечные и ленточные. К электростатическим микрофонам относятся конденсаторные и электретные, широко используемые в профессиональных целях. Электромагнитные и пьезоэлектрические микрофоны не получили распространения в звукозаписи из-за узкого частотного диапазона и неравномерной частотной характеристики. Последние две группы микрофонов — угольные и полупроводниковые — из дальнейшего рассмотрения можно смело исключить, так как принципы их действия не обеспечивают выполнения ни одного из требований, предъявляемых к микрофонам для звукозаписи.
Принципы действия микрофонов различных типов объединяет способ преобразования звуковых колебаний в электрические: мембрана (диафрагма) микрофона воспринимает и передает колебания звукового давления элементу, осуществляющему их преобразование в электрический сигнал.
Общее представление об устройстве микрофонов, часто используемых для высококачественной звукозаписи можно получить из рис. 1.1—1.3.
Принцип действия электродинамических микрофонов заключается в преобразовании колебаний звукового давления в механические колебания диафрагмы и связанной с ней катушки индуктивности (в катушечных микрофонах) или
ленты (в микрофонах ленточных) в магнитном поле постоянного магнита. Это приводит к возникновению в катушке или ленте э.д.с. самоиндукции, в изменении которой и заложена информация.
Конденсаторные микрофоны требуют внешнего источника питания. Жестко натянутая мембрана под действием изменяющегося звукового давления совершает колебательные движения относительно неподвижного электрода. Эти два элемента составляют конденсатор, являясь его обкладками. При колебаниях мембраны емкость конденсатора изменяется с частотой воздействующего на мембрану звукового давления. В электрической цепи появляется переменный ток, пропорциональный звуковому сигналу.
Электретные микрофоны по принципу действия не отличаются от конденсаторных, однако эффективность преобразования сигнала в них выше, т. к. напряжение на обкладках конденсатора обеспечивается не только обычным внешним источником, но и электрическим зарядом мембраны или неподвижного электрода. Материал этих элементов обладает электретным свойством — способностью сохранять заряд длительное время.
К основным характеристикам и параметрам микрофонов, определяющим их качество, относятся следующие:
> Чувствительность — отношение напряжения на выходе микрофона к воздействующему на него звуковому давлению.
> Динамический диапазон — разность между уровнями предельного звукового давления и собственных шумов.
> Рабочий частотный диапазон. > Частотная характеристика (ЧХ).
> Характеристика направленности — зависимость чувствительности микрофона от угла между его акустической осью и направлением на источник звука.
Важными параметрами микрофона являются также уровень собственных шумов и выходное сопротивление. Очевидно, хороший микрофон должен быть малошумящим. Выходное сопротивление микрофона должно соответствовать входному сопротивлению аппаратуры, к которой он подключен.
Вообще говоря, без учета условий применения при решении конкретных задач нельзя утверждать, что микрофон с теми или иными характеристиками хуже или лучше. Не для всех параметров также справедливо утверждение:
“Чем значение выше, тем лучше”.
Например, микрофон с высокой чувствительностью хорош в подслушивающем устройстве для записи звука с большого расстояния. Но тот же микрофон малопригоден в руке солиста, поющего в сопровождении оркестра, т. к. он будет воспринимать не только голос певца, но и искаженные при распространении звуки музыкальных инструментов. Для правильной передачи звучания басовых музыкальных инструментов не обязательно использовать микрофон с высокой верхней граничной рабочей частотой. Хотя, чем шире рабочий диапазон частот (чем меньше нижняя и больше верхняя граничные частоты), тем универсальнее микрофон.
Одним из важнейших показателей при выборе микрофона является характеристика его пространственной направленности. Графически ее изображают в полярных координатах в виде диаграммы направленности в горизонтальной плоскости.
По виду характеристики направленности микрофоны делят на три основных типа: ненаправленные, двусторонне и односторонне направленные.
В первом приближении считается, что ненаправленные микрофоны одинаково воспринимают звук с любого направления. Рабочей областью ненаправленного микрофона является сфера, а его диаграмма направленности представляет собой окружность, как это показано на рис. 1.4, а.
Рис. 1.4. Виды характеристик направленности микрофонов
Двусторонне направленные микрофоны обладают одинаковой чувствительностью как с фронтальной, так и с тыльной стороны. Диаграмма направленности напоминает цифру “8” (рис. 1.4, б)
Односторонне направленные микрофоны чувствительны только к звуковым волнам, приходящим с фронтального направления. Их диаграмма направленности представляет собой кривую, носящую название “кардиоида” и действительно напоминающую сердечко (рис. 1.4, в).
Кроме направленных микрофонов, существуют еще и остронаправленные. На рис. 1.4, г показана диаграмма направленности такого микрофона, описываемая суперкардиоидой.
Обратим ваше внимание на то обстоятельство, что представленные на рисунках диаграммы направленности идеализированы. Важно понимать, что реальные характеристики направленности близки к этим идеализациям только в пределах узкого диапазона частот. Особенно сильно сказывается зависимость вида диаграммы направленности от частоты для ненаправленных микрофонов. Чем выше частота, тем меньше телесный угол, в пределах которого ненаправленный микрофон воспринимает звуковые волны.
На рис. 1.4, кроме идеализированных диаграмм направленности, представлены реальные характеристики направленности соответствующих микрофонов в рабочем диапазоне частот.
Пренебрежение подобными реалиями может привести к грубым ошибкам. Например, если запись группы вокалистов производится одним ненаправленным микрофоном, то исполнителей с более высокими голосами следует размещать так, чтобы микрофон был нацелен на них фронтальной стороной. В противном, случае, будет нарушено соотношение громкостей и отдельные голоса будут подвержены амплитудно-частотным искажениям.
Изделия фирм, уважающих себя и покупателей, снабжаются паспортами, в которых приводятся диаграммы направленности для нескольких частот, подобные приведенным в качестве примера на рис. 1.5 для динамического (МД-78) и на рис. 1.6 для электретного (МКЭ-2) микрофонов.
Рис. 1.5. Диаграмма направленности микрофона МД-78
Рис. 1.6. Диаграмма направленности микрофона МКЭ-2
Наряду с диаграммой направленности, другой не менее важной характеристикой микрофона является его частотная характеристика. Принципиальным требованием к частотной характеристике является ее равномерность. Чем равномернее ЧХ микрофона, тем правильнее он передает тембр голоса певца или инструмента. При использовании микрофона в системе звукоусиления концертного зала неравномерность ЧХ микрофона является одной из причин возникновения неприятного для ушей публики эффекта — самовозбуждения акустической системы.
На рис. 1.7 и 1.8 в качестве примера представлены ЧХ микрофонов МД-78 и МКЭ-2. По оси абсцисс отложено значение частоты в герцах, а по оси ординат — чувствительность микрофона в логарифмических единицах (децибелах).
^..яб
Рис. 1.8. Частотная характеристика микрофона МКЭ-2
На рис. 1.8 показана зависимость чувствительности микрофона МЭК-2 от частоты для фронтального (0°) и противоположного ему тылового (180°) направлений.
Из рис. 1.7 видно, что осевая частотная характеристика микрофона МД-78 сильно зависит от расстояния, на котором микрофон находится от источника звука. Сравнивая рис. 1.7 и 1.8, можно сделать вывод о том, что ЧХ электрет-ного микрофона существенно равномернее ЧХ микрофона динамического.
Небольшую неравномерность ЧХ можно до некоторой степени скорректировать при обработке сигнала многочастотными узкополосными фильтрами с управляемыми параметрами — эквалайзерами. Такие фильтры, реализованные программным способом, имеются в составе звуковых редакторов.
1.1.2. Рекомендации по применению микрофонов
При выборе микрофона следует учитывать как всю совокупность его технических характеристик, так и условия записи, поэтому конкретные рекомендации дать довольно трудно. Однако общие правила выбора микрофона все же существуют [38].
Ненаправленный микрофон можно применять при записи пения и музыки в сильно заглушенном помещении. Его же следует использовать для передачи общей акустической обстановки при многомикрофонной записи.
Односторонне направленный микрофон с характеристикой типа “кардиоида” желательно применять при записи в помещении с большим количеством звуковых отражений. Применяют его и в том случае, когда в помещение, где проводят запись, проникают посторонние шумы. Микрофон следует устанавливать тыльной стороной к источнику звуковых помех. Такой микрофон рекомендуется использовать при широком фронте размещения исполнителей. Этот микрофон применяют при маловероятной в любительских условиях многомикрофонной записи для четкого разделения групп исполнителей, а также при размещении исполнителя близко к микрофону, чтобы снизить низкочастотные искажения, присущие в этом случае ненаправленному и двусторонне направленному микрофонам.
Двусторонне направленный микрофон с диаграммой типа “восьмерка” следует применять при записи в заглушенном помещении, когда необходимо увеличить относительный уровень переотраженных сигналов, а также при записи отдельных музыкальных инструментов и певцов для выделения низких частот в условиях близкого размещения, исполнителей у микрофона. Используют такой микрофон и в том. случае, когда необходимо отстроиться от направленных источников шума. Для этого микрофон ориентируют зоной нулевой чувствительности к источнику шума. Двусторонне направленный микрофон, сориентированный в горизонтальном направлении, оказывается полезным для ослабления звуковых волн, отраженных от пола, потолка и боковых стен помещения. Это позволяет применить акустическую обработку только двух стен: за исполнителем и напротив него.
В помещениях с жесткими параллельными ограничивающими поверхностями (полупустых комнатах с необработанными в акустическом отношении стенами) могут возникнуть так называемые стоячие волны. Стоячие волны представляют собой собственные колебания в объемном резонаторе, в роли которого выступает помещение с недостаточным затуханием звуковых колебаний. Частоты стоячих волн связаны с размерами помещения. Собственные акустические колебания возникают на частотах, при которых тот или иной размер помещения оказывается кратным половине длины волны. В прямоугольном помещении возможно одновременное существование множества стоячих волн кратных частот (мод колебаний). Скорость распространения звука составляет около 330 м/с, поэтому вдоль того измерения помещения, которое составляет, например, 3 м, возникнут собственные акустические колебания с частотами 55, 110, 165 Гц, и т. д. Наибольшей интенсивностью характеризуются самые низкочастотные моды. По мере увеличения частот собственных колебаний их амплитуды уменьшаются. Поэтому в помещении, имеющем большие высоту, ширину и длину, стоячие волны проявляют себя слабее, ведь частоты наиболее интенсивных мод оказываются ниже нижней границы частотного диапазона микрофона. Влияние стоячих волн заключается в искажении спектрального состава записываемого сигнала. В различных точках помещения амплитуды собственных резонансных частот оказываются различными, поэтому тембр одного и того же источника звука зависит отточки расположения микрофона. Особенно сильно резонансные свойства помещения и неравномерность частотной характеристики микрофона проявляются тогда, когда источник звука формирует широкополосный сигнал, способный возбудить колебания практически на любых резонансных частотах. Это характерно для некоторых ударных инструментов. При записи же речи и пения может происходить неестественное подчеркивание свистящих и шипящих согласных: с, х, т, ц, щ.
На рис. 1.9 схематично показаны источник звука (И) и микрофон (М). Взаимное расположение микрофона и источника звука определяется тремя параметрами:
> углом а между прямой, проходящей через источник звука и микрофон, и акустической осью микрофона;
> характеристикой направленности источника звука (углом (3 между прямой ИМ и акустической осью источника звука);
> расстоянием между источником звука и микрофоном L.
Все музыкальные инструменты по характеристикам направленности можно разделить, хотя и довольно условно, на три группы:
?" инструменты, обладающие выраженной направленностью, например, медные духовые инструменты;
> инструменты, не обладающие заметной направленностью, к ним относятся ударные;
> инструменты, занимающие промежуточное положение между первыми двумя группами. Эта группа инструментов наиболее многочисленна.
Параметры а, р и L (рис. 1.9) определяют уровни сигналов, приходящих к микрофону, тембры источников звука, соотношение между уровнями полезного и мешающих сигналов. При повороте микрофона вокруг своей оси и увеличении угла а из-за отличия формы диаграммы направленности от круговой происходит изменение уровня записываемого сигнала. Аналогичным образом влияет и увеличение угла р. Изменение любого из этих двух углов приводит к завалу высших частот, что сказывается на тембре записываемого звука. Особенно сильно это проявляется в заглушенных помещениях и в случаях, когда расстояние L мало, т. к. основное значение имеет прямой звук, энергия которого в точке М меняется значительно. При больших L или при использовании гулкого помещения доля отраженных звуковых волн, попадающих в микрофон, достаточно велика, и поэтому частотные искажения менее заметны. Для ленточного микрофона, у которого характеристика направленности почти не зависит от частоты, изменение угла а не приводит к частотным искажениям. Наилучшие условия для записи будут в том случае, когда ее = 0 и р = 0.
При записи с нескольких микрофонов необходимо заботиться об их фазиро-вании: сигналы с микрофонов не должны попадать в тракт записи в противо-
фазе, т. к. это может привести к взаимной их компенсации вплоть до полного исчезновения.
Без заметного искажения тембра, вызванного интерференцией прямого и отраженного сигналов, микрофон можно приближать к какой-либо отражающей поверхности на расстояние, составляющее величину не менее 1—1,5 м.
Все усилия по повышению качества записи могут оказаться напрасными, если не соблюдать очевидных правил. Одной из распространенных ошибок является ручное использование микрофона. Его можно считать оправданным только при записи голоса исполнителя, находящегося в движении. Ручное использование микрофона требует большого опыта. Наблюдая по телевизору певцов, едва ли не жонглирующих микрофоном, знайте, что в большинстве случаев вы слышите не “живое” исполнение, а фонограмму. Большинство исполнителей, получивших в руки микрофон, не умеют правильно им пользоваться. Наиболее частыми ошибками являются использование микрофона на слишком близком расстоянии, излишне резкие и ненужные движения им, движение пальцев, охватывающих микрофон. В крайнем случае, с этим можно смириться при однократном “живом” исполнении, но никак не во время сеанса записи.
Микрофон следует надежно закрепить с помощью эластичного материала на стойке с “журавлем”, ножки которой также должны быть снабжены амортизаторами, предотвращающими воздействие на микрофон помех (ударов, вибрации), распространяющихся по стенам и полу помещения.
Сигнальный кабель должен быть экранированным, соединения должны быть надежными, рядом с кабелем не должны располагаться источники мощных помех.
Микрофон и музыкальные инструменты
При дополнении композиций, записанных в исполнении синтезированных MIDI-инструментов, записями партий реальных музыкальных инструментов необходимо представлять себе особенности их звучания [40]. Это поможет верно выбрать тип микрофона, определить наилучшее взаимное расположение микрофона и музыкального инструмента, а также избежать искажения его натурального звучания.
Важнейшая характеристика любого музыкального инструмента, наиболее существенно влияющая на выбор микрофона, — частотный диапазон звучания. На рис. 1.10 представлены диапазоны звучания различных музыкальных инструментов [16, 38]. Цифры в верхней строке — логарифмическая шкала частот в герцах. Для наглядности эти данные приведены в сравнении с частотным диапазоном фортепиано, который простирается от звука “ля” суб-контроктавы (частота 27,5 Гц) до звука “до” пятой октавы (частота 4 186 Гц). Важно знать, что кроме спектра основных частот, каждый инструмент характеризуется дополнительными частотными составляющими — обертонами.
Рис. 1.10. Частотные диапазоны некоторых музыкальных инструментов
Частотные диапазоны обертонов инструментов показаны на рисунке серыми полосами. Особое звучание того или иного инструмента определяется распределением амплитуд всех частот — и основных, и обертонов.
Относительная мощность звуковых колебаний, излучаемых инструментами в различных участках частотного диапазона неодинакова. Большинству музыкальных инструментов присуще усиление основных частот или обертонов в определенных относительно узких полосах частот. В таких случаях говорят о наличии формант в спектре частот инструмента. Объясняется это резонансными свойствами элементов конструкции музыкальных инструментов. Для каждого инструмента формантные области занимают свои специфические
Компьютерному музыканту о звуке ______________________________ 27
положения на оси частот. Частоты формантных областей составляют, например, для кларнета 250 — 600 Гц, для тромбона 300 — 900 Гц, для саксофона 350 — 900 Гц.
Музыкальные инструменты отличаются и силой, звучания. Пиковые мощности звучания инструментов составляют: 25 Вт для большого барабана, 12 Вт для малого барабана, 6 Вт для тромбона, 0,4 Вт для фортепиано, 0,3 Вт для саксофона, 0,05 Вт для кларнета. Учитывать различия в этих цифрах необходимо для того, чтобы при записи верно передать баланс уровней громкостей инструментов, а также для правильного выбора расстояния L и чувствительности микрофона, исключающего нелинейные искажения, вызванные перегрузкой микрофона и усилительного тракта.
Наряду с абсолютным параметром — силой звучания — музыкальные инструменты характеризуются также динамическим диапазоном звучания: отношением мощности звука, извлекаемого из инструмента при исполнении “фортиссимо” (максимальная громкость), к мощности звука при игре “пианиссимо” (минимальная громкость). Динамический диапазон D звукового сигнала принято измерять в децибелах: D = 201g(P,nax/Pmin)i где Рщах и Pmin—максимальное и минимальное звуковые давления. В практических целях при определении динамического диапазона источника звука используют уровни звукового давления, вычисляя их разность. Например, максимальный уровень звучания рояля составляет 80 дБ, а минимальный — 35 дБ, то говорят, что его динамический диапазон составляет 80 — 35 = 45 дБ. При этом 80 и 35 дБ — это уровни звукового давления относительно условного нулевого акустического уровня (порога слышимости). В табл. 1.1 приведены параметры, характеризующие динамический диапазон некоторых источников звука.
Таблица 1.1. Динамические диапазоны источников звука
Источник звука |
Уровень (минимальный/максимальный), дБ |
Динамический диапазон, дБ |
Гитара |
40/55 |
15 |
Пение женское |
45/80 |
20-35 |
Пение мужское |
40/85 |
20-45 |
Орган |
50/85 |
35 |
Виолончель |
35/70 |
35 |
Рояль |
35/80 |
45 |
Эстрадный оркестр |
45/100 |
45-55 |
Симфонический оркестр |
35/110 |
60-75 |
Музыкальные инструменты принято объединять в группы: струнно-смыч-ковые, деревянные, медные духовые, ударные, струнно-щипковые. В книге [3] можно узнать много интересного обо всех классических музыкальных
инструментах. Однако из всего объема сведений о музыкальных инструментах нас сейчас интересуют только те, от которых зависит успех применения микрофона. Да и вряд ли в своей любительской практике вы столкнетесь с проблемой записи звуков арфы или, скажем, настоящего духового органа. Поэтому в заключение остановимся лишь" на вопросах, связанных с записью инструментов, использование которых для оживления звучания электронного оркестра наиболее вероятно.
В состав струнно-смычковой группы входят скрипки, альты, виолончели и контрабас. Разумеется, в банках MIDI-инструментов все перечисленные инструменты имеются, но заменить живую скрипку и виолончель никакой, даже самый совершенный алгоритм синтеза, не в состоянии.
Скрипка — самый маленький инструмент этой группы, обладающий самым высоким голосом. Наибольшая часть звуковой энергии (особенно высоких звуков) излучается с передней стороны скрипки. Поэтому при записи рекомендуется [38] направлять микрофон на прорези (эфы) в верхней деке инструмента.
Для некоторых звуков виолончели, особенно басовых, характерен подчеркнутый резонанс. Это может дать нежелательный эффект, особенно в том случае, когда частоты этих звуков совпадут с какой-либо из собственных частот помещения, максимумами ЧХ микрофона или элементов усилительного тракта.
Контрабас —сложный для записи инструмент, на звучание которого акустические свойства помещения оказывают наиболее сильное влияние. Субъективно это воспринимается как неясность, тусклость, плохая четкость нижних частот. Попытки устранения этого дефекта путем подъема нижних частот в процессе частотной коррекции положительных результатов не дают. При записи ансамбля рядом с контрабасом обязательно должен быть установлен отдельный микрофон.
К наиболее популярным инструментам группы деревянных духовых инструментов относятся флейта и кларнет.
Особенность звучания флейты состоит в том, что даже в заглушенном помещении она сохраняет воздушность и ясность. Для инструмента характерно наличие регистров, в которых уровень звучания довольно слабый. Поэтому микрофон следует размещать ближе, но не настолько, чтобы в записи прослушивались специфические шумы: свистящие звуки струи воздуха, рассекаемой краями амбушюрного отверстия инструмента.
Еще сложнее записывать кларнет, здесь все соткано из противоречий: при близком расположении микрофона может прослушиваться шум дыхания, вызванный избыточным давлением в фазе атаки; в верхнем регистре звук у кларнета резкий и крикливый, и по этой причине инструмент желательно удалять от микрофона, но при мягкой игре в низком регистре полный, сочный и нежный звук лучше воспринимается близкорасположенным микрофоном.
Возможно, многие будут удивлены, но к группе деревянных духовых инструментов причисляют и саксофон, хотя, глядя на переливающийся всеми цветами радуги и сверкающий явно металлическим блеском инструмент, этого и не скажешь. Тем не менее, это так. Изобретатель этого столь популярного ныне инструмента, бельгиец А. Сакс, в свое время поставил перед собой цель создать музыкальный инструмент, занимающий промежуточное положение между деревянными и медными духовыми [З]. Для осуществления этой идеи он соединил в одном инструменте коническую трубку с клапанным механизмом гобоя и тростью кларнета. В дальнейшем появилось целое семейство саксофонов различных размеров, обладающих различными тембрами: сопрани-но, сопрано, альт, тенор, баритон, бас и контрабас. Саксофон имеет довольно широкий диапазон частот и обладает большей, по сравнению с остальными деревянными духовыми инструментами, силой звука. В звучании саксофона заметна вибрация. При записи звучания саксофона следует учитывать, что звук идет из отверстий на теле инструмента, прикрываемых клапанами, а звуки самых нижних частот испускаются в основном из раструба. Микрофон следует располагать на расстоянии 1—1,5 м.
Наиболее популярны инструменты, входящие в группу медных духовых — труба и тромбон.
Труба обладает самым ярким по тембру звучанием среди инструментов медной духовой группы. При громкой игре в верхнем регистре она хорошо слышна даже на фоне мощно звучащего оркестра. При тихой игре или игре с сурдиной ее можно размещать вблизи микрофона. В общем случае из-за сильно выраженной направленности ее следует размещать сбоку от оси микрофона.
Тромбон обладает более низким по регистру звучанием, чем труба. Громкость звучания особенно велика в диапазоне от 2 000 до 3 000 Гц. Так как в этом диапазоне находится максимум спектральной чувствительности уха, то при одновременной записи нескольких инструментов тромбон желательно располагать в стороне от микрофона и на достаточном расстоянии от него.
Из инструментов, не входящих в оркестровые группы, рассмотрим лишь р о яль. Его важнейшей частью, определяющей акустические свойства инструмента, является резонансная дека, установленная под струнами и рамой, вклеенная краями в корпус инструмента.
Звуки рояля издаются в основном верхней стороной деки и после отражения от крышки инструмента направлены преимущественно параллельно струнам. Однако общая направленность инструмента зависит от частоты звука и особенно ощущается при больших расстояниях до микрофона. У рояля различают несколько характерных зон направленности (рис. 1.11).
При записи микрофон следует устанавливать, как правило, в зоне нормальной звучности. Необходимо экспериментальным путем выбрать такое положение микрофона в рабочей зоне, чтобы уравновесить интенсивность звучания партий левой и правой рук исполнителя. Обычно микрофон устанавливают на
расстоянии 1,5—5 м от инструмента на высоте 1,5 м от пола, ориентируя его непосредственно на струны. Выбором угла наклона микрофона добиваются минимального проявления интерференции, вызванной взаимодействием прямого и отраженного от крышки звуков.
Микрофон и вокал
Звуковысотный диапазон певческого голоса определяется интервалом между наиболее низкой и высокой нотами, которые певец в состоянии воспроизвести. Певческие голоса делятся по высоте на мужские (бас, баритон и тенор) и женские (контральто, меццо-сопрано, сопрано и колоратурное сопрано) . Диапазоны основных групп певческих голосов распределяются следующим образом: 82—349 Гц для баса, 110—392 Гц для баритона, 132—523 Гц для тенора, 165—698 Гц для контральто, 220—880 Гц для меццо-сопрано, 262— 1046 Гц для сопрано и 330—1397 Гц для колоратурного сопрано [39]. Такие “некруглые” цифры обусловлены тем, что классификация певческих голосов, сложившаяся в далеком историческом прошлом, была привязана вовсе не к частотам, измеряемым в герцах, а к определенным нотам определенных октав.
Профессиональный певец, обладающий одним из певческих голосов, должен владеть им в диапазоне не менее двух октав. У непрофессиональных певцов диапазон уже. На первый взгляд кажется, что для записи вокальных партий достаточно самого низкочастотного и узкополосного микрофона, однако это впечатление ошибочно. Чтобы передать характерные особенности тембра певческого голоса, нужно записывать значительно более широкий частотный диапазон: примерно 80—10 000 Гц.
В каждом из певческих диапазонов различают несколько регистров: низкий, средний и высокий. Каждый регистр характеризуется особым тембром. Добиться ровности голоса по регистрам —довольно трудная задача подготовки профессионального певца, решение которой не всегда удается. Микрофон же особенно чуток к переходам от регистра к'регистру и подчеркивает все неровности голоса.
Голоса певцов, несмотря на все их разнообразие, характеризуются общими закономерностями: сильной выраженностью высоких обертонов с частотами 2 500—3 000 Гц (верхняя певческая форманта) и наличием низкой певческой форманты в области 300—600 Гц. Верхняя певческая форманта придает голосу певца серебристый оттенок, нижняя — впечатление мягкости и массивности. Даже небольшой завал этих частот трактом звукозаписи приводит к значительному искажению тембра голоса. Недостаток в голосе певца этих частот можно попытаться компенсировать частотной коррекцией с помощью соответствующих фильтров.
Хороший певец должен владеть приемом вибрато: интенсивность извлекаемого звука при этом колеблется с частотой 5—7 Гц. Это позволяет не только обогатить тембр голоса, придать ему особую окраску, но и скрыть некоторые характерные недостатки: небольшие неровности звука по интенсивности, неточность интонации, гнусавость. При отсутствии вибрато или недостаточно хорошей технике исполнения микрофон подчеркнет все указанные недостатки.
Пение отличается от обычной разговорной речи большей мощностью и громкостью. Если запись проводится в заглушенном помещении, то исполнителю кажется, что его голос звучит слабо и тихо. Невольно он будет стараться достичь привычной громкости и форсировать звук. Микрофон неизбежно подчеркнет неестественность пения.
Динамический диапазон (максимальная разница в силе голоса между форте и пиано) у профессиональных певцов достигает 20—45 дБ. Динамический диапазон певцов-любителей не превышает 10 дБ.
Маловероятный вариант записи пения в сопровождении аккомпанирующего инструмента мы не станем рассматривать, т. к. в случае использования компьютерной звуковой студии можно предварительно создать фонограмму аккомпанемента.
Более подробные сведения об оборудовании помещений студий звукозаписи и приемах работы с микрофонами при записи музыкальных коллективов в различных условиях можно найти в книге [38], подробная информация о микрофонах, изготовленных в СНГ, содержится в справочнике [75]. В журнале IN/OUT систематически публикуются технические сведения и информация рекламного характера о микрофонах ведущих зарубежных фирм [35, 53, 68). Правда, цены на них такие, что многие владельцы любительских компьютерных
студий, создавая демонстрационные варианты композиции, скорее всего, откажутся от столь дорогих покупок, а остановят свой выбор на чем-нибудь более доступном, хотя и менее совершенном.
1.2. Цифровая звукозапись с помощью звуковой карты
В процессе общения с читателями книги “Персональный оркестр... в персональном компьютере” нам приходилось слышать приблизительно такое мнение: “Из контекста книги следует, что авторы ориентируют читателей не на самые совершенные звуковые карты. Многие примеры относятся к картам Sound Blaster AWE32 и Sound Blaster AWE64, хотя известно, что для этих звуковых карт характерен относительно большой уровень собственных шумов”. На это замечание можно ответить следующим образом.
Да, действительно, заявленный изготовителем уровень шумов SB AWE32 (— 80 дБ) выше, чем, например, заявленный (другим изготовителем) уровень шумов Turtle Beach Multisound Pinnacle (—96 дБ). Но, во-первых, для новой модели Sound Blaster фирмы Creative Technology Ltd. — звуковой карты SB AWE64 Gold — заявлен уровень собственных шумов — 90 дБ.
Во-вторых, многие заявления любых производителей о тех или иных возможностях своих продуктов требуют дополнительной проверки. Для ее проведения требуются измерительные приборы, способные оценить столь высокие параметры, не внося погрешностей, вызванных их собственными шумами. Не случайно в рамках соответствующей конференции FIDO на месяцы и уже даже на годы растянулись дискуссии поклонников звуковых карт различных фирм. Если научиться улавливать смысл этих высказываний, замаскированный специфическим жаргоном, то можно узнать много интересного. Например, можно встретить оценки реальных шумовых характеристик звуковых карт, которые сильно отличаются (в худшую сторону) от заявленных всеми без исключения производителями.
Обратим ваше внимание на тот факт, что даже уровень собственных шумов — 80 дБ — слишком хороший показатель для неэкранированной звуковой карты, установленной внутри корпуса компьютера, “насыщенного” всевозможными электромагнитными колебаниями. В цепях карты наводятся помехи, от которых не спасут никакие рекомендации типа: установить карту в самый дальний слот, изолировать от корпуса некоторые узлы компьютера, заменить “шумящие” вентилятор или винчестер. Приблизиться в некоторой степени к заявленному уровню шумов позволило бы размещение звуковой карты в индивидуальном стальном экране и дополнительная фильтрация по цепям питания. Неспециалисту такие доработки выполнить сложно. Иными словами,
будучи установленными в компьютер, любые (в том числе и самые дорогие) звуковые карты “шумят” практически одинаково.
В-третьих, мы и не утверждаем, что продукция фирмы Creative Technology Ltd., безусловно, самая лучшая в мире. Мы убеждены только в том, что звуковые карты класса SB AWE32 обладают достаточно высокими показателями при цене, делающей их доступными для массового пользователя компьютера и не очень богатого любителя компьютерной музыки.
MIDI-КОМПОЗИЦИИ можно делать на чем угодно. Шумовые свойства звуковой карты на качество MIDI-КОМПОЗИЦИИ (в процессе ее создания) не влияют. От них зависит только качество ее воспроизведения. А уж готовый MIDI-файл можно 'проигрывать на самом дорогом и малошумящем MIDI-синтезаторе. С записью живого звука дело обстоит, конечно, не так хорошо. Если уж звук записан с повышенным уровнем шума, то избавиться от него будет очень непросто. Поэтому мы не устаем повторять, что наши книги не для профессионалов, а для любителей, и эта книга не о том, как выпустить альбом на CD, а как научиться решать основные проблемы при создании демонстрационной версии композиции, с которой не стыдно будет, предъявляя ваши творческие возможности, обращаться к профессионалам в области звукозаписи и шоу-бизнеса.
Из всего вышесказанного следует, что мы и впредь намерены, рассказывая о способах решения тех или иных задач, связанных с записью живого звука, ориентироваться на звуковые карты семейства Sound Blaster AWE. Это не должно никого разочаровывать. Конкуренция между фирмами-производителями заставляет их учитывать все лучшее в работе соперников. Поэтому и в конструкциях, и в элементной базе, и в функциях, и в программном обеспечении различных звуковых карт очень много общего. Перейти к новому средству обработки звука, зная основные принципы работы с аналогом, значительно легче, чем начинать все с нуля.
1.2.1. Важнейшие параметры звуковых карт
Для получения приемлемого качества записи компьютерной музыки необходимо пользоваться аппаратурой, способной его обеспечить. Число различных моделей звуковых карт составляет несколько десятков. А если учитывать еще и различные версии одних и тех же устройств, то при покупке карты приходится выбирать почти из сотни наименований. Для наших же целей подходят многие, но не все модели. Не всякая звуковая карта способна на большее, чем озвучивание компьютерных игр. Конечно, принадлежность звуковой карты к продукции известных фирм является веской причиной того, что именно ее следует выбрать, это скажется в дальнейшем на надежности работы. Но не у всех наших читателей имеется возможность неограниченного выбора. Тем важней понимать сущность и значение нескольких основных параметров звуковой карты. К таким параметрам относятся, в первую очередь:
^ метод синтеза музыкальных звуков, реализованный в синтезаторе зву ковой карты;
> разрядность АЦП/ЦАП звуковой карты;
> диапазон частот дискретизации.
О методах синтеза музыкальных звуков мы достаточно подробно рассказывали в [63]. В современных звуковых картах по-прежнему применяется частотный синтез звуков (FM-синтез), но это делается в основном в целях обеспечения поддержки старых игр. Основным методом синтеза в настоящее время является волновой метод, или, как его еще называют, метод волновых таблиц (WT-синтез).
Возможно, это несколько субъективно, и кто-то с нами не согласится, но после первого же сравнения звучания MIDI-инструментов в FM- и WT-вариан-тах мы безоговорочно решили для себя, что FM-инструменты не стоят того, чтобы тратить на них время. Поэтому дальше речь пойдет только о WT-синте-заторах звуковых карт.
Разрядность звуковой карты существенно влияет на качество звука. Однако перед тем как перейти к более детальному обсуждению этого вопроса, следует пояснить, что речь идет о разрядности АЦП и ЦАП. Звуковые карты двойного назначения имеют в своем составе одновременно два функционально независимых узла: WT-синтезатор и устройство оцифровки звуковых сигналов, поступающих с внешнего источника. В каждый из узлов входит как минимум по одному ЦАП. В устройстве оцифровки, кроме того, имеется АЦП. В недавнем прошлом прямое указание на разрядность звуковой карты содержалось в ее названии в виде числа 16. Тем самым изготовители подчеркивали, что в их продукции качество цифрового звука как бы соответствует качеству звука лазерного проигрывателя, а не какой-нибудь там 8-битной карты. В дальнейшем 16 разрядов в ЦАП/АЦП стали нормой, а числа “32” или “64” в названиях стали означать совсем другое — максимальное количество одновременно звучащих голосов синтезатора звуковой карты (полифонию).
Некоторые высококачественные звуковые карты оборудованы 18-битными и даже 20-битными ЦАП/АЦП. Звуковые редакторы, работая с любыми звуковыми картами, в том числе и 16-битными, в процессе преобразований отсчетов сигнала используют арифметику с разрядностью двоичного представления числа, превышающей 16. Это позволяет уменьшить погрешность, накапливающуюся в процессе выполнения сложных алгоритмов обработки, которая в противном случае проявлялась бы как искажение звука.
Почему же столь важно наличие большого числа разрядов в устройствах ЦАП и АЦП? Дело заключается в том, что непрерывный (аналоговый) сигнал преобразуется в цифровой с некоторой погрешностью. Эта погрешность тем больше, чем меньше уровней квантования сигнала, т. е. чем дальше отстоят друг от друга допустимые значения квантованного сигнала. Число уровней квантования, в свою очередь, зависит от разрядности АЦП/ЦАП. Погреш-
ности, возникающие в результате замены аналогового сигнала рядом квантованных по уровню отсчетов, можно рассматривать как его искажения, вызванные воздействием помехи. Эту помеху принято образно называть шумом квантования. Шум квантования (рис. 1.12, в) представляет собой разность соответствующих значений реального (рис. 1.12, а)и квантованного по уровню (рис. 1.12, б) сигналов.
Из рис. 1.12 видно, что в случае превышения сигналом значения самого верхнего уровня квантования (“старшего” кванта), а так же в случае, когда значение сигнала оказывается меньше нижнего уровня квантования (“младшего” кванта), т. е. при ограничении сигнала, возникают искажения (рис. 1.12, д), более заметные по сравнению с шумом квантования. Для исключения искажений этого типа динамические диапазоны сигнала и АЦП должны соответствовать друг другу: значения сигнала должны располагаться между уровнями, соответствующими младшему и старшему квантам.
При записи внешних источников звука это достигается с помощью регулировки их уровня, кроме того, применяется сжатие (компрессия) динамического диапазона, о которой речь пойдет ниже.
В звуковых редакторах существует операция нормализации амплитуды сигнала. После ее применения наименьшее значение сигнала станет равным верхнему уровню младшего кванта, а наибольшее — нижнему уровню старшего кванта (на рис. 1.12 — это числа 6 и 1). Таким образом, от ограничения сигнал сверху и снизу будет защищен промежутками, шириной в один квант. Разумеется, если при записи уже имело место ограничение амплитуды, то нормализация не избавит сигнал от искажения.
Для нормированного сигнала относительная величина максимальной погрешности квантования равна 1/N, где N — число уровней квантования. Этой же величиной, представленной в логарифмических единицах (децибелах), оценивается уровень шумов квантования АЦП звуковой карты. Уровень шумов квантования определяется по формуле: Д = 201д(1/1\1).ДлятрехразрядногоАЦП (см. рис. 1.12) N=8, иД= — 18 дБ; для восьмиразрядного—М==256,Д= —48дБ;
для шестнадцатиразрядного — N=65 536, Д= —96 дБ; для восемнадцатиразрядного АЦП N=262 144, Д= — 108 дБ; и для двадцатиразрядного АЦП N= 1 648 576, Д= — 120дБ. Эти цифры наглядно демонстрируют, что с ростом разрядности АЦП шум квантования уменьшается. Приемлемым считается 16-разрядное представление сигнала, являющееся в настоящее время стандартным для воспроизведения звука, записанного в цифровой форме. С точки зрения снижения уровня шумов квантования дальнейшее увеличение разрядности АЦП нецелесообразно, т. к. уровень шумов, возникших по другим причинам (тепловые шумы, а также импульсные помехи, генерируемые элементами схем компьютера и распространяющиеся либо по цепям питания, либо в виде электромагнитных волн), все равно оказывается значительно выше, чем —96дБ.
Однако увеличение разрядности АЦП обусловлено еще одним фактором — стремлением расширить его динамический диапазон. Мы уже говорили о динамическом диапазоне звука. Динамический диапазон некоторого устройства обработки может быть определен выражением D=201g(Smax/S,nin), где S^ax и Smin — максимальное и минимальное значения сигнала, который может быть преобразован в цифровую форму без искажения и потери информации. Вы уже, наверное, догадались, что минимальный сигнал не может быть меньше, чем напряжение, соответствующее одному кванту, а максимальный — не должен превышать величины напряжения, соответствующего N квантам. Поэтому выражение для динамического диапазона АЦП звуковой карты примет вид:
D=201g(N). Ведь можно считать, что Smax=kN, aS,nm=kl, ^ek — некоторый постоянный коэффициент пропорциональности, учитывающий соответствие электрических величин (тока или напряжения) номерам уровней квантования. Сравнивая выражения для Д и D, становится ясно, что при одинаковой разрядности АЦП эти величины будут отличаться лишь знаками.
Поэтому динамический диапазон для 16-разрядного АЦП составляет 96 дБ, для 18-разрядного— 108 дБ, для 20-разрядного— 120 дБ. Иными словами, для записи звучания некоторого источника звука, динамический диапазон которого составляет 120 дБ, требуется двадцатиразрядный АЦП. Если такого нет, а имеется только шестнадцатиразрядный, то динамический диапазон звука должен быть сжат на 24 дБ: со 120 дБ до 96 дБ.
В принципе, существуют методы и устройства сжатия (компрессии) динамического диапазона звука, и мы еще будем говорить о них. Но то, что они проделывают со звуком, как ни смягчай формулировки, все равно искажает его. Именно поэтому так важно для оцифровки звука использовать АЦП, имеющий максимальное количество разрядов. Владелец 16-битной звуковой карты может еще раз взглянуть на табл. 1.1. с тем, чтобы убедиться в отсутствии особых причин для расстройства: динамические диапазоны большинства источников звука вполне соответствуют динамическому диапазону такой звуковой карты. Кроме того, 18-битное или 20-битное представление сигнала применяется только на этапе обработки звука. Конечная аудиопродукция (CD и DAT) реализуется в 16-битном формате.
После того как мы немного разобрались с разрядностью звуковой карты, пришло время поговорить о частоте дискретизации.
В процессе работы АЦП происходит не только квантование сигнала по уровню, но и его дискретизация во времени. Сигнал, непрерывно изменяющийся во времени, заменяют рядом отсчетов этого сигнала. Обычно отсчеты сигнала берутся через одинаковые промежутки времени. Интуитивно ясно, что если отсчеты отстоят друг от друга на слишком большие интервалы, то при дискретизации может произойти потеря информации: если важные изменения сигнала произойдут не в те моменты, когда были взяты отсчеты, они могут быть “пропущены” преобразователем. Получается, что отсчеты следует брать с максимальной частотой. Естественным пределом служит быстродействие преобразователя. Кроме того, чем больше отсчетов приходится на единицу времени, тем больший размер памяти необходим для хранения информации.
Проблема отыскания разумного компромисса между частотой взятия отсчетов сигнала и расходованием ресурсов трактов преобразования и передачи информации возникла задолго до того, как на свет появились первые звуковые карты. В результате исследований было сформулировано правило, которое в отечественной научно-технической литературе принято называть теоремой Котельникова [Котельников В.А. Теория потенциальной помехоустойчивости.— М., Госэнергоиздат, 1956].
Если поставить перед собой задачу обойтись без формул и использования серьезных научных терминов типа “система ортогональных функций”, то суть теоремы Котельникова можно объяснить следующим образом. Сигнал, представленный последовательностью дискретных отсчетов, можно вновь
преобразовать в исходный (непрерывный) вид без потери информации только в том случае, если интервал между соседними отсчетами не превышает половины периода самого высокочастотного колебания, содержащегося в спектре сигнала.
Из сказанного следует, что восстановить без искажений можно только сигнал, спектр которого ограничен некоторой частотой F^ax- Теоретически все реальные сигналы имеют бесконечные спектры. Для того чтобы при дискретизации избежать искажений, вызванных этим обстоятельством, сигнал вначале пропускают через фильтр, подавляющий в нем все частоты, которые превышают заданное значение Fmaxi и лишь затем производят дискретизацию. Согласно теореме Котел-ьникова частота, с которой следует брать отсчеты, составляет Рд = 2Fmax- Теорема получена для идеализированных условий. Если учесть некоторые реальные свойства сигналов и устройств преобразования, то частоту дискретизации следует выбирать с некоторым запасом по сравнению со значением, полученным из предыдущего выражения.
В стандарте CD частота дискретизации равна 44,1 кГц. Для цифровых звуковых магнитофонов [25] стандартная частота дискретизации составляет 48 кГц. Звуковые карты, как правило, способны работать в широком диапазоне частот дискретизации. Важно, чтобы максимальное значение частоты дискретизации было не менее 44,1 кГц, в противном случае качества звучания CD достичь не удастся. Следует различать частоту дискретизации в АЦП/ЦАП, предназначенных для оцифровки внешних сигналов, и частоту дискретизации в ЦАП WT-синтезатора звуковой карты. Значение последней может не совпадать с указанными стандартными значениями.
Довольно часто изготовители, доказывая преимущество своих звуковых карт, подчеркивают еще два обстоятельства:
> наличие у звуковой карты выхода, на котором информация представлена в цифровой форме;
> наличие дуплексного режима прямого доступа к памяти.
Действительно, если звуковая карта имеет выход, на который сигналы поступают не в аналоговой (после ЦАП), а в цифровой форме, то это позволяет уменьшить искажения, связанные с дополнительными преобразованиями при дальнейшей цифровой обработке сигнала вне звуковой карты. Это становится актуальным при записи композиции на CD или DAT.
Так, например, в звуковых картах SB AWE32, AWE64 имеется разъем интерфейса S/PDIF (Sony/Philips Digital Interface Format - формат цифрового интерфейса фирм Sony и Philips), который предназначен для передачи звуковых сигналов от WT-синтезатора в цифровой форме, Но не следует забывать, что S/PDIF представляет собой лишь упрощенный вариант профессионального студийного интерфейса AES/EBU (Audio Engineers Society/European Broadcast Union) , разработанного Европейским радиовещательным союзом.
Для разгрузки процессора работа АЦП/ЦАП звуковых карт организуется в режиме прямого доступа к памяти [Direct Memory Access — DMA). Полный дуплекс [Full-Duplex) означает способность звуковой карты одновременно воспроизводить и записывать звук. Для этого требуется поддержка звуковой картой одновременно двух каналов DMA. Для звуковых карт семейства AWE возможна организация одного 16-разрядного и одного 8-разрядного каналов. По одному из них возможна запись, а по другому воспроизведение. Это ограничение затрудняет работу с программами многоканального монтажа и сведения, а также подготовку материала для записи CD на том же компьютере, на котором установлена звуковая карта.
1.2.2. Подключение микрофона к звуковой карте
Начнем с критики микрофона, который прилагается к современным моделям Sound Blaster. Микрофон так и называется: Creative Microphone. И хотя он имеет неплохие частотные характеристики — диапазон частот от 100 до 16 000 Гц, при неравномерности частотной характеристики ±4дБ — использовать его для записи музыки не следует. Он может служить средством общения при голосовой модемной связи или источником сигналов для подачи команд компьютеру, но для звукозаписи он имеет слишком много недостатков:
легкая подставка без амортизаторов, жесткое крепление к ней микрофона, отсутствие на микрофоне ветрозащиты, короткий кабель. Поэтому приобретите микрофон посолиднее. Но при этом учтите ряд обстоятельств.
Имейте в виду, что микрофонный вход большинства звуковых карт (в частности, семейства Sound Blaster AWE) рассчитан на подключение конденсаторного электретного микрофона. Это означает, что, во-первых, входное сопротивление звуковой карты соответствует выходному сопротивлению электретного микрофона, во-вторых, чувствительность входного усилителя соответствует уровню напряжения на выходе электретного микрофона. Кроме того, в целях создания удобства пользования электретным микрофоном, требующим для своей работы внешнего питания, для подключения единственного монофонического микрофона используется трехконтактный разъем, который в стандартном варианте применения служит для подключения источника стереосигналов. В данном случае его контакты выполняют следующие функции: через концевой контакт к звуковой карте подключается сигнальный провод микрофонного кабеля, на средний контакт подается питающее микрофон напряжение +5 В, оставшийся третий контакт соединяет экран кабеля с общим проводом звуковой карты. Из сказанного следует, что при подключении “неродного” микрофона необходимо разобраться в схеме распайки проводников микрофонного кабеля на контактах его разъема.
Если вы имеете дело с электретным микрофоном, который не содержит внутреннего источника питания и требует подачи внешнего напряжения, то распайка разъема должно быть такой, как и для Creative Microphone.
Если электретный микрофон имеет внутренний источник питания (например, при эксплуатации МКЭ-2 необходимо поместить внутрь развинчивающегося корпуса элемент питания, заключенный в специальный футляр), то следует задействовать только земляной и сигнальный контакты разъема. По возможности избегайте замыкания концевого и среднего контактов. Вряд ли что-нибудь перегорит, но при этом микрофонный вход звуковой карты оказывается соединенным с источником питания + 5 В компьютера. А это может привести, во-первых, к проникновению в тракт усиления/преобразования лишних помех (не полностью отфильтрованных пульсации с частотой 50 Гц и с частотой преобразователя импульсного блока питания) и, во-вторых, к снижению чувствительности и изменению частотной характеристики микрофонного входа из-за его шунтирования внутренним сопротивлением источника питания. Итак, лучше всего разобраться с фактической распайкой разъема микрофона. В крайнем случае, сгодится рекомендация, высказанная по этому поводу на конференции FIDO: избежать замыкания можно, обернув средний контакт штекера микрофона узкой полоской тонкой липкой ленты.
Использовать микрофоны других типов со звуковыми картами, рассчитанными на электретные микрофоны, не рекомендуется, т. к. из-за несоответствия входного и выходного сопротивлений, чувствительности микрофонного входа карты и уровня выходного сигнала микрофона могут возникнуть значительные частотные и нелинейные искажения.
Некоторые звуковые карты имеют переключатели Dynamic/Condenser для выбора типа микрофона.
Перейдем к вопросу о количестве микрофонов, которые можно подключить к звуковой карте.
После внимательного изучения технической документации на звуковую карту вы можете разочароваться: на карте удалось найти только один разъем для подключения микрофона, да и тот, как только что мы выяснили, имеет лишь один сигнальный контакт. Значит, к звуковой карте можно подключить только один микрофон. Самое интересное, что подавляющее большинство звуковых карт других типов (за исключением нескольких самых дорогих, специально предназначенных для многоканальной записи) имеют по одному микрофонному входу. Выходит, что с мечтой о сте-реозаписи голоса певца или акустических музыкальных инструментов нужно расстаться? И да,и нет.
Да, действительно, если бы вы поставили перед собой цель, используя микрофонный вход звуковой карты, сохранить в стереофонической записи реальную акустическую обстановку концертного зала, то этого сделать бы не удалось. Для такой записи обязательно нужна стерео пара микрофонов. А еще, как сказано в работе [38], нужен ненаправленный микрофон для передачи общего акустического фона и микрофоны для индивидуальной записи отдельных инструментов или нескольких групп инструментов. Но многомикрофон-
Компьютерному музыканту о звуке ______________________________ 41
ная технология в наши дни применяется не так часто, как раньше: пожалуй, лишь при записи оркестров, театральных постановок, т. е. в тех случаях, когда необходимо обеспечить высокую верность воспроизведения имеющегося звукового материала с сохранением естественной акустики помещения.
Основу современной технологии записи голосов певцов и акустических музыкальных инструментов составляет монофоническая запись с последующим расщеплением моносигнала на два канала и применением различных эффектов: задержки сигнала, реверберации и т. д. — в целях получения эффекта распределения источников звука по стереопанораме. Эти и им подобные операции выполняются с помощью специального дорогостоящего студийного оборудования, но их может проделать и компьютер, оснащенный звуковой картой и звуковым редактором. Если вы сомневаетесь в реальности получения стереозаписей такого рода с помощью единственного микрофона, обратите внимание на многочисленные музыкальные видеоклипы. Аппаратура студии звукозаписи имеет столь привлекательный вид, что приобрела не только техническую но и эстетическую ценность. Редкий певец или композитор откажет себе в удовольствии поместить в клип кадры, снятые непосредственно в студии. Вот и припомните, сколько микрофонов размещено, например, перед поющими в студии (разумеется, не одновременно) И. Аллегровой или А. Апиной? Большой, красивый, с защитой от любых вибраций, дорогой, но... один.
В наши дни несколько трансформировались художественные цели, которые ставят перед собой творцы музыкальных произведений, записанных и тиражированных на современных носителях. На второй план ушло стремление к точности передачи звуковой атмосферы зала и голоса певца. Появились технические возможности для того, чтобы получить из исходного аудиоматери-ала звук, обладающий почти любыми заранее заданными свойствами.
Таким образом, наличие только одного микрофонного входа у звуковой карты не препятствует дополнению композиций, исполненных MIDI-инструмен-тами, стереофоническими записями вокала и акустических инструментов.
Правда, иногда для качественной записи требуется не менее двух монофонических микрофонов. Примерами тому могут служить запись певца, аккомпанирующего себе на гитаре, и запись партии акустической ударной установки. Положение не такое уж и безвыходное, как может показаться. У всех звуковых карт, кроме монофонического микрофонного входа, имеется стереофоническая пара линейных входов. В типовом варианте они служат для подачи на звуковую карту стереосигнала от таких внешних источников, как магнитофон или CD-плейер. Непосредственно подключить микрофоны к ним нельзя, так как чувствительность этих входов недостаточна для восприятия относительно слабых электрических сигналов с выхода микрофона. Но к каждому из этих входов может быть подключен или микрофонный усилитель, или внешний микшер, содержащий микрофонные усилители. В этом случае число микрофонов ограничено лишь числом
каналов микшера, что позволит вам осуществить настоящую стереозапись с помощью пары микрофонов.
Работа звукооператора — это настоящее творчество и даже искусство. Не все здесь можно объяснить с позиции физики. На результат влияют слишком уж много факторов, учесть которые очень трудно. Поэтому расценивайте материал, посвященный микрофонам, как средство предотвращения грубых ошибок, основу для размышлений и приобретения личного опыта.
1.2.3. Подключение электрогитары к звуковой карте
Мысль написать этот маленький параграф возникла у нас после общения с несколькими самодеятельными музыкантами, выступающими в составе рок-группы. Как оказалось, эти ребята хотели бы использовать в своем творчестве компьютер, но, непременно, сочетая MIDI-КОМПОЗИЦИИ с записью партий в исполнении электрогитар. Они задали нам довольно много вопросов, ответы на которые содержатся на страницах этой книги. А самый первый и самый несложный вопрос касался того, каким образом подключить электрогитару к звуковой карте.
Частично ответом на этот вопрос можно считать материал о подключении микрофона к звуковой карте. Выходное напряжение некоторых электрогитар сравнимо с выходным напряжением микрофона, поэтому они могут быть подключены у. микрофонному входу звуковой карты. Если при этом не слышны искажения, вызванные ограничением амплитуды из-за перегрузки микрофонного входа, то все в порядке. Если нелинейные искажения заметны, подключать такую гитару к микрофонному входу нельзя. Для гитар с большим уровнем сигнала на выходе (содержащих встроенные предварительные усилители), так же как и для гитар, к которым подключены педали, управляющие различными эффектами, существуют другие способы подключения к звуковой карте.
Мы уже говорили, что у рассматриваемых в качестве примера звуковых карт семейства AWE имеется линейный стереовход. Это еще одна возможность подключения одной гитары со стереофоническим выходом или двух монофонических гитар. Разъем линейного входа [Jack) размещен на задней планке звуковой карты. Для подключения электрогитары к линейному входу карты ее сигнальный шнур должен оканчиваться штекером, идентичным штекеру головных телефонов, подключаемых к обычному плейеру.
Существует дополнительная (правда, не очень удобная) возможность подключения еще двух электрогитар к звуковой карте. Речь идет об аудиовходах для подключения CD-ROM. Неудобство заключается в том, что этот разъем размещен на плате звуковой карты и находится внутри корпуса компьютера. Чувствительность этого входа того же порядка, что и чувствительность линейного. По каждому из перечисленных четырех входов в микшере звуковой карты имеется отдельная регулировка уровня входного сигнала.
Если гитара подключена к звуковой карте, нет особого смысла использовать различные приставки к гитаре (педали, гитарные процессоры), вносящие дополнительные помехи. Все эффекты, которые можно создать с помощью них, и еще огромное количество других можно получить, обрабатывая не искаженный ничем серебряный звон гитарных струн средствами звукового редактора.
В частности, рассматриваемый в гл. 2 музыкальный редактор Cool Edit, наряду с сотнями разновидностей других эффектов, реализует и чисто гитарный эффект Distortion. Гитаристы знают, что сущность этого эффекта заключается в ограничении амплитуды сигнала. Колебания принимают почти прямоугольную форму, звучание становится длительным, амплитуда практически не изменяется на всем протяжении единожды извлеченного звука. В приставках к гитарам при реализации этого эффекта идут на различные схемотехнические ухищрения, чтобы сгладить неустранимый недостаток — сильные искажения, “скрежет” в последней фазе звучания струны, когда амплитуда сигнала становится сравнимой с шумами и фоном. Эффект Distortion, реализованный в звуковом редакторе, полностью свободен от этого недостатка.
1.2.4. Микшер звуковой карты
Возможно, до подключения внешнего микшера с целью увеличения числа сигнальных входов звуковой карты дело у вас дойдет не очень скоро. А вот микшером, встроенным в звуковую карту, придется пользоваться частенько. О нем сейчас и пойдет речь, но не сразу, а после того, как мы уясним, что в процессе работы с компьютерной музыкой приходится использовать микшеры двух разновидностей: виртуальные и аппаратные.
Виртуальные микшеры существуют в виде составных частей музыкальных редакторов. Суть работы этих микшеров сводится к преобразованию ваших манипуляций мышью в соответствующие MIDI-сообщения или команды, запускающие подпрограммы математической обработки записанных аудиодан-ных. Число каналов в таких микшерах практически не ограничено. Особенности работы с виртуальным микшером одного из музыкальных редакторов мы рассмотрим ниже.
Сейчас же речь пойдет о микшере, реализованном аппаратным путем. Подобные узлы, незначительно отличающиеся друг от друга, имеются в каждой звуковой карте. Как мы и предупреждали, в качестве основы для анализа взята звуковая карта семейства Sound Blaster AWE. Возможности аппаратного микшера звуковой карты следующие:
)•• раздельная регулировка уровней сигналов, поступающих на монофонический микрофонный и стереофонический линейный входы, а также вход для подключения CD-плейера;
> раздельная регулировка уровней стереосигналов с выходов устройств проигрывания MIDI- и WAVE-файлов, а также с программно реализованного в SB AWE64 дополнительного WT-синтезатора;
^ раздельная регулировка тембра по низким и высоким частотам (многие считают наличие этих регулировок недостатком SB AWE, так как велика вероятность того, что вы можете забыть вернуть регуляторы тембра в нейтральное положение, и запись будет выполнена с частотными искажениями);
> общая регулировка уровня суммарного звукового сигнала, поступающего на линейный выход звуковой карты (Master);
> общая регулировка уровня звукового сигнала, поступающего к динамику PC (весьма бесполезная возможность, которая годится лишь для управления громкостью звука метронома музыкального редактора, если вы направили его в динамик PC);
> раздельные регулировки стереобаланса для всех звуковых источников и выходов за исключением микрофона и спикера.
Следует сразу же оговориться, что использовать аппаратный микшер можно только для предварительной установки тех или иных параметров. Его применению в процессе собственно записи препятствует недостаточное количество уровней квантования регулируемых с его помощью величин. Поэтому регулировка громкости в процессе воспроизведения, например, компакт-диска будет осуществляться скачками. Заметим, что ничего подобного при работе с виртуальными микшерами звуковых редакторов (на той же самой звуковой карте) не происходит. Однако без аппаратного микшера все равно не обойтись.
Для управления микшером служат специальные программы. Они могут немного отличаться друг от друга по внешнему виду панели управления, но суть у всех одна и та же. Поэтому рассмотрим одну из наиболее популярных подобных программ — Creative Mixer. Программа поставляется вместе со звуковыми картами фирмы Creative Labs. Запустив программу, вы увидите изображение панели микшера, показанное на рис. 1.13.
Слева направо расположены: кнопки управления режимом отображения элементов микшера; регулятор уровня суммарного сигнала на выходе звуковой карты; регулятор тембра высоких частот; регулятор тембра низких частот;
Рис. 1.13. Вид панели управления аппаратного микшера
регулятор уровня громкости сигнала с выхода ЦАП; регулятор уровня громкости сигнала с выхода синтезатора; регуляторы уровней громкости и реверберации при генерации звука программно реализованным синтезатором, имеющимся только в SB AWE64 и SB AWE64 Gold (дополнительные 32 голоса);
регулятор уровня воспроизведения сигнала с CD-плейера; регулятор уровня сигнала, поступающего с линейного стереовхода; регулятор уровня сигнала, поступающего с микрофонного входа; регулятор громкости громкоговорителя PC. Под всеми регуляторами уровней (кроме трех) находятся горизонтально перемещающиеся движки регуляторов стереобаланса. Над каждым из регуляторов уровня расположены кнопки, с помощью которых можно подключить или отключить соответствующий сигнал (довольно часто случайное нажатие этих кнопок служит основанием для паники и подозрений на неработоспособность звуковой карты). Правую часть микшера занимает окно, имитирующее многофункциональный жидкокристаллический индикатор. Для того чтобы он “ожил”, следует нажать на расположенную под ним правую кнопку.
Рис. 1.14. Отображение уровней сигналов
При этом возможны три основных режима отображения информации: отображение уровней суммарных сигналов в правом и левом каналах (рис. 1.14);
отображение осциллограммы суммарного сигнала (рис. 1.15); отображение спектра мощности (рис. 1.16).
Рис. 7.75. Отображение осциллограммы сигнала
Режимы переключаются щелчком левой кнопкой мыши по полю индикатора. В последнем режиме существует три варианта отображения информации:
распределение по частотам мгновенных, пиковых и комбинации мгновенных и пиковых значений мощности. Переключение производится щелчком мыши по кнопкам с цифрами 1, 2, 3.
Рис. 1.16. Отображение спектра мощности
Заметим, что использовать индикаторную панель в процессе записи в звуковых редакторах не следует.
С помощью кнопок, находящихся в левой части панели, можно оптимизировать площадь, занимаемую микшером на экране.
Верхняя кнопка сворачивает панель. Следующая за ней — минимизирует, превращая его в иконку.
Третья кнопка оставляет на экране только регуляторы, необходимые при записи (рис. 1.17).
Рис. 1.17.
Микшер с регуляторами уровней
записываемых сигналов
При нажатии кнопки, помеченной символом “волна”, можно убрать окно индикатора. На рис. 1.18 показан вид микшера без индикатора.
Рис. 1.18. Микшер без окна индикатора
Третья снизу кнопка позволяет оставить изображение только одного регулятора, как это показано на рис. 1.19.
Рис. 1.19. Микшер с единственным регулятором
Щелчком по правой верхней кнопке панели управления микшера, изображенной на рис. 1.19, можно вызвать дополнительную панель (рис. 1.20), с помощью которой выбрать отображаемый регулятор.
Рис. 1.20. Панель выбора отображаемого регулятора
При нажатии нижней кнопки микшера (рис. 1.13) в панели будет отображаться максимальное число элементов.
Вторая снизу кнопка позволяет отображать только те элементы микшера, которые определены пользователем. Для выбора пользовательского варианта отображения служит всплывающее меню (рис. 1.21), вызываемое правой кнопкой мыши.
Рис. 1.21.
Всплывающее меню установок
пользователя
В подменю View (рис. 1.22) можно выбрать один из вариантов отображения панели управления микшера.
Рис. 1.22. Подменю View
При выборе команды Preferences (предустановки) в меню на рис. 1.21 открывается одноименное окно диалога (рис. 1.23), в котором можно определить набор отображаемых элементов микшера.
Рис. 1.23. Окно диалога Preferences
для выбора отображаемых элементов микшера
Если в меню (см. рис. 1.21), выбрать команду Input/Output Settings, откроется окно диалога (рис. 1,24), с помощью которого можно изменить уровень максимального усиления по входу и выходу для левого и правого каналов. Делается это путем выбора коэффициентов умножения в пределах от 1 до 4. Для сбалансированных по уровню громкости источников звуковых сигналов коэффициенты для левого и правого каналов должны быть одинаковыми. Различными их можно сделать только в том случае, когда уровень сигнала в одном из каналов оказывается значительно меньше, чем в другом. Эта ситуация может встретиться, например, при реставрации записи, выполненной на магнитофоне, в котором лента неравномерно прилегала к магнитной головке.
Рис. 1.24.
Окно диалога для выбора
коэффициентов усиления
Включение опции Microphone Gain Control приводит к увеличению коэффициента усиления по микрофонному входу.
Мы рассмотрели практически все возможности по трансформации отображения элементов микшера. Осталось лишь сказать, что при включении опции Always on Top меню на рис. 1.21 панель Creative Mixer всегда будет расположена поверх окон других приложений. Последние две команды этого меню позволяют вызвать интерактивную подсказку Help и получить сведения о версии программы.
Детальное знакомство с микшером звуковой карты позволяет сделать вывод о том, что его использование возможно только на первом этапе записи для ориентировочной установки уровней сигналов. Для тонкой регулировки гром-
кости и панорамы следует использовать возможности ЦАП, АЦП и синтезаторов звуковой карты, воздействуя на эти устройства средствами, имеющимися в составе музыкальных и звуковых редакторов.
1.2.5. Сэмплирование
Детальному анализу способов сэмплирования посвящена гл. 3. Сейчас же наша задача состоит лишь в том, чтобы уяснить смысл этого слова.
Сэмплирование — это запись образцов звучания (сэмплов) того или иного реального музыкального инструмента. Сэмплирование является основой волнового синтеза (WT-синтеза) музыкальных звуков. Если при частотном синтезе (FM-синтезе) новые звучания получают за счет разнообразной обработки простейших стандартных колебаний, то основой WT-синтеза являются заранее записанные звуки традиционных музыкальных инструментов или звуки, сопровождающие различные процессы в природе и технике. С сэмплами можно делать все, что угодно. Можно оставить их такими, как есть, и WT-синтезатор будет звучать голосами, почти неотличимыми от голосов инструментов-первоисточников. Можно подвергнуть сэмплы модуляции, фильтрации, воздействию эффектов и получить самые фантастические, неземные звуки.
В принципе, сэмпл — это ни что иное, как сохраненная в памяти синтезатора последовательность цифровых отсчетов, получившихся в результате анало-го-цифрового преобразования звука музыкального инструмента. Если бы не существовала проблема экономии памяти, то звучание каждой ноты можно было бы записать в исполнении каждого музыкального инструмента. А игра на таком синтезаторе представляла бы собой воспроизведение этих записей в необходимые моменты времени. Но если идти по такому пути, то пришлось бы хранить в памяти множество вариантов звучания каждой ноты, причем все они должны отличаться протяженностью звучания, динамикой звукоизв-лечения и т. д. На это не хватит никакого объема памяти. Поэтому сэмплы хранятся в памяти не в том виде, в каком они получаются сразу же после прохождения АЦП. Запись подвергается хирургическому воздействию, делится на характерные части [фазы): начало, протяженный участок, завершение звука. В зависимости от применяемой фирменной технологии эти части могут делиться на еще более мелкие фрагменты. В памяти хранится не вся запись, а лишь минимально необходимая для ее восстановления информация о каждом из фрагментов. Изменение протяженности звучания производится за счет управления числом повторений отдельных фрагментов.
В целях еще большей экономии памяти был разработан способ синтеза, позволяющий хранить сэмплы не для каждой ноты, а лишь для некоторых. В этом случае изменения высоты звучания достигается путем изменения скорости воспроизведения сэмпла.
Для создания и воспроизведения сэмплов служит синтезатор. В наши дни синтезатор конструктивно реализован в одном-двух корпусах микросхем,
которые представляет собой специализированный процессор для осуществления всех необходимых преобразовании. Из закодированных и сжатых с помощью специальных алгоритмов фрагментов он собирает сэмпл, задает высоту его звучания, изменяет в соответствии с замыслом музыканта форму огибающей колебания, имитируя либо почти неощутимое касание, либо удар по клавише или струне. Кроме того, процессор добавляет различные эффекты, изменяет тембр с помощью фильтров и модуляторов.
В звуковых картах находят применение несколько синтезаторов различных фирм. В гл. 3 мы подробно рассмотрим наиболее распространенный в наши дни синтезатор EMU8000. Популярность этого устройства не случайна. Достаточно высокое качество работы сочетается в нем с относительно небольшой ценой. О перспективности EMU8000 свидетельствует тот факт, что для него разработано программное обеспечение, позволяющее не только эксплуатировать готовые сэмплы, но и создавать свои собственные.
Отметим, что наряду с сэмплами, записанными в ПЗУ звуковой карты, в настоящее время стали доступными наборы сэмплов (банки), созданные как в лабораториях фирм, специализирующихся на синтезаторах, так и любителями компьютерной музыки. Эти банки можно найти на многочисленных лазерных дисках и в Internet.
1.2.6. Компрессия и шумоподавление
Рассматривая требования к АЦП и ЦАП звуковой карты, мы уже коснулись двух проблем: борьбы с искажениями и борьбы с шумами. Эти проблемы тесно связаны друг с другом.
Конечно, природа искажений многообразна. В тракте запись-передача-воспроизведение звук подвергается амплитудным, частотным, фазовым и нелинейным искажениям. Сейчас речь пойдет о компрессии динамического диапазона сигнала, как о способе борьбы с нелинейными искажениями, вызванными ограничением амплитуды звуковых колебаний из-за перегрузки элементов звукового тракта. Причина возникновения таких искажений заключается в несоответствии динамических диапазонов звукового сигнала и аппаратуры, по которой этот сигнал проходит. Если бы звуковой сигнал можно было заранее проанализировать, выявить те фрагменты, где он достигает максимумов, то, в принципе, перегрузку тракта можно было бы исключить. Для этого достаточно было бы так отрегулировать уровень сигнала, поступающего, например, от микрофона, чтобы даже пиковые его уровни находились в пределах динамического диапазона. Правда, здесь имеется сразу два “но”.
Во-первых, нужно заранее знать закон изменения уровня громкости сигнала, что возможно только после предварительной его записи. Но записанный сигнал уже будет с одержать искажения, вызванные той самой перегрузкой, с которой мы хотим бороться... Хорошо, тогда можно уменьшить уровень
записи так, чтобы даже при самых сильных “всплесках” громкости не происходило бы перегрузки. Вот здесь-то и появляется второе “но”. Но тогда большая часть записи будет слишком тихой, настолько тихой, что самые слабые звуки просто не будут слышны, они сольются с шумами электронных приборов и носителя записи сигнала. Именно здесь и пересекаются проблемы борьбы с шумами и перегрузками.
За много лет до того, как впервые прозвучало словосочетание “звуковая карта”, аналогичные проблемы были вынуждены решать разработчики магнитофонов, аппаратуры озвучивания кинофильмов, а затем и вообще звуко-усилительных устройств студий и концертных залов. В результате настойчивых изысканий было предложено несколько способов решения проблемы, которые отличаются деталями, но имеют общую сущность. Идея очень проста, и может быть выражена буквально одной фразой: для того чтобы не происходило ни перегрузки тракта сильными сигналами, ни маскирования слабых сигналов шумами, следует слабые сигналы усиливать, а сильные ослаблять, т. е. сужать динамический диапазон.
Сужение динамического диапазона перед записью сигнала обеспечивает прибор, называемый компандером. При воспроизведении записи для восстановления прежнего динамического диапазона используют прибор, носящий название экспандер.
В рамках общей идеи шумоподавления придумано много конкретных методов и устройств, отличающихся друг от друга деталями. Некоторые методы предполагают деление всего спектра сигнала на несколько диапазонов и раздельную регулировку уровня различных спектральных составляющих. Методы отличаются и алгоритмами вычисления пороговых уровней, после сравнения с которыми вырабатывается решение о том или ином преобразовании сигнала.
Так, например, наиболее распространенная система шумопонижения типа Dolby А позволяет существенно улучшить эффективность магнитных и оптических носителей аналоговых записей и систем связи, служащих для передачи звуковых программ [78]. Система Dolby А основана на принципе компан-дирования, но только для сигналов низкого уровня и раздельно в четырех частотных поддиапазонах. В каждом из поддиапазонов определяется общий уровень частотных составляющих сигнала. Если он оказывается ниже порогового значения, то в процессе записи сигнал усиливается, а при воспроизведении, наоборот,ослабляется.
Система Dolby А базируется на полученном экспериментально так называемом спектральном окне аналоговой ленты. Вид спектрального окна представлен на рис. 1.25.
По сути, на рисунке наглядно представлена область допустимых значений уровней спектральных составляющих звукового сигнала в зависимости от их частот. Закрашенная область в нижней части рисунка соответствует собственным
Рис. 1.25. Спектральное окно аналоговой магнитной ленты
шумам ленты. Закрашенная область в верхней части рисунка — область значительных нелинейных искажений. При записи сигнала, используя систему шумоподавления, следует стремиться к тому, чтобы значения спектральных составляющих находились в незакрашенной области рисунка.
Поскольку ныне применяются цифровые носители записи, практически свободные от того, что принято называть собственными шумами, изменяются и подходы к шумоподавлению. На первый план теперь выдвигаются ограничения, обусловленные не свойствами материала носителя записи, а особенностями слухового аппарата человека. Новая система шумопонижения Dolby SR, основанная на так называемом принципе наименьшего воздействия, учитывает не только спектральное окно носителя, но и окно слышимости человека, представленное на рис. 1.26.
Верхняя граница окна соответствует оглушительному звуку, соседствующему с болевым ощущением. Нижняя граница определяется порогом слышимости.
Алгоритмы обработки звука строятся с таким расчетом, чтобы максимально ослабить те шумы, которые попадают в окно слышимости, и игнорировать шумы, которые не слышны человеку.
В условиях студийной звукозаписи непосредственно с микрофона сигнал попадает в устройства обработки, ограничивающие его динамический диапазон. Поэтому перегрузка элементов звукового тракта практически исключена.
Если микрофон подключен ко входу звуковой.карты, то она оказывается совершенно незащищенной от опасности перегрузки. Делать нечего. Остается только воспитывать исполнителей, не устанавливать микрофон слишком близко к источнику звука и занижать уровень входного сигнала регулятором микшера.
Утешает только то, что звуковой редактор Cool Edit, который будет рассмотрен в гл. 2, в определенной степени позволит снизить зафиксированные в записи искажения. Дело в том, что в нем программно реализованы такие совершенные методы обработки сигнала (в частности сжатия динамического диапазона и шумоподавления), какими располагают далеко не все специализированные электронные устройства. Например, при наличии резких выбросов сигнала, вызванных импульсными помехами или случайными перегрузками микрофона, программа поможет вам заранее обнаружить эти аномалии и либо удалить их, либо плавно изменить уровень сигнала в районе выброса. Вы будете иметь возможность произвольно измененять мышью амплитудную характеристику компрессора динамического диапазона. Участки фонограммы, свободные от записи полезного сигнала, можно будет заменить “абсолютной тишиной”. Кроме того, используя алгоритмы спектральных преобразований с целью снижения заметности шумов, вы сможете на практике использовать информацию о спектральных окнах, приведенных на рис. 1.25 и 1.26.
1.2.7. Фильтрация
Если в двух словах попытаться дать определение слову “фильтрация”, то оно будет выглядеть примерно так: фильтрация — это процесс обработки электрического звукового сигнала частотно-избирательными устройствами с целью изменения спектрального состава (тембра) сигнала. Задачами такой обработки могут быть:
> амплитудно-частотная коррекция сигнала (усиление или ослабление отдельных частотных составляющих);
^ полное подавление спектра сигнала или шумов в определенной полосе частот.
Например, если микрофон, акустическая система или еще какой-либо элемент звукового тракта имеют неравномерную амплитудно-частотную характеристику, то с помощью фильтров эти неравномерности могут быть сглажены. Если в результате анализа спектра выяснилось, что в некоторой области частот энергия помехи значительно превышает энергию сигнала, то посредством фильтрации все колебания в этом диапазоне частот можно подавить.
Для осуществления фильтрации созданы самые различные устройства: отдельные корректирующие и формантные фильтры, устройства для разделения звука на несколько, каналов по частотному признаку (кроссоверы), двухполосные и многополосные регуляторы тембра (эквалайзеры). При аппаратной реализации фильтров их создают либо на основе колебательных звеньев, состоящих из катушек индуктивности и конденсаторов, либо на основе их аналогов, так называемых гираторов. представляющих собой операционные усилители, охваченные особого типа обратными связями.
Основой фильтров, реализованных программным путем в составе звуковых редакторов, служит спектральный анализ. Как известно, любой реальный сигнал может быть представлен в виде набора коэффициентов разложения в ряд по гармоническим (синусоидальным и косинусоидальным) функциям. Фильтрация сводится к умножению спектральных коэффициентов на соответствующие значения передаточной функции фильтра. Если спектр представлен в комплексной форме, то сигнал описывается совокупностью амплитудного и фазового спектров (АС и ФС), а фильтры — амплитудно-частотными и фазочастотными характеристиками (АЧХ и ФЧХ). АЧХ представляет собой зависимость коэффициента передачи фильтра от частоты. ФЧХ отражает сдвиг фазы выходного сигнала по отношению к входному в зависимости от частоты. В этом случае фильтрация эквивалентна умножению АС на АЧХ и алгебраическому сложению ФС с ФЧХ.
Классический спектральный анализ из-за наличия большого количества операций умножения требует огромных затрат процессорного времени и при значительном числе отсчетов сигнала неосуществим в реальном масштабе времени. Для сокращения времени спектрального анализа дискретных сигналов разработаны специальные алгоритмы, учитывающие наличие связей между различными отсчетами сигнала и устраняющие повторяющиеся операции. Одним из таких алгоритмов является быстрое преобразование Фурье (БПФ). С применением БПФ вы познакомитесь в гл. 2. Особенность этого алгоритма состоит в том, что он допускает не любое, а лишь строго определенное количество отсчетов сигнала.
Составной частью синтезатора звуковой карты является сигнал-процессор, который, в свою очередь, содержит цифровой фильтр. Работа этого фильтра основана на алгоритмах, подобных быстрому преобразованию Фурье. Однако за счет того, что часть операций в нем реализована аппаратным путем, фильтр может работать в реальном времени, успевая обрабатывать синтезируемый сигнал в темпе его генерации. Форма АЧХ фильтра изменяется программным путем, управление ею производится с помощью драйверов, поставляемых со звуковой картой, или средствами редактирования сэмп-лов. В следующих главах книги этот процесс будет подробно рассмотрен. Фильтры, о которых идет речь являются универсальными, способными изменять свои свойства таким образом, что могут быть эквивалентны любому из основных типов фильтров.
Рис. 1.27. АЧХ и ФЧХ фильтра нижних частот
В зависимости от расположения полосы пропускания на оси частот фильтры подразделяются на:
> фильтры нижних частот (ФНЧ), типичные АЧХ и ФЧХ которых показаны на рис. 1.27;
> фильтры верхних частот (ФВЧ), их АЧХ и ФЧХ показаны на рис. 1.28;
> полоснопропускающие (полосовые) фильтры (рис. 1.29);
> полоснозадерживающие (режекторные) фильтры (рис. 1.30).
Информация о характеристиках фильтров понадобится при прочтении гл. 3. На рис. 1.27—1.30 по горизонтали отложено значение частоты, а по вертикали — значения передаточных функций K(f) или фазовых сдвигов (p(f) в зависимости от частоты.
Рис. 1.28. АЧХ и ФЧХ фильтра верхних частот
Рис. 1.29. АЧХ и ФЧХ полосового фильтра
Приведенные выше характеристики являются идеализированными; реальные фильтры, строго говоря, не позволяют обеспечить равенство передаточной функции нулю. Колебания в полосе подавления, пусть и значительно ослабленные, все равно проникают через фильтр.
Весьма распространенной ошибкой при использовании фильтров для обработки сигналов является пренебрежение учетом влияния на форму сигнала фазо-частотной характеристики фильтра. Фаза важна потому, что сигнал, прошедший через фильтр без изменения амплитуды в полосе пропускания, может быть искажен по форме, если временное запаздывание при прохождении через фильтр не будет постоянным для разных частот. Одинаковое время задержки соответствует линейной зависимости фазы от частоты. Из рис. 1.27—1.30 видно, что для ФНЧ и ФВЧ зависимость фазы от частоты можно считать линейной лишь в окрестностях частот среза, а для полосового фильтра — в окрестностях резонансной (центральной) частоты.
Рис. 1.30. АЧХ и ФЧХ режекторного фильтра
Таким образом, фильтрация широкополосных звуковых колебании сопровождается фазовыми искажениями, приводящими к изменению формы фильтруемого сигнала.
1.3. Звуковые эффекты
Использование звуковых карт, плат оцифровки звука и звуковых редакторов предоставляет компьютерному музыканту довольно широкие возможности по применению в музыкальных композициях различных звуковых эффектов и приемов обработки.
Звуковые эффекты могут быть реализованы аппаратным путем, и тогда их можно использовать в реальном времени, как, например, это сделано в высококачественных звуковых картах. Для этого в их состав включены цифровые сигнальные процессоры. Цифровой сигнальный процессор (Digital Signal Processor— DSP) позволяет обрабатывать звуковые сигналы в реальном времени. В основе его принципа действия лежит аналого-цифровое преобразование сигнала с последующей обработкой, основанной на нескольких алгоритмах цифровой фильтрации и задержки [12, 13]. Правда, полноценный DSP чрезвычайно дорог, поэтому применяется только в специализированных устройствах профессионального назначения. Звуковые процессоры звуковых карт представляют собой значительно упрощенные аналоги полноценных DSP. Обычно они не позволяют использовать одновременно большое число эффектов. Кроме того, почти все эффекты реализуются, к сожалению, одновременно для всех каналов. Выбор эффектов и управление их параметрами производится по интерфейсу MIDI с помощью MIDI-манипуляторов. В составе большинства музыкальных редакторов имеется соответствующий интерфейс, позволяющий управлять манипуляторами эффектов различными способами. Чаще всего это делается путем построения графика изменения параметра эффекта. Манипулятор эффекта может быть также связан с одним из регуляторов виртуального микшера, входящего в состав музыкального редактора.
В компьютерных студиях звуковые эффекты часто создаются программным способом. Реализация эффектов и управление ими осуществляется с помощью звуковых редакторов. Обработке подвергается заранее записанный в цифровой форме звуковой сигнал. Недостатком программной реализации звуковых эффектов является невозможность их использования в реальном времени, в процессе записи. Достоинство заключается в том, что отказ от обработки в реальном времени позволяет применять самые сложные и требующие больших временных затрат алгоритмы, поэтому число различных звуковых эффектов и число вариаций каждого эффекта в этом случае значительно превышает то, что достижимо при аппаратной реализации. Кроме того, имеется возможность практически неограниченного вложения эффектов один в
другой. Предел устанавливается не техническими (точнее, не математическими) возможностями, а здравым смыслом и эстетическими критериями. О том, как воспользоваться звуковыми эффектами, имеющимися в распоряжении одного из самых популярных звуковых редакторов, мы расскажем в гл. 2. Сначала нужно получить хотя бы начальные представления о сущности основных звуковых эффектов.
1.3.1. Вибрато
В самом общем смысле суть эффекта вибрато заключается в периодическом изменении одного из параметров звукового колебания: амплитуды, частоты или фазы. Изменение (колебание) параметра происходит с очень малой частотой — единицы герц. Различают амплитудное, частотное и фазовое вибрато. В любом случае результатом является обогащение спектра исходного колебания. Читатели, знакомые с основами радиотехники, понимают, что, по сути дела, происходит модуляция звукового колебания низкочастотным сигналом. Законы физики неумолимы — спектр сигнала при этом действительно расширяется.
Кроме того, имеется еще и тембровое вибрато, о котором мы поговорим чуть позже.
Как и многие другие электронные звуковые эффекты, вибрато имеет свои естественные прототипы, уходящие корнями в народную и классическую инструментальную и вокальную музыку.
Владение приемом вибрато отличает очень хорошего певца от просто хорошего. Скрипка в руках талантливого музыканта потому и звучит так божественно, что, совершая едва заметные перемещения прижимающими струны пальцами вдоль грифа, он осуществляет частотное вибрато. Частотное вибрато — причина необычайно задушевного голоса балалайки при исполнении лирических мелодий. Тремоло (частный случай амплитудного вибрато) является основным приемом игры на мандолине, домре и балалайке.
Первоначально словом “вибрато” именовалась модуляция любого параметра звукового колебания. Но со временем некоторые из разновидностей этого эффекта получили свое название. Во многих публикациях по электронной музыке теперь под вибрато подразумевают только вибрато частотное. На наш взгляд это не совсем верно, следует различать амплитудное вибрато, частотное вибрато и тембровое вибрато. У фазового вибрато имеется специальное название — фейзер (от англ. Phaser — фазовариатор).
Амплитудное вибрато и тремоло
Амплитудное вибрато включает в себя собственно амплитудное вибрато и тремоло. Сущность амплитудного вибрато состоит в периодическом изменении амплитуды звукового сигнала. Частота, с которой это происходит, должна быть очень небольшой (от долей герц до 10—12 Гц). Если частота вибра-
то находится вне этих пределов, то необходимый эстетический эффект не достигается.
Тембр сигнала с амплитудным вибрато богаче по сравнению с тембром исходного сигнала. С таким спектром можно проделывать различные манипуляции, например, изменять уровни спектральных составляющих с помощью фильтров.
Степень проявления эффекта характеризуется глубиной вибрато: m = ДЗ/S, где Д5 — максимальное изменение амплитуды сигнала с вибрато, S — амплитуда исходного сигнала. Диапазон допустимых значений глубины вибрато составляет от 0 до 1, а оптимальная с точки зрения художественного результата частота амплитудного вибрато — б—8 Гц.
Особой разновидностью амплитудного вибрато является тремоло. Отличительными признаками тремоло являются относительно высокая частота вибрации (10—12 Гц), максимальная глубина эффекта (m = 1) и импульсная форма результирующего сигнала.
В аналоговых устройствах амплитудное вибрато реализуется с помощью перемножителей сигналов. Существует множество различных принципиальных схем устройств вибрато [15, 16, 48, 100]. Основная проблема аналоговых устройств — неполное подавление управляющего сигнала. При большой глубине вибрато это проявляется в виде ясно прослушивающегося стука с частотой модуляции.
Компьютерные музыканты встретятся с двумя вариантами реализации амплитудного вибрато: аппаратным и программным. Аппаратный способ предполагает наличие в структуре звуковой карты усилителей с управляемым коэффициентом усиления. Программный способ заключается в перемножении значений цифровых отсчетов звуковых колебаний со значениями отсчетов функции (обычно синусоидальной), описывающей управляющий сигнал.
При обработке вокальных партий амплитудным вибрато нужно пользоваться очень осторожно, глубина его не должна быть большой, а применение тремоло совсем недопустимо.
Частотное вибрато
Суть частотного вибрато заключается в периодическом изменении частоты звукового колебания.
В электронной музыке частотное вибрато получило широкое распространение лишь после создания электронных музыкальных инструментов. Реализовать этот эффект на адаптеризированных акустических инструментах довольно сложно. Правда, в период расцвета вокально-инструментальных ансамблей (ВИА) появились соло-гитары, конструкции которых предоставили такую возможность. Натяжение всех струн можно одновременно изменять с помощью специального механизма — подвижной подставки для крепления струн и рычага. Частотное вибрато здесь исполняется вручную.
Реализация частотного вибрато в электромузыкальных инструментах и синтезаторах проста и естественна. Работу всех узлов электронных музыкальных синтезаторов как аппаратных, так и реализованных программным путем, синхронизирует опорный генератор. Если изменять его частоту, то будут изменяться частоты и всех синтезируемых колебаний. В радиотехнике этот процесс называется частотной модуляцией. Если изменение частоты производится по периодическому закону, то в результате получается частотное вибрато. По существу, при частотном вибрато также расширяется спектр исходного сигнала, причем тембр периодически изменяется во времени.
Красивое звучание получается только в том случае, когда глубина частотного вибрато (относительное изменение частоты звука) невелика. Как известно, в соответствии с хроматической гаммой введена единица музыкальных интервалов, в 1200 раз меньшая, чем октава — цент [II]. Интервал между соседними полутонами в темперированной гамме равен в точности 100 центам. Колебание высоты тона при частотном вибрато не должно превышать нескольких десятков центов. В противном случае, создается впечатление нарушения строя инструмента.
Частотное вибрато используется и само по себе, и входит в качестве составной части в более сложные звуковые эффекты.
С точки зрения технической реализации очень близким к частотному вибрато является эффект (точнее говоря, исполнительский прием) глиссандо. При игре, например, на фортепиано этот прием означает скольжение одного или нескольких пальцев по клавишам. В электронной музыке под глиссандо понимают перестройку высоты взятых нот. Диапазон перестройки может достигать интервала, превышающего октаву. Ручным регулятором изменяют или напряжение, или цифровой код, которые, в свою очередь, управляют частотой опорного генератора. В электронных музыкальных синтезаторах и MIDI-клавиатурах для исполнения глиссандо имеется специальный орган управления — колесо или рукоятка, а стандартом MIDI предусмотрено специальное сообщение — Pitch Bend Change, передаваемое при изменении состояния манипуляторов высоты тональной перестройки. Эти средства позволяют, в отличие от первых ЭМИ, выполнять не только глиссандо, но и ручное (иногда говорят — пальцевое) частотное вибрато. Закон колебания высоты звука подчиняется воле исполнителя, и эффект перестает быть механическим и монотонным.
Раз уж мы затронули вопрос перестройки высоты тона, то уместно будет упомянуть, что музыкальные редакторы позволяют производить точное изменение строя синтезируемых инструментов и транспонирование на любой интервал как голосов инструментов, записанных на отдельных треках, так и всей музыкальной композиции. Звуковые редакторы способны проделывать аналогичные операции в отношении не только музь1кальных'инструментов, но и записанных голосов вокалистов.
Тембровое вибрато
Эффект тембрового вибрато также предназначен для изменения спектра звуковых колебаний. Физическая сущность этого эффекта состоит в том, что исходное колебание с богатым тембром пропускается через полосовой частотный фильтр, у которого периодически изменяется либо частота настройки, либо полоса пропускания, либо по различным законам изменяются оба параметра. При этом фильтр выделяет из всего спектра исходного колебания те частотные составляющие, которые попадают в “мгновенную” полосу его пропускания. Так как полоса пропускания изменяется по ширине и перемещается по частоте, то тембр сигала периодически изменяется.
Кроме автоматического тембрового вибрато, используют еще и ручное (чаще даже “ножное” — с управлением от педали). Такой вариант эффекта известен под названиями “Вау-вау” или “квакушка”.
Необыкновенно красиво звучит электрогитара, сигнал которой пропущен через блок тембрового вибрато, если цикл перестройки фильтра синхронизирован с моментом возникновения колебания струны. Звук каждого очередного аккорда перетекает от одного края своей спектральной области до другого.
Тембровое вибрато имеется в арсенале средств звуковых редакторов.
Если звуковая карта содержит перестраиваемые резонансные фильтры или хотя бы фильтры нижних частот с перестраиваемой частотой среза, то этот эффект может быть реализован и аппаратным способом в реальном времени.
1.3.2. Эффекты, основанные на задержке сигналов
Дилэй
Дилэй (Delay) в переводе означает “задержка”. Необходимость в этом эффекте возникла с появлением стереофонии. Сама природа слухового аппарата человека предполагает в большинстве ситуаций поступление в мозг двух звуковых сигналов, отличающихся временем прихода. Если источник звука находится “перед глазами”, на перпендикуляре, проведенном к линии, проходящей через уши, то прямой звук от источника достигает обоих ушей в одно и то же время. Во всех остальных случаях расстояния от источника до ушей различны, поэтому либо одно, либо другое ухо воспринимает звук первым.
Проведем несложные расчеты. Время задержки (разницы во времени приема сигналов ушами) будет максимальным в том случае, когда источник расположен напротив одного из ушей. Так как расстояние между ушами около 20 см, то максимальная задержка может составлять около 8 мс. Этим величинам соответствует волна звукового колебания с частотой около 1,1 кГц. Для более высокочастотных звуковых колебаний длина волны становится меньше, чем расстояние между ушами, и разница во времени приема сигналов ушами становится неощутимой. Предельная частота колебаний, задержка
которых воспринимается человеком, зависит от направления на источник. Она растет по мере того, как источник смещается от точки, расположенной напротив одного из ушей, к точке, расположенной перед человеком.
Дилэй применяется, прежде всего, в том случае, когда запись голоса или акустического музыкального инструмента, выполненную с помощью единственного микрофона, встраивают в стереофоническую композицию. Этот эффект служит основой технологии создания стереозаписей. Подробные рекомендации по применению задержки в этих целях приведены в очень интересной серии статей [82]. Но дилэй может применяться и для получения эффекта однократного повторения каких-либо звуков. Величина задержки между прямым сигналом и его задержанной копией в этом случае выбирается большей, чем естественная задержка в 8 мс. Какая именно задержка должна быть выбрана? Ответ на этот вопрос определяется несколькими факторами. Прежде всего, следует руководствоваться эстетическими критериями, художественной целью и здравым смыслом. Для коротких и резких звуков время задержки, при котором основной сигнал и его копия различимы меньше, чем для протяженных звуков. Для произведений, исполняемых в медленном темпе, задержка может быть больше, чем для быстрых композиций,
В работе [54] представлены данные исследований, из которых следует, что при определенных соотношениях громкостей прямого и задержанного сигнала может иметь место психоакустический эффект изменения кажущегося расположения источника звука на стереопанораме. Согласитесь, что, например, скачки рояля с места на место по ходу прослушивания произведения очень трудно обосновать как с эстетических позиций, так и с точки зрения верности воспроизведения реального звучания. Как и любой эффект, дилэй нужно применять в разумных пределах и не обязательно на протяжении всей композиции.
Этот эффект реализуется с помощью устройств, способных осуществлять задержку акустического или электрического сигналов. Таким устройством сейчас чаще всего служит цифровая линия задержки, представляющая собой цепочку из элементарных ячеек—триггеров задержки. Для наших целей достаточно знать, что принцип действия триггера задержки сводится к следующему: двоичный сигнал, поступивший в некоторый тактовый момент времени на его вход, появится на его выходе не мгновенно, а только в очередной тактовый момент. Общее время задержки в линии тем больше, чем больше триггеров задержки включено в цепочку, и тем меньше, чем меньше тактовый интервал (чем больше тактовая частота). В качестве цифровых линий задержки можно использовать запоминающие устройства. Известны специальные алгоритмы адресации ячеек запоминающих устройств, обеспечивающие “скольжение” информации “вдоль” адресного пространства.
Разумеется, для применения цифровой линии задержки сигнал должен быть сначала преобразован в цифровую форму. А после прохождения его копии через линию задержки происходит обратное, цифро-аналоговое преобразо-
вание. Исходный сигнал и его задержанная копия могут быть раздельно направлены в различные стереоканалы, но могу быть и смешаны в различных пропорциях. Суммарный сигнал может быть направлен либо в один из сте-реоканалов,либо в оба.
В звуковых редакторах дилэй реализуется программным (математическим) путем за счет изменения относительной нумерации отсчетов исходного сигнала и его копии.
Возможны такие, например, разновидности задержки, при которых формируются несколько копий сигнала, задержанных на различное время.
Флэнжер и фэйзер
В основу звуковых эффектов флэнжер (Flanger) и фэйзер (Phaser) также положена задержка сигнала. В чем заключается отличие этих эффектов от дилэя?
Как мы уже сказали, дилэй имитирует эффект неодновременного восприятия мозгом человека звуковых сигналов, поступающих в уши. Эффект повторного звучания может быть вызван и распространением звука от источника к приемнику различными путями (например, звук может приходить, во-первых, напрямую и, во-вторых, отразившись от препятствия, находящегося чуть в стороне от прямого пути). И в том, и в другом случаях время задержки остается постоянным. В реальной жизни этому соответствует маловероятная ситуация, когда источник звука, приемник звука и отражающие предметы неподвижны относительно друг друга. При этом частота звука не изменяется, каким бы путем и в какое бы ухо он не приходил.
Если же какой-либо из трех элементов подвижен, то частота принимаемого звука не может оставаться той же, что и частота звука переданного. Это есть ни что иное, как проявление того самого эффекта Доплера, который в школьных учебниках традиционно поясняется на примере изменения высоты звучания гудка движущегося паровоза.
Итак, реальные музыкальные звуки при распространении претерпевают не только расщепление на несколько волн и различную (для каждой из них) задержку, но и неодинаковое для различных спектральных составляющих изменение частот.
И флэнжер, и фэйзер имитируют (каждый по-своему) проявления взаимного перемещения упомянутых трех элементов: источника, приемника и отражателя звука. По сути дела, и тот, и другой эффекты представляют собой сочетание задержки звукового сигнала с частотной или фазовой модуляцией. Разница между ними чисто количественная, флэнжер отличается от фейзера тем, что для первого эффекта время задержки копии (или времена задержек копий) и изменение частот, сигнала значительно большее, чем для второго. Образно говоря, флэнжер наблюдался бы в том случае, когда певец мчался бы к зрителю, сидящему в зале, со скоростью автомобиля. А вот для того, чтобы ощутить фэйзер в его, так сказать, первозданном виде, движущегося источника звука не
требуется, зрителю достаточно часто-часто вертеть головой из стороны в сторону. Читателям, страдающим головокружением или склонным к морской болезни, проводить на себе последний эксперимент не советуем.
Если же говорить серьезно, то упомянутые количественные отличия эффектов приводят и к отличиям качественным: во-первых, звуки, обработанные ими, приобретают различные акустические и музыкальные свойства, во-вторых, эффекты реализуются различными техническими средствами.
Значения времени задержек, характерных для флэнжера, существенно превышают период звукового колебания, поэтому для реализации эффекта используют многоразрядные и многоотводные цифровые линии задержки. С каждого из отводов снимается свой сигнал, который в свою очередь подвергается частотной модуляции.
Для фэйзера, наоборот, характерно очень маленькое время задержки. Оно столь мало, что оказывается сравнимо с периодом звукового колебания. При столь малых относительных сдвигах принято говорить уже не о задержке копий сигнала во времени, а о разности их фаз. Если эта разность фаз не остается постоянной, а изменяется по периодическому закону, то мы имеем дело с эффектом фейзера. Так что можно считать фейзер предельным случаем флэнжера. Но если внимательно прочитать еще раз этот абзац, то можно увидеть, что фейзер — это ни что иное, как фазовое вибрато.
Чего только не придумывали в относительно старые времена, чтобы реализовать эти эффекты [16, 22]!
Например, чтобы получить флэнжер, вместо одной акустической системы использовали несколько систем, размещенных на различных расстояниях от слушателей. В необходимые моменты производили поочередное подключение источника сигнала к акустическим системам таким образом, что создавалось впечатление приближения или удаления источника звука. Задержку звука выполняли и с помощью магнитофонов со сквозным трактом запись/ воспроизведение. Одна головка записывает, другая — воспроизводит звук с задержкой на время, необходимое для перемещения ленты от головки к головке. Для частотной модуляции особых мер можно было и не придумывать. Каждому аналоговому магнитофону присущ естественный недостаток, называемый детонацией, которая проявляется в виде “плавания” звука. Стоило чуть-чуть специально усилить этот эффект, изменяя напряжение, питающее двигатель, и получалась частотная модуляция.
Для реализации фэйзера методами аналоговой техники использовали цепочки фазовращателей, управляемых электрическим путем. А иногда можно было наблюдать и такую картину: в акустической системе, подключенной к ЭМИ или электрогитаре, вдруг начинало вращаться что-то вроде вентилятора. Звук пересекался с подвижными лопастями и отражался от них, получалась фазовая модуляция. Представляете, сколько усилий предпринималось только ради того, чтобы оживить тембр звучания инструментов! Сколько это все стоило!
Современные звуковые редакторы позволяют реализовать такое большое количество различных звуковых эффектов, что если на их число разделить сумму стоимостей компьютера, звуковой карты, программы и даже этой книги, то себестоимость одного эффекта окажется просто смешной.
Хорус
Хорус (Chorus) проявляется как эффект исполнения одного и того же звука или всей партии не одним-единственным инструментом или певцом, а несколькими.
Искусственно выполненный эффект является моделью звучания настоящего хора. В том, что хоровое пение или одновременное звучание нескольких музыкальных инструментов украшает и оживляет музыкальное произведение, сомнений, вероятно, нет ни у кого.
С одной стороны, голоса певцов и звуки инструментов при исполнении одинаковой ноты должны звучать одинаково, и к этому стремятся и музыканты, и дирижер. Но из-за индивидуальных различий источников звук все равно получается разным. В пространстве, тракте звукоусиления и в слуховом аппарате человека эти слегка неодинаковые колебания взаимодействуют, образуются так называемые биения. Спектр звука обогащается и, самое главное, течет, переливается.
Можно считать, что предельным случаем хоруса является одновременное звучание слегка отличающихся по частоте двух источников — унисон.
Унисон был известен задолго до появления синтезаторов. В основе сочного и живого звучания двенадцатиструнной гитары, аккордеона, баяна, гармони лежит унисон. В аккордеоне, например, звук каждой ноты генерируется узлом, содержащим два источника колебаний (язычка), специально настроенных в разлив — с небольшой (в единицы герц) разницей в частотах. В двенадцатиструнной гитаре звук извлекается одновременно из пары струн. Разница в частотах образуется естественным путем из-за невозможности идеально одинаково настроить струны инструмента.
Вот именно наличие этой ничтожной разницы в частотах голосов певцов или инструментов и служит причиной красивого звучания унисона (для двух голосов) или хоруса (для двух и более голосов).
В цифровых электромузыкальных инструментах, напротив, частоты пары вторичных генераторов могут быть сформированы абсолютно равными друг другу, В таком звучании отсутствует жизнь, потому что оно слишком правильное. Для оживления электронного звучания и для создания впечатления игры нескольких инструментов и используют хорус.
Существует множество разновидностей алгоритмов хоруса. Но все они имеют общие элементы:
> исходный сигнал разделяется на два или несколько каналов;
> в каждом из каналов спектр сигнала сдвигают по частоте на определенную для каждого канала величину. Частотные сдвиги очень малы, они составляют доли герца;
^- сигналы, полученные таким способом, складывают.
В итоге получается сигнал, в котором звуковые волны как бы “плывут” с разными скоростями. Один раз за время, пропорциональное произведению периодов колебаний разностных частот, сигналы складываются в фазе, и образуется “девятый вал” — максимум огибающей звуковых колебаний; один раз за это же время канальные сигналы складываются в противофазе, и получается “впадина между волнами” — минимум огибающей. В итоге образуется сигнал, спектр которого непрерывно изменяется, причем период полного цикла этого изменения столь велик, что повторяемость спектральных свойств сигнала не ощущается.
Хорус настолько украшает звучание инструментов, что ныне стал одним из эффектов, имеющихся практически в каждом синтезаторе и многих звуковых картах. Так, например, цифровой сигнальный процессор одной из лучших звуковых карт-синтезаторов Yamaha SW60XG обеспечивает более десятка вариантов хоруса. Обработка аудиосигнала звуковыми редакторами позволяет получить еще больше разновидностей этого эффекта. Вместе с тем, не следует чрезмерно увлекаться им, так как это может привести к ухудшению разборчивости звучания голоса, к “засорению” акустической атмосферы композиции.
Реверберация
Реверберация [Reverb] относится к наиболее интересным и популярным звуковым эффектам. Сущность реверберации заключается в том, что исходный звуковой сигнал смешивается со своими копиями, задержанными относительно него на различные временные интервалы. Этим реверберация напоминает дилэй. Однако при реверберации число задержанных копий сигнала может быть значительно больше, чем для дилэя. Теоретически число копий может быть бесконечным. Кроме того, при реверберации, чем больше время запаздывания копии сигнала, тем меньше ее амплитуда (громкость). Эффект зависит от того, каковы временные промежутки между копиями сигналов и какова скорость уменьшения уровней их громкости. Если промежутки междукопиями малы, то получается собственно эффект реверберации. Возникает ощущение объемного гулкого помещения. Звуки музыкальных инструментов становятся сочными, объемными, с богатым тембровым составом. Голоса певцов приобретают напевность, недостатки, присущие им, становятся малозаметными.
Если промежутки между копиями велики (более 100 мс), то правильнее говорить не об эффекте реверберации, а об эффекте “эхо”. Интервалы между
соответствующими звуками при этом становятся различимыми. Звуки перестают сливаться, кажутся отражениями от удаленных преград.
Основным элементом, реализующим эффект реверберации, является устройство, создающее эхо-сигнал.
Интересна история развития таких устройств. Первоначально радиостудии и солидные концертные залы содержали эхо-камеры. Эхо-камера представляет собой комнату с сильно отражающими стенами, в которую помещен источник звукового сигнала (громкоговоритель) и приемник (микрофон). По сути дела, такая эхо-камера является уменьшенной моделью реального зрительного зала, в котором не всегда удается создать необходимую акустическую атмосферу. В эхо-камере с трудом, но можно было в некоторых пределах управлять распределением интенсивностей и времени распространения переотраженных сигналов, устанавливая отражающие или поглощающие звук перегородки. Преимущество эхо-камеры состоит в том, что затухание звука происходит в ней естественным путем (что очень трудно обеспечить другими способами). В то время как звук продолжает реверберировать в трех измерениях, исходная волна разбивается на множество отраженных, которые достигают микрофона за уменьшающиеся промежутки времени. Недостатки эхо-камер связаны с их относительно малыми размерами, при этом вследствие собственных резонансов, о которых мы уже говорили, рассматривая вопросы применения микрофонов, спектр сигнала искажается в области средних частот. Определенную проблему представляет надежная звукоизоляция помещения эхо-камеры. Но самое главное заключается в том, что эхо-камера не может служить распространенным инструментом получения искусственной реверберации, т. к. она слишком дорога.
Наряду с эхо-камерами для имитации реверберации использовали стальные пластины, точнее, довольно большие по размеру листы. Колебания в них вводили и снимали с помощью устройств, по конструкции и принципу действия похожих на электромагнитные головные телефоны. Для получения удовлетворительной равномерности амплитудно-частотной характеристики толщина листа должна быть выдержана с точностью, которую не обеспечивают обычные технологии проката стали. Реверберация здесь была не трехмерной, а плоской. Сигнал имел характерный металлический оттенок.
В середине 60-х годов для получения эффекта реверберации стали применять пружинные ревербераторы. С помощью электромагнитного преобразователя, соединенного с одним из концов пружины, в ней возбуждались механические колебания, которые с задержкой достигали второго конца пружины, связанного с датчиком. Эффект повторения звука обусловлен многократным отражением волн механических колебаний от концов пружины. Подобные устройства устанавливали даже в некоторые бытовые сте-реорадиолы [48]. Качество звука в пружинном ревербераторе чрезвычайно низкое. Пружина воспринимает любые колебания воздуха и пола, между акустической системой и пружиной существует практически неустранимая
обратная связь, звук имеет ярко выраженную “металлическую” окраску. Время реверберации не регулируется.
На смену этим несовершенным устройствам пришли ревербераторы магнитофонные. Принцип формирования в них эхо-сигнала состоит в том, что исходный сигнал записывается на ленту записывающей магнитной головкой, а через время, необходимое для перемещения ленты к воспроизводящей головке, считывается ею. Через цепь обратной связи уменьшенный по амплитуде задержанный сигнал вновь подается на запись, что и создает эффект многократного отражения звука с постепенным затуханием. Качество звука определяется параметрами магнитофона. Недостаток магнитофонного ревербератора заключается в том, что при приемлемых скоростях протяжки ленты удается получить только эффект эха. Для получения собственно реверберации требуется либо еще сильнее сблизить магнитные головки (чего не позволяет сделать их конструкция), либо значительно увеличить скорость движения ленты.
С развитием цифровой техники и появлением интегральных микросхем, содержащих в одном корпусе сотни и тысячи цифровых триггеров (о которых мы уже говорили) появилась возможность создавать высококачественные цифровые ревербераторы. В таких устройствах сигнал может быть задержан на любое время, необходимое как для получения реверберации, так и для получения эха. Ревербератор отличается от рассмотренного выше цифрового устройства, реализующего дилэй, только тем, что содержит обратную связь, необходимую для формирования затухающих повторений сигнала. Такие ревербераторы широко используются сейчас не только музыкантами и звукорежиссерами [12, 45, 48, 69], но и любителями радиосвязи [2], установившими, что умеренная реверберация способствует повышению разборчивости речи.
В звуковых картах реверберация, в конечном счете, основана именно на цифровой задержке сигналов. Поэтому может показаться лишним описание остальных способов создания этого эффекта. Но это не так. В звуковом редакторе, о котором речь пойдет в следующей главе, встроена именно та эхо-камера, с которой мы начали рассказывать о реверберации. Конечно, не само гулкое помещение втиснуто в компьютер, а его математическая модель. Для чего это понадобилось делать? Эхо-камера принципиально отличается от всех остальных устройств тем, что реверберация в ней настоящая: трехмерная, объемная. Во всех же остальных устройствах это и не реверберация даже, а ее жалкое, плоское, двумерное (а то и одномерное) подобие. Модель эхо-камеры позволяет воссоздать акустику любого помещения. Она даже лучше, чем настоящая эхо-камера, потому что допускает оперативное изменение размеров моделируемого помещения и отражающих свойств стен, пола и потолка. Более того, это не одна, а как бы две эхо-камеры, с отдельно устанавливаемыми координатами источников и приемников звука.
И это еще не все. В другой программе, предназначенной для синтеза голосов новых музыкальных инструментов, смоделирован эффект реверберации, реализуемый с помощью уже знакомого вам стального листа. Речь об этой программе пойдет в гл. 3.
Наблюдая этапы развития средств реверберации, можно предположить, что когда-нибудь появятся и математические модели пружинных и магнитофонных ревербераторов. Ведь не исключено, что есть люди, испытывающие ностальгические чувства по отношению к звукам музыки, окрашенным дребезгом пружин или шипением магнитной ленты. В этом нет ничего удивительного, ведь, скажем, предусмотрен для чего-то среди эффектов стандарта GM звук, сопровождающий перемещение пальцев по грифу гитары при переходе от одного аккорда к другому. Выходит, что это и не посторонняя помеха вовсе, а неотъемлемый элемент голоса гитары.
На этом мы завершаем рассказ о сущности основных эффектов, реализованных как в звуковых картах, так и в программах-редакторах звука.
1.4. Сведение стереозаписи
Конечной целью сведения стереозаписи является придание ей той формы, которая пригодна для тиражирования на стандартных носителях, таких, например, как магнитная лента компакт-кассет или компакт-диски. Тиражирование производится с образцовой фонограммы. Она является как бы эталоном, записью максимально высокого качества. В остальном эта фонограмма полностью совпадает со своими копиями, поступающими в продажу. Для записи, например, на магнитную ленту эталонная фонограмма должна содержать две дорожки с сигналами левого и правого каналов. А исходный материал, накапливающийся в процессе работы над композицией, может быть рассосредоточен по самым различным носителям и средствам записи и обработки звука: аналоговым и цифровым магнитофонам, секвенсорам, реализованным “в железе”, MIDI-и WAVE-трекам музыкальных и звуковых редакторов. Число треков, хранящих фрагменты фонограмм или отдельные партии, может доходить до нескольких десятков, и для их воспроизведения необходимо иметь большой набор различной аппаратуры. Суть сведения стереозаписи и состоит в преобразовании исходного материала в единую образцовую фонограмму.
Учебников на эту тему не найти. Большинство книг по данной тематике оказались уж слишком теоретизированы. Например, книга [74], на которую мы из-за ее названия (“Теория и практика звукорежиссуры”) возлагали особенно много надежд, оказалась посвященной разработке математической модели микрофона в виде эквивалентной приемной антенны и просто переполненной “трехэтажными” формулами. В других многочисленных источниках
[17, 18,20, 25,34, 38, 41, 45, 49, 67,69,76, 100, 101] рассматривается очень много не менее интересных вопросов, но они непосредственно не относятся к теме данного раздела. Одним словом, ни в одной книге каких-либо теоретических основ для выдачи рекомендаций типа: “Чтобы создать хит сезона, крутите регулятор панорамы на N градусов и передвигайте движок регулятора уровня громкости на К делений”, — обнаружить не удалось, что лишний раз подтверждает: звукорежиссура — это в большей степени искусство, чем наука. А разве хоть в какой-нибудь сфере искусства можно написать книгу с алгоритмом создания шедевра, например: “Пишем оперу по методу П. И.Чайковского”, или “Сделай сам памятник Петру Первому”? Правда, продолжая отвлекаться от темы, заметим, что исключением является поэзия, где подобные методические рекомендации имеются, например, “Как делать стихи” В. Маяковского и “Студия стиха” И. Сельвинского.
Возвратимся к сведению стереозаписи. Основных проблем здесь три: мшши-рование.панорамирование, синхронизация. Первые две проблемы на практике почти нельзя разделить. Поэтому и рассматривать мы их будем совместно.
1.4.1. Микширование и панорамирование
Под микшированием понимают процесс смешивания в определенных пропорциях звуковых сигналов, записанных на различных треках или поступающих от различных источников. Исходные сигналы могут быть записаны с разными уровнями громкости. В результате микширования должен быть установлен оптимальный баланс уровней громкости инструментов, голосов, эффектов. Оптимальность заключается в том, что:
> одни источники звука не должны заглушаться другими;
> солисты не должны заглушаться аккомпанементом;
> в фонограмме должны сохраняться все характерные и ценные в художественном отношении особенности звучания отдельных голосов;
> запись должна сопровождаться минимальными амплитудно-частотны-ми и нелинейными искажениями.
Панорамирование — регулировка кажущихся положений источников звука на стереопанораме.
Источники звука могут быть как монофоническими, так и стереофоническими. В конечном счете, сигналы всех источников должны быть записаны на двух дорожках, соответствующих левому и правому каналам. Панорамирование служит цели создания эффекта размещения источников звука в различных точках пространства. Кроме достижения чисто художественных результатов, это способствует улучшению различимости звуков вообще и разборчивости речи и пения в частности.
И микширование, и панорамирование — операции динамические. В целях улучшения общего качества записи возникает необходимость менять по ходу
композиции относительные уровни громкости отдельных источников звука. Для создания эффекта перемещения источников звука можно изменять положения регуляторов панорамы.
Регулятор уровня громкости в микшере устроен так же, как и подобный регулятор в любом вашем бытовом радиоприборе. С точки зрения схемотехни-ки — это делитель напряжения с переменным коэффициентом деления, который способен изменять амплитуду сигнала, поступающего от источника в микшер. Чем больше амплитуда сигнала, тем громче звук и наоборот.
Регулятор панорамы — это, по сути дела, пара регуляторов уровня сигнала. Но вот между собой они связаны своеобразно: когда в результате изменения положения регулятора панорамы уровень сигнала в одном из стереоканалов возрастает, то в другом он уменьшается. Громкость звука, скажем, правой акустической системы становится больше, чем громкость звука левой. Кажущееся положение источника смещается от центра стереобазы в правую сторону. Заметим, что стереоэффект наблюдается лишь в том случае, когда уровни сигналов в стереоканалах близки друг к другу. Поэтому регулировка панорамы — дело довольно тонкое.
Аппаратно реализованные микшеры, кроме регулировки уровней сигналов и панорамы каждого источника звука, позволяют выполнять еще ряд операций:
> согласование чувствительности входа канала микшера с уровнем напряжения, развиваемого на выходе источника сигнала (существует несколько значений стандартных уровней);
> коммутацию источников звуковых сигналов с выходами микшера;
^" отключение любого из каналов;
> частотную коррекцию сигналов в каждом канале;
> наложение на канальные сигналы эффектов (например, реверберации) и регулировку их уровней.
Лучшие образцы современных микшеров допускают программное управление положениями регуляторов с использованием MIDI-интерфейса.
При работе с виртуальными микшерами музыкальных и звуковых редакторов доступны все перечисленные функции и еще очень много других возможностей.
Только что мы обратили ваше внимание на отдельные, на наш взгляд, недостатки книги [74], а сейчас отметим, что именно в ней мы обнаружили мысль, которую вполне можно считать теоретической основой микширования и панорамирования.
Звуковые планы
Эта мысль сжато сформулирована в заглавии одного из разделов книги: “Формирование звуковых планов — основа творчества звукорежиссера”. Продолжим цитирование [74]: “Подобно художнику, формирующему зрительные
образы, звукорежиссер создает звуковые планы и в ряде случаев согласует их со зрительными. С помощью звуковых планов имеется возможность сделать акцент на том или ином звуковом объекте и тем самым сформировать соответствующее эмоциональное состояние у слушателей, физической основой звуковой плановости является отношение энергии отраженных звуковых сигналов к энергии прямых. Это отношение зависит от расстояния между источником и приемником звука. Отсюда следует, что оперативное управление расстоянием между микрофоном и источником звука равносильно оперативному управлению плановостью”.
Итак, что же это такое — звуковой план? На слушателя (или микрофон), расположенного (ный) в некоторой точке помещения одновременно воздействует энергия Едр прямого звука источника и энергия Едтр звука, рассеянного в результате многочисленных отражений. Энергия прямого звука с увеличением расстояния до источника очень быстро уменьшается (обратно пропорционально квадрату расстояния). Поэтому можно считать, что если вблизи от источника на микрофон действует прямой звук, а отраженным можно пренебречь, то на значительных расстояниях преобладает отраженный звук.
Соотношение между отраженным и прямым звуками называется акустическим отношением и выражается формулой А=Ео^р/Е„р. Значение А зависит от расстояния от микрофона до источника звука.
Для каждого помещения характерен свой уровень реверберации. В одном помещении эхо от резкого звука (хлопка в ладоши, выстрела) затухает быстро, это помещение с малым уровнем или временем реверберации. С точки зрения физики это означает, что энергия звуковых колебаний в значительной мере поглощается материалом стен или предметами. Если звукопоглощающие свойства помещения невелики, то колебания будут переотражаться длительное время, и для такого помещения будет характерен высокий уровень реверберации, Реверберация зала, заполненного зрителями, всегда меньше, чем пустого.
От расстояния между источником и приемником звука зависит субъективное ощущение уровня реверберации помещения.
С точки зрения соотношения между прямым и отраженным звуками различают три звуковых плана: крупный, средний и удаленный.
Крупный план имеет место тогда, когда А “ 1. В этом случае преобладает прямой звук, а действие отраженных волн чрезвычайно мало. Крупному звуковому плану соответствует четкое, сухое звучание. При прослушивании создается впечатление, что источник звука имеет большие размеры и находится перед акустической системой. Звуковое пространство кажется очень маленьким, как будто сжато в точку. В звучании голоса человека слышны малейшие оттенки (и недостатки тоже). Голос близок и интимен.
Средний план характеризуется акустическим отношением А" 1. Энергии прямого и рассеянных сигналов близки друг к другу. Звучание становится
более гулким и несколько размытым. Субъективное ощущение реверберации усиливается. Средний план лучше всего соответствует естественным условиям прослушивания музыки. Для него при исполнении музыки ансамблем характерна хорошая различимость звучания отдельных инструментов и направлений на них.
При дальнейшем увеличении акустического отношения (А ” 1) степень относительного влияния отраженных звуков растет. Средний план трансформируется в удаленный. Кажущиеся размеры источников звука уменьшаются, а пространства достигают максимальных величин. Группа инструментов воспринимается как единое целое.
Для фиксированного объема и акустических свойств помещения каждый музыкальный инструмент можно охарактеризовать индивидуальными значениями расстояний, при которых для него происходит смена звуковых планов. Поэтому (особенно до появления компьютерных методов обработки звука) запись оркестров представляла собой очень нелегкую задачу. Управление звуковым планом однозначно связывалось только с изменением расстояния между инструментом (или певцом) и микрофоном.
Вопросы, которые мы сейчас рассматриваем, в большей степени относятся к таким композициям, при создании которых в качестве основной цели выдвигается достижение высокой степени приближения к естественному звучанию. Разумеется, такая задача решается непросто. Но традиционная (докомпьютерная) звукорежиссура других задач перед собой и не могла ставить, ибо была ограничена возможностями техники. Почитайте книги и статьи 70-х и 80-х годов, например, [Нисбет А. Звуковая студия. Техника и методы использования. — М.: Связь, 1979. — 464 с.]. Что ни попытка получить необычный эффект — то настоящий подвиг инженеров и операторов. Ныне все в корне изменилось. Та техника и те программы, на которых базируется наша книга, предоставляют звукорежиссеру практически неограниченные возможности. Чтобы успеть перебрать в своих композициях все доступные варианты обработки звука, вам нужно прожить несколько жизней.
Имея в своем распоряжении арсенал средств звуковых редакторов, можно управлять звуковыми планами без изменения фактического расположения микрофонов. Разумеется, целесообразно первичную запись осуществлять в крупном звуковом плане. Микрофон должен быть расположен на минимальном расстоянии, лишь бы не было искажений, связанных с его перегрузкой в моменты достижения звуком наибольшей громкости. Ощущение различных звуковых планов для каждого из источников может быть создано в процессе микширования, панорамирования и регулирования уровней дилэя и реверберации.
В работе [73], посвященной технологии расположения мнимых источников звука в стереопанораме, приводится ряд советов.
> Инструменты, обладающие мощным низким звуком, и барабаны лучше панорамировать в центр, малые барабаны также звучат лучше, когда их располагают поближе к середине, томы и тарелки можно расставить по панораме, но не слишком широко.
^ Лидер-вокал лучше выставить поближе к центру, так как именно на нем концентрируется основное внимание слушателей. Для него целесообразно выбрать крупный звуковой план. С панорамированием аккомпанирующего вокала можно поэкспериментировать. Для него естественными будут средний или удаленный звуковые планы.
> Если нужно переместить инструмент с середины стереобазы, то не обязательно помещать его в одно из крайних положений. Можно попытаться раскрасить картину звуками, которые размыты в пространстве различными способами, но при этом основные источники должны размещаться поближе к середине.
> Не следует панорамировать инструмент настолько широко, что впоследствии у слушателей создастся впечатление, будто инструмент занимает всю сцену.
> Сигналы, обработанные стереоэффектами (такими как хорус или ди-лэй), лучше панорамировать не по всей стереобазе, а хотя бы от одного крайнего положения до середины.
> При панорамировании MIDI-инструментов звуковых карт следует учитывать наличие определенного панорамирования некоторых из них, проведенного на этапе создания сэмплов.
Достоинством звуковых редакторов, кроме всего прочего, является возможность очень точного управления звуковым планом каждого реального или электронного источника звука. Для компьютерных методов обработки деление пространства на три звуковых плана слишком грубо. В интервью, опубликованном в журнале “Компьютерра”, композитор Эдуард Артемьев сказал так: “Звук — генератор пространства. Пространство начинает работать как отдельная категория, и мы уже следим не за звуком, а за пространством” [б]. Этой цитатой мы и завершим раздел, посвященный звуковым планам.
Микширование MIDI-треков в Cakewalk Pro Audio 6.0
Конечно же, для того чтобы организовать настоящую студию звукозаписи, неплохо бы иметь реализованный аппаратно микшер, подключенный ко входам высококачественной платы оцифровки звука. Сейчас предложение продавцов звукотехнической аппаратуры существенно превышает спрос. Чего только нет! Но все очень дорого. Поэтому в домашних условиях, до тех пор, пока звукозапись не станет окупающим себя источником ваших доходов, можно обойтись и минимумом средств, реализованных в звуковой карте.
Функции и возможности микшера звуковых карт семейства AWE мы рассмотрели в разд. 1.2.4. Там же мы отметили слабые стороны этих устройств, ос-
новной из которых является недостаточное число уровней квантования значений коэффициентов передачи регуляторов уровней.
Проблема микширования при создании композиций (сонгов), включающих в себя MIDI- и WAVE-файлы, может быть разделена на три составляющие части:
> микширование в процессе записи и редактирования MIDI-файлов;
> микширование в процессе записи и обработки WAVE-файлов;
> сведение MIDI-КОМПОЗИЦИЙ и WAVE-дорожек в единый сонг.
Перед тем, как перейти к рассмотрению перечисленных проблем, напомним, что мы понимаем под словом “сонг”. Сонг—это совокупность оцифрованного звука, последовательности MIDI-сообщений и дополнительной информации, формируемой музыкальным редактором [63].
Первая задача относительно несложная, и мы ее рассмотрим сейчас.
Вторую — также можно было бы решать без особых мук при наличии устройств, способных производить одновременную многоканальную оцифровку звуковых сигналов. Звуковые карты семейства AWE годятся только для одноканальной записи звука. Разумеется, последовательная запись звуковых сигналов нескольких источников с их помощью возможна. Дальнейшая обработка звуковых дорожек производится не в реальном времени, а средствами звуковых и музыкальных редакторов. Об этом пойдет речь в гл. 2 и частично в гл. 4.
Третья задача: объединение MIDI- и WAVE-файлов решается с помощью современных музыкальных редакторов, содержащих, как правило, в своем названии слово “audio”. Одним из наиболее совершенных и удобных музыкальных редакторов, на наш взгляд, является Cakewalk Pro Audio. Поэтому в гл. 4 решение этой задачи рассматривается применительно к последней (шестой) версии этой программы.
Но для того чтобы вы были готовы к решению таких сложных задач, как сведение сонга, для начала мы должны научить вас элементарному: микширо-ванию MIDI-дорожек с помощью виртуальных микшеров музыкальных редакторов. Вероятно, вы согласитесь с тем, что, поскольку спустя некоторое время вам все равно придется работать с Cakewalk Pro Audio 6.0, было бы неразумно сейчас знакомиться с микшером какого-нибудь другого музыкального редактора.
В нашей предыдущей книге [63] вы имели возможность познакомиться с версией 5,0 этого редактора. Версия 6.0 отличается от нее немногим, но часть этого “немногого” сосредоточена как раз в тех элементах, которые понадобятся именно сейчас.
Загрузив Cakewalk Pro Audio 6.0, вы увидите, что изменения частично коснулись окна микшера и способа отображения процесса управления
манипуляторами имеющихся эффектов. В предыдущей версии для вызова окна микшера нужно было выбрать в главном меню команду View > Faders. При этом появлялось изображение микшера, содержащего несчетное число каналов. В версии 6.0 вызвать окно виртуального микшера можно путем выполнения последовательности действий, о которых мы сейчас расскажем. Напомним, что главное окно включает в себя секцию треков (левая часть окна) и секцию клипов (правая часть окна). В главном окне программы — менеджере треков (Track) — следует пометить номера тех треков, линейки регуляторов которых должны появиться в окне микшера. На рис. 1.31 помечены девять первых треков.
Рис. 1.31. Главное окно с помеченными треками
Далее необходимо щелкнуть правой кнопкой мыши по полю секции треков. Это вызовет появление всплывающего меню (рис. 1.32).
В нем нужно выбрать команду Panel. При этом откроется окно диалога виртуального микшера (рис. 1.33), в котором будут видны линейки регуляторов, относящиеся только к выбранным каналам. Следует предупредить, что если вы работаете с разрешением 800х600, изображение всего окна микшера не уместится по вертикали на экране монитора.
Состав регуляторов и вид каждой из линеек можно изменить, воспользовавшись кнопкой Design. После нажатия ее появится набор инструментов, с по-
Рис. 7.32. Всплывающее меню секции треков
мощью которого можно не только изменить вид и состав уже существующих модулей микшера, но и сконструировать новые модули, объединяющие в произвольном сочетании органы регулировки параметров любых каналов. Поэкспе-риментировав с предустановками, вы обнаружите образы панелей микшеров самых известных фирм.
По умолчанию каждая линейка содержит ползунковый регулятор громкости, рукоятки регулировки панорамы, реверберации и хоруса. Кнопка Mute служит для отключения звучания канала. Кнопки, расположенные в верхней части окна
Рис. 1.33.
Пример окна диалога
микшера
78
Глава 1
Panel, позволяют выбирать способы запоминания положений регуляторов и варианты отображения их перемещении. При нажатии кнопки с изображением фотоаппарата положения регуляторов зафиксируются. Реально при этом в список MIDI-событий будут записаны сообщения, содержащие параметры этих манипуляторов эффектов. Кнопка, помеченная красной точкой, позволяет записывать все изменения положений регуляторов, которыми вы управляете по ходу записи или в процессе редактирования композиции. С помощью кнопки с изображением стрелки и ползунка можно включить режим, при котором в процессе воспроизведения будут отображаться изменения настройки органов регулировки. При нажатии кнопки с изображением дискеты можно сохранить установки микшера в файле.
Второй способ управления не только громкостью, хорусом, реверберацией, панорамой, но и параметрами других эффектов, поддерживаемых звуковой картой, — графический. Для его реализации необходимо открыть окно отпечатков клавиш фортепиано Piano Roll. Для этого в секции треков окна Track (рис. 1.31) следует щелкнуть правой кнопкой мыши по тому треку, параметры которого необходимо отредактировать. В появившемся всплывающем меню (рис. 1.32) следует выбрать команду Piano Roll, в результате чего откроется одноименное окно, изображенное на рис. 1.34.
Рис. 1.34. Графическое управление параметрами манипуляторов
Окно Piano Roll no вертикали разделено на два поля. В верхнем поле действительно можно видеть отпечатки нажатых клавиш. Ныне это один из общепринятых способов отображения музыки, записанной с помощью музыкальных редакторов. Нижнее поле предназначено для графического управления параметрами манипуляторов. Уровень параметра соответствует высоте вертикальных столбиков, совпадающих во времени с началами нот. Перечень редактируемых параметров содержится в списке, расположенном в левом нижнем углу окна, и открывается щелчком мыши. На рис. 1.34 показано, что выбран и отображается параметр Velocity, определяющий уровень громкости звучания музыкального инструмента, закрепленного за данным треком. Используя инструменты (карандаш и ластик), приводимые в действие нажатием соответствующих кнопок, расположенных над изображением клавиатуры, можно рисовать столбики любой высоты, задавая тем самым любой закон изменения отображаемого параметра.
Существует еще один способ управления параметрами любых эффектов. Правда, он не столь нагляден, как предыдущий, но именно он и является основным. Микшер и графики — это всего лишь программные надстройки над ним. Речь идет об управлении параметрами с помощью MIDI-сообщений. Удобным инструментом для редактирования списка MIDI-сообщений и записи новых является окно диалога Event List. Можно открыть окно, в котором будут в хронологическом порядке размещены абсолютно все сообщения. Но это же можно сделать и для каждого из треков. Для того чтобы открыть список сообщений для отдельного трека, необходимо в секции треков окна Track (рис. 1.31) щелкнуть правой кнопкой мыши по желаемому треку. В появившемся всплывающем меню (рис. 1.32) выберите команду Event List. После этого откроется одноименное окно, изображенное на рис. 1.35.
Рис. 7.35. Окно Event List для редактирования MIDI-сообщений
Каждая строка таблицы окна Event List содержит одно сообщение. В приведенном примере почти все сообщения относятся к типу Note и означают, что в такой-то момент следует включить такую-то ноту инструмента, закрепленного за первым MIDI-каналом. Лишь верхняя строка содержит сообщение управления манипулятором (контроллером). Громкостью звучания
нот можно управлять, изменяя числа, записанные во втором столбце справа. Значением остальных параметров следует управлять, посылая соответствующие сообщения. Для этого нужно щелкнуть левой кнопкой мыши по той строке, куда вы намерены вставить сообщение. При этом откроется окно диалога Kind of Event (рис. 1.36), предназначенное для выбора типа сообщения. Из рис, 1.36 видно, что, кроме MIDI-сообщений, можно выбирать специальные сообщения и сообщения, относящиеся к нотации.
Опции окон Event List и Kind of Event такие же, как у аналогичных окон программы Cakewalk Pro Audio версии 5.0, работа с которыми достаточно подробно рассмотрена в работе [63]. Поэтому, если вы не сможете самостоятельно разобраться с ними, загляните в эту книгу.
1.4.2. Синхронизация
Проблема обеспечения привязки каких-либо событий к единой временной шкале — одна из наиболее сложных в ряду актуальных проблем современной науки и техники. Чего только ни придумало человечество для ее решения: от наручных часов до атомных эталонов частоты, от “шести точек”, передаваемых радиовещательными станциями, до кодированных псевдослучайных сигналов навигационных космических аппаратов!
Не обошла стороной проблема синхронизации и музыку, создаваемую в компьютерных студиях. Выделим три основных ее аспекта:
> синхронизация, звуковых и MIDI-сообщений, записанных на треках музыкальных редакторов;
> синхронизация MIDI-инструментов, подключенных к звуковой карте;
> синхронизация композиции, созданной средствами музыкального редактора, с аудио- и видеосредствами студии.
Первый из перечисленных аспектов мы вынуждены будем рассмотреть лишь в последней главе книги, после того как познакомим вас со способами создания звуковых сообщений.
Поэтому начнем сразу со второго аспекта, который к тому же представляется нам наиболее простым.
Инструменты, снабженные MIDI-интерфейсом, объединяются в сеть. В соответствии со стандартом MIDI, ведущим может быть только один источник MIDI-сообщений. Когда в сеть включены только два инструмента, выход MIDI OUT ведущего инструмента соединяется со входом MIDI IN инструмента ведомого. Если инструментов много, то для образования сети используются либо дополнительные ретрансляционные выходы MIDI THRU, либо специальные размножители выходных сигналов. Варианты соединения MIDI-устройств в сеть приведены в работе [63]. Аппаратные или программные секвенсоры ведомых MIDI-устройств должны работать в режиме внешней MIDI-синхронизации.
Целям синхронизации MIDI-сети могут служить следующие системные сигналы и сообщения реального времени (System Real Time Message), передаваемые по MIDI-каналу:
> Timing Clock (синхронизация) — посылается со скоростью 24 импульса на четвертную ноту, служит для задания единого темпа исполнения композиции всеми секвенсорами сети;
> Start (старт) — инициирует начало записи или воспроизведения сонга всеми устройствами реального времени, подключенными к сети,
^" Stop (стоп) — сообщает о прекращении записи или воспроизведения;
> System Reset (сброс системы) — устанавливает все программные и аппаратные средства в исходное состояние, загруженные файлы из оперативной памяти удаляются, органы управления устанавливаются в положения по умолчанию.
Отметим, что большинство других MIDI-сообщений несут в себе информацию о времени. В этом можно убедиться, возвратившись к рис. 1.35. Целых три столбца таблицы содержат временные параметры.
Третий слева столбец информирует о времени наступления события в формате Hr:Mn:Sc:Fr (часы:минуты:секундь1:кадры). Четвертый слева столбец содержит ту же самую информацию, но в формате Meas:Beat:Tick (такт-.до-ля:тик). Правый столбец определяет продолжительность MIDI-события,
Для обеспечения возможности использования одних и тех же MIDI-устройств как в качестве ведущих, так и в качестве ведомых предусмотрены аппаратные или программные переключатели режимов синхронизации “Внешняя/ внутренняя”. Если устройство используется автономно, то следует устанавливать режим внутренней синхронизации. При работе устройств в сети ведущее устройство должно функционировать в режиме внутренней синхронизации, а ведомые — внешней. Применительно к звуковым картам следует сказать, что переключение режимов синхронизации удобно выполнять, используя органы управления, имеющиеся в музыкальном редакторе. Например, в Cakewalk такой переключатель имеется среди элементов главного окна.
Вы можете найти его в верхней части главного окна (рис. 1.31), где он показан в состоянии “Int” (внутренняя синхронизация).
Кроме проблемы синхронизации MIDI-устройств, существует и более сложная проблема, связанная с интегрированием различных элементов оборудования студий звуко- и видеозаписи. При создании различной аудио- и видеопродукции возникает необходимость сведения в единое целое информации, поступающей от различных источников. Процессы, протекающие в этих источниках, могут иметь различную периодичность и оцениваться различными единицами измерения времени.
Например, изображение на кинопленке записывается со скоростью 24 кадра в секунду, а единицей измерения времени звучания музыки в MIDI-секвен-соре служит тик. Если звуковое сопровождение записано на том же носителе, что и изображение, то проблем с синхронизацией не будет. Но ведь на этапе создания кинофильма съемка и звукозапись ведутся разными устройствами — кинокамерой и магнитофоном. После проявления пленки изображение воспроизводится уже не на том аппарате, на котором оно записывалось. То же самое, скорее всего, относится и к воспроизведению звука. Как ни стремится промышленность соблюдать стандарты, но двух абсолютно идентичных по скорости записи/воспроизведения приборов все равно не найти. Для нашего примера эти различия выльются в расхождение скоростей воспроизведения изображения и звука. Сначала они будут проявляться незначительно, но со временем может накопиться такое рассогласование, что сначала мы услышим: “Чмок” — и лишь спустя несколько секунд герой наконец-то поцелует героиню.
При сведении в единую фонограмму записей отдельных партий, выполненных различными магнитофонами, или при наложении голоса певца, записанного на магнитофоне, на фонограмму оркестра, воспроизводимую MIDI-сек-венсором, проблема синхронизации стоит еще острее, т. к. в этих случаях расхождение, составляющее доли такта и даже такты, может накопиться гораздо быстрее. А это уже явный брак. Наиболее распространенное средство синхронизации аналоговых видео- и аудиомагнитофонов между собой и с цифровой аппаратурой — SMPTE Time Code.
В начале 70-х годов был принят стандарт, названный SMPTE. Название стандарта произошло от названия Международного общества инженеров кино и телевидения (Society of Motion Picture and Television Engineers).
Основным преимуществом тайм-кода SMPTE является то, что в цифровой информации, записываемой на отдельную дорожку аналогового магнитофона, содержится время в абсолютной величине, что позволяет проигрывать произведение с любого места. Поскольку в качестве размерности по оси времени выбрана единица, не относящаяся к музыке, а представляющая собой реальное время записи кода, появляется возможность изменения темпа музыки. Так как стандарт SMPTE первоначально предназначался
для видеозаписи, в нем определен блок данных, соответствующих одному кадру видеоизображения. Такая кодовая группа состоит из 80 бит и содержит системную информацию, информацию пользователя и информацию о времени.
Временная информация закодирована в двоично-десятичной системе. Вместе с системной информацией пользователь может записать свои собственные данные (примечания, небольшие тексты). Если информация не помещается в одну кодовую группу, она должна быть разделена на несколько частей.
SMPTE-сигнал должен записываться при выключенном подавлении шумов. Соседние дорожки должны быть либо свободными, либо не должны содержать записей сигналов с большим уровнем высокочастотных составляющих. В противном случае из-за перекрестного влияния дорожек возможно искажение информации.
В музыкальной системе, синхронизируемой SMPTE-кодом, должен быть лишь один прибор, генерирующий этот код (SMPTE-Masterj. Он является опорным, а ведомые устройства должны, исходя из этого, генерировать музыкальный такт. Так как деление времени на кадры в секунду (24 в кино, 25 (PAL) или 30 (NTSC) в телевидении) для музыкальных применений слишком грубо, устройство SMPTE-синхронизации должно интерполировать временную шкалу между кадрами с помощью системы фазовой автоподстройки частоты.
Вы уже знаете, что наиболее совершенные музыкальные редакторы способны привязывать MIDI-события ко времени в различных форматах и стандартах. Cakewalk, например, тоже может работать с SMPTE-кодом. Однако подавляющее большинство звуковых карт не оборудовано соответствующим аппаратным интерфейсом, посредством которого их можно было бы подключать к SMPTE-аппаратуре студии.
1.5. Виртуальные WT-синтезаторы
Одна из глав этой книги посвящена проблеме синтеза оригинальных голосов музыкальных инструментов. Мы убеждены, что заниматься творчеством такого рода просто необходимо. Альтернативным подходом к решению проблемы увеличения числа доступных тембров может быть только приобретение новых звуковых карт или синтезаторов. Этот подход можно назвать экстенсивным и неэкономичным. Но однажды в процессе общения с фанатами компьютерной музыки нам довелось услышать мнение, смысл которого сводится к тому, что нечего заниматься созданием сэмплов собственных музыкальных инструментов, т. к. существуют дешевые виртуальные аналоги профессиональных синтезаторов. Впечатление об их безграничных возможностях может возникнуть и у людей, прочитавших серию работ [8, 9, 10], где виртуальные синтезаторы соседствовали с очень недешевым аппаратным синтезатором
Korg X5D. Действительно ли настолько безграничны их возможности? Прочитайте этот материал и оцените сами.
Появлению виртуальных, или программных (soft) WT-синтезаторов способствовал целый ряд объективных предпосылок, Возможно, многие читатели знакомы с одним, а может быть и с целым рядом когда-то достаточно популярных музыкальных редакторов, родоначальником которых считается программа ScreamTraker. Перечислим особенности этих редакторов:
> Их нельзя называть секвенсорами, т. к. большинство из них не может работать с интерфейсом MIDI и, следовательно, управлять внешними MIDI-инструментами они тоже не в состоянии.
> Большинство из них работают под управлением DOS. При этом они задействуют практически все вычислительные ресурсы компьютера. Это обусловлено тем, что синтезатор, генерирующий звуки, выполнен в программном виде, а синтезировать звук, как известно, дело нелегкое.
> Каждый из этих редакторов и по сей день обладает своим уникальным интерфейсом, работающим, как правило, в текстовом режиме. Отсутствует нотный интерпретатор.
>' Сонги хранятся в специфическом уникальном формате (а таких форматов на сегодняшний день существует уже с десяток). Наверное, вам попадались файлы с расширениями '.MOD, ".STM, '.S3M, ".ХМ, ".IT и т. д.?
> Даже современные и наиболее совершенные из этих редакторов только начали “обучаться” использованию возможностей WT-синтезаторов (вернее, только части этих возможностей).
Как может показаться на первый взгляд, список особенностей содержит одни лишь недостатки. Но на самом деле это не так. Музыкальные редакторы типа ScreamTraker сыграли свою историческую роль. В то время, когда звуковых карт с WT-синтезаторами для PC не было и в помине, а великим достижением считалось наличие FM-синтезатора OPL-3, такие программы все же позволяли прикоснуться к возможностям сэмплера.
С тех пор прошло очень много времени (по меркам истории компьютерной музыки), звуковые карты с шестнадцатибитными АЦП/ЦАП стали такими же привычными, как и динамик в корпусе PC. В несколько раз выросла производительность процессоров, появился и стал доступным процессор Pentium. Последнее и сыграло роль детонатора бомбы, взрыв которой выплеснул множество виртуальных синтезаторов.
Что же такое виртуальный WT-синтезатор? Это, образно говоря, тот же ScreamTraker, но только содержащий набор сэмплов, соответствующих определенному стандарту, и умеющий работать с MIDI-интерфейсом. А если говорить совсем точно, то виртуальный WT-синтезатор — это выполненная в виде драйвера для Windows программа, которую система воспринимает как полноценное MIDI-устройство.
Для вывода звука виртуальные синтезаторы используют ЦАП звуковой карты. Но ведь просто проигрывать MIDI-файлы недостаточно, должна существовать возможность воспроизведения при этом и цифрового звука. А как же быть с тем, что виртуальные синтезаторы полностью захватывают ЦАП звуковой карты? Некоторые из них решают эту проблему “полюбовно”. Они предоставляют вместо привычного драйвера ЦАП свой собственный, полностью совместимый с виртуальным синтезатором. Этот драйвер “подмешивает” звуковые данные из WAVE-файла к цифровому потоку на выходе виртуального WT-синтезатора. В результате вы можете прослушивать одновременно и MIDI-файлы, и цифровой звук.
Самое главное достоинство виртуальных синтезаторов — они не нуждаются в дорогостоящих звуковых картах. Подойдет любая шестнадцатибитная.
Самый главный недостаток — потребность в мощном процессоре. Приемлемое качество звука достигается только на процессорах Intel Pentium-200 и выше. В настоящее время некоторые современные виртуальные синтезаторы обращаются к возможностям технологии ММХ, что позволяет существенно расширить возможности синтеза даже на процессорах с более низкой частотой (например, Intel Pentium MMX-166). Но и сейчас виртуальные синтезаторы не создают серьезной конкуренции синтезаторам аппаратным. Тот же EMU8000 (с этим синтезатором вам еще предстоит познакомиться поближе) синтезирует звук с качеством, превосходящим качество синтеза любого виртуального синтезатора, существующего на момент написания этой книги. При этом процессор остается совершенно свободным от каких-либо расчетов и может использоваться для других целей, в том числе и музыкальных, например, для мик-ширования звуковых дорожек в музыкальном редакторе.
Но виртуальные синтезаторы просто не появились бы на свет, если бы в них не было потребности. Кто же основной потребитель таких программ? Скорее всего, это человек, использующий мощный PC в основном только для деловых целей. По этой причине его PC не содержит таких серьезных устройств, как звуковые карты с WT-синтезаторами. В его распоряжении имеется только заурядная шестнадцатибитная звуковая карта с FM-синтезатором. Лучшей звуковой карты ему просто не нужно. “Все эти дорогие AWE для тех, кто сидит часами с MIDI-клавиатурой и сочиняет музыку”, — думает он. Мысли этого воображаемого человека не являются нашей фантазией, нам не раз приходилось слышать такое мнение, высказанное вслух. И не нужно обижаться на таких людей, скорее их стоит пожалеть. Чего-то они все-таки недопонимают.
Но хорошую музыку хочется слушать всем. Поэтому наш воображаемый человек при случае обязательно установит на свой “деловой” PC виртуальный синтезатор. Это позволит ему хотя бы узнавать звучание знакомых инструментов в MIDI-файле (ведь в веселом “поквакивании” OPL-3 трудно расслышать фортепиано или скрипичный оркестр).
В среде музыкантов потребителей таких программ, как правило, не бывает. Это объясняется одним существенным недостатком, присущим большинству
виртуальных синтезаторов. Речь идет о задержке, возникающей после нажатия MIDI-клавиши (настоящей или тоже виртуальной) перед началом генерации звука.
Величина задержки может изменяться для разных процессоров и разных настроек виртуальных синтезаторов. Но, как правило, эта задержка не менее 0,5 с. Это небольшое на первый взгляд неудобство на практике приводит к невозможности игры на MIDI-клавиатуре в реальном времени. Неужели программистам трудно переделать виртуальный синтезатор так, чтобы не было этой задержки? Да, действительно трудно, хотя бы по той причине, что архитектура PC не рассчитана на синтез звука с помощью центрального процессора.
Для любознательных читателей поделимся нашими мыслями по поводу того, откуда возникает эта злополучная задержка. Если вам неинтересно — переходите к следующему абзацу.
Как известно, звуковая картадля формирования звука с помощью ЦАП использует DMA (канал прямого доступа к памяти). Вывод звука осуществляется по следующей схеме. Процессор копирует блок звуковых данных (отсчетов) в определенное пространство памяти и сообщает контроллеру DMA и звуковой карте о том, что блок данных хранится по такому-то адресу и его нужно вывести через ЦАП с такой-то скоростью. После этого звуковая карта некоторое время (долю секунды) воспроизводит звук без участия процессора. В это время она напоминает магнитофон, в который вставили кассету и нажали кнопку Play. Когда “лента заканчивается”, звуковая карта сообщает процессору о том, что пора вставлять новую. За то время, которое процессор был свободен от выполнения операций, связанных со звуком, он успевает выполнить массу других операций. А заполнить буфер памяти звуковыми данными и включить звуковую карту в режим воспроизведения — это для него сущий пустяк. Таким способом экономится 99 % процессорного времени (а значит и производительно сти компьютера). Но просто воспроизводить WAVE-файл посредством DMA — это одно, а еще и генерировать при этом звуковые отсчеты — это совсем другое. Процессор не может мгновенно заполнить буфер DMA по той простой причине, что сначала надо рассчитать данные, которыми этот буфер будет заполняться. Вычисления, необходимые для синтеза звука, — дело непростое. Быстро рассчитать 64 Кбайт (а именно таков максимально допустимый размер буфера DMA) звуковых данных невозможно. Поэтому и возникает задержка на время, необходимое процессору для расчета первой порции звуковых данных. При воспроизведении всего MIDI-файла эта задержка имеет место сразу после нажатия кнопки Play и потому остается незамеченной (все последующие звуки следуют без задержек, или, вернее сказать, одинаково смещены во времени относительно момента нажатия кнопки Play). А вот при игре на MIDI-клавиатуре задержка будет ощущаться при каждом нажатии клавиши.
Вторая сторона того же недостатка, присущая виртуальным синтезаторам, — большая загруженность процессора расчетами звуковых данных. В результате этого выполнение других программ в среде MS Windows резко замедляется, а некоторые действия (например, перемещение окон, запуск программ и т. п.) приводят к сбоям в воспроизведении MIDI-файлов.
Еще один недостаток — незначительное повышение качества звука требует значительного повышения быстродействия процессора. Поясним это на примере. Предположим, какой-либо из виртуальных синтезаторов нормально (с допустимой загрузкой процессора) работает на Intel Pentium-100, но частота дискретизации воспроизводимого звука составляет всего 22,05 кГц. Допустим, вы захотели поднять частоту дискретизации до 44,1 кГц. Чтобы загруженность процессора оставалась прежней (примерно 80 %) вам может потребоваться Intel Pentium-200. Частота дискретизации выросла в два раза, частота процессора — тоже в два раза, а его цена? На момент написания этой книги процессор Intel Pentium-200 стоил не в два, а в несколько раз дороже своего предшественника, работающего на частоте 100МГц.
Последний из существенных недостатков — невозможность загрузки пользовательских сэмплов. Причиной этого служит целый ряд факторов, перечислять которые нет смысла.
Но все трудности в мире компьютеров рано или поздно преодолеваются, и мы верим в то, что ветвь виртуальных синтезаторов в дереве эволюции компьютерной музыки не оборвется и будет продолжать самостоятельное существование. Для этого предположения уже сейчас имеются некоторые основания: WT-синтезаторы и их виртуальные аналоги могут вместе “жить” на одном компьютере и даже не просто “жить”, но и взаимодополнять друг друга. Яркий тому пример — Sound Blaster AWE64. Эта звуковая карта по своим музыкальным возможностям и архитектуре ничем не отличается от своих предшественниц SB AWE32 и SB 32. А дополнительные 32 голоса обеспечиваются не аппаратно, а программно, с помощью виртуального синтезатора. Этот виртуальный синтезатор может, в принципе, работать с любой шестнадцатибитной картой. Но его создатели сделали так, чтобы он при запуске детектировал звуковую карту. Если она окажется не SB AWE64, то виртуальный синтезатор откажется работать. Однако существует и другое исполнение этого программного синтезатора, которое обеспечивает работу со звуковыми картами, отличными от SB AWE64. Благодаря этой программе, например, можно превратить SB AWE32 в SB AWE64.
Возможно у некоторых наших читателей, использующих виртуальные синтезаторы, может возникнуть вопрос: а для чего же таким фирмам как, например, Yamaha и Roland потребовалось создавать программные аналоги своих реально существующих инструментов (например, Roland VSC-88 и Yamaha S-YXG50)? Возможно, это просто рекламный ход: “Попробуйте программные аналоги наших инструментов! Понравилось? А ведь настоящие
синтезаторы звучат гораздо лучше! Что бы вы сказали, послушав звучание настоящего инструмента?” Возможно, мы не угадали...
В качестве примера рассмотрим виртуальный синтезатор Yamaha S-YXG50. Не станем скрывать причины выбора именно этой программы. Во-первых, она просто нам симпатична. Кроме того, S-YXG50 использует технологии ММХ и Direct Sound, поддерживает стандарт GX. Приведем характеристики этой программы:
> WT-синтезатор с банком инструментов объемом 2 Мбайт;
> максимальная полифония 128 нот;
)•* набор инструментов: 676 мелодических, 21 набор ударных инструментов и спецэффектов;
> максимальная частота сэмплирования 44/22/11 кГц;
^ фильтр с динамически изменяемыми параметрами для каждой звучащей ноты;
')- эффекты: 8 типов реверберации, 8 типов хоруса, 36 типов вариаций. Технические требования, предъявляемые к PC:
> процессор Pentium-166 или лучше (настойчиво рекомендуется процессор с технологией ММХ);
> операционная система Windows 95;
> ОЗУ объемом не менее 16 Мбайт;
> 16-битная звуковая карта.
Приведенные требования являются минимальными. Это означает, что на таком PC программа будет работать, но не обязательно на полную мощность, заявленную в ее характеристиках. Пользователю предоставляется возможность настройки виртуального синтезатора в соответствии с производительностью своего компьютера.
После установки на PC программа идентифицируется системой как MIDI-yc-тройство. Вы можете использовать это виртуальное устройство в музыкальном редакторе точно так же, как использовали бы настоящий синтезатор.
О присутствии программного синтезатора в системе свидетельствует появление в Панели управления Windows новой иконки.
Щелчком по этой иконке вызывается окно настроек драйвера виртуального синтезатора, изображенное на рис. 1.37. Рассмотрим опции этого окна.
В группе Effect можно включать или выключать типы эффектов, которые поддерживаются синтезатором. Конечно, хорошо, когда включены все эффекты, но для этого требуется мощный процессор. Отключив один или два (или все три) типа эффектов, можно существенно снизить требования программы к вычислительным ресурсам процессора.
Sample Rate — частота сэмплирования. Здесь комментарии излишни: чем больше, тем лучше (лишь бы процессор смог справиться с этой задачей). CPU Load — допустимая загрузка (занятость) процессора. Наилучшая допустимая загрузка с точки зрения качества синтезируемого звука — 90 %. Но процессорного времени для других программ при воспроизведении музыки останется очень мало. При такой загрузке маломощного процессора выполнение параллельно запущенных программ может попросту остановиться. Polyphony — максимальная полифония. Группа Direct Sound содержит всего два переключателя, позволяющих подключать или отключать звуковые драйверы Microsoft DirectX, благодаря которым можно более эффективно использовать аппаратное обеспечение и меньше загружать процессор.
Нельзя не упомянуть о симпатичном проигрывателе MIDI-файлов, поставляемом вместе с виртуальным синтезатором, а также о самих демонстрационных MIDI-файлах, использующих возможности стандарта XG. Вид проигрывателя показан на рис. 1.38.
Кнопка Power эквивалентна кнопке, закрывающей окно. Кнопка с горизонтальной чертой минимизирует окно программы. Нажав кнопку SONG, можно создать список файлов, которые будут- воспроизводиться в заданном вами порядке. Окно диалога редактора списка показано на рис. 1.39.
Здесь-то мы и столкнулись с первым (и последним) недостатком, обнаруженным нами у данной программы — она не поддерживает длинных имен файлов (вместо каталога Program Files мы видим progra-). Может быть, в версии этого проигрывателя, имеющейся у вас, этот недостаток будет уже устранен.
Рис. 1.39. Редактор списка файлов для воспроизведения В этой нехитрой панели вы, конечно, разберетесь и без нашей помощи.
Вернемся в главное окно проигрывателя (рис. 1.38). Кроме стандартных кнопок управления и поля в стиле ЖК-индикатора с названием текущей музыкальной композиции, здесь имеются кнопки настройки проигрывателя (SET) и помощи (?), Нажав кнопку SET, вы вызовете окно диалога, возможный вид которого показан на рис. 1.40. В этом окне содержится список доступных MIDI-устройств. Выбрать можно только одно устройство. Оно и будет воспроизводить MIDI-файлы.
Рис. 1.40.
Настройка MIDI-проиг-
рывателя
Снова вернемся в главное окно MIDI-проигрывателя. С помощью кнопок со стрелками можно сменить темп воспроизведения (текущий темп отображается на “ЖК-индикаторе”). В правой части окна расположен движок регулятора громкости. Он управляет программной громкостью генерируемого звука. Громкость нужно установить так, чтобы не переполнялась разрядная сетка ЦАП звуковой карты.
В заключение отметим: возможно вам покажется, что виртуальный синтезатор — вещь капризная и требует особой заботы со стороны пользователя. И в этом вы будете совершенно правы. С аппаратным синтезатором и проблем меньше, и звучит он несравнимо лучше.