м ультимедиа — это интерактивные системы, обеспечивающие работу с неподвижными изображениями и движущимся видео, анимированной компьютерной графикой и текстом, речью и высококачественным звуком. Появление систем мультимедиа, безусловно, производит революционные изменения в таких областях, как образование, компьютерный тренинг, во многих сферах профессиональной деятельности, науки, искусства, в компьютерных играх и т.д. Появление систем мультимедиа подготовлено как с требованиями практики, так и с развитием теории. Однако, резкий рывок в этом направлении, произошедший в этом направлении за последние несколько лет, обеспечен прежде всего развитием технических и системных средств. Это и прогресс в развитии ПЭВМ: резко возросшие объем памяти, быстродействие, графические возможности, характеристики внешней памяти, и достижения в области видеотехники, лазерных дисков — аналоговых и CD-ROM, а также их массовое внедрение. Важную роль сыграла так же разработка методов быстрого и эффективного сжатия / развертки данных. Современный мультимедиа–ПК в полном “вооружении” напоминает домашний стереофонический Hi–Fi комплекс, объединенный с дисплеем–телевизором. Он укомплектован активными стереофоническими колонками, микрофоном и дисководом для оптических компакт–дисков CD–ROM (CD — Compact Disc, компакт–диск; ROM — Read only Memory, память только для считывания). Кроме того, внутри компьютера укрыто новое для ПК устройство — аудиоадаптер, позволивший перейти к прослушиванию чистых стереофонических звуков через акустические колонки с встроенными усилителями. Рассмотрим некоторые технические вопросы, касающиеся мультимедиа. Основная проблема, из которой “растут” все основные — совместная обработка разнородных данных: цифровых и аналоговых, “живого” видео и неподвижных изображений и т.п. В компьютере все данные хранятся в цифровой форме, в то время как теле-, видео- и большинство аудиоаппаратуры имеет дело с аналоговым сигналом. Однако выходные устройства компьютера — мониторы и динамики имеют аналоговый выход. Поэтому простейший и наиболее дешевый путь построения первых систем мультимедиа состоял в стыковке разнородной аппаратуры с компьютером, предоставлении компьютеру возможностей управления этими устройствами, совмещении выходных сигналов компьютера и видео- и аудиоустройств и обеспечении их нормальной совместной работы. Дальнейшее развитие мультимедиа происходит в направлении объединения разнородных типов данных в цифровой форме на одной среде-носителе, в рамках одной системы. ВИДЕО При смешении сигналов основные проблемы возникают с видео–изображением. Различные ТВ–стандарты, существующие в мире (NTSC, PAL, SECAM), применение разных мониторов и видеоконтроллеров диктует разнообразие подходов в разрешении возникающих проблем. Однако в любом случае требуется синхронизация двух изображений, для чего служит устройство генлок (genlock). С его помощью на экране монитора могут быть совмещены изображение, сгенерированное компьютером (анимированная или неподвижная графика, текст, титры), и “живое” видео. Если добавить еще одно устройство — кодер (encoder), компьютерное изображение может быть преобразовано в форму ТВ–сигнала и записано на видеопленку. "Настольные видео–студии”, являющиеся одним из примеров применения систем мультимедиа, позволяют готовить совмещенные видео–компьютерные клипы, титры для видеофильмов, помогают при монтаже кинофильмов. Системы такого рода не позволяют как-то обрабатывать или редактировать само аналоговое изображение. Для того, чтобы это стало возможным, его необходимо оцифровать и ввести в память компьютера. Для этого служат так называемые платы захвата (capture board, frame grabbers). Оцифровка аналоговых сигналов порождает огромные массивы данных. Так, кадр стандарта NTSC (525 строк), преобразованный платой типа Truevision, превращается в компьютерное изображение с разрешением 512x482 пиксель. Если каждая точка представлена 8 битами, то для хранения всей картинки требуется около 250 Кбайт памяти, причем падает качество изображения, так как обеспечивается только 256 различных цветов. Считается, что для адекватной передачи исходного изображения требуется 16 млн. оттенков, поэтому используется 24-битовый формат хранения цветной картинки, а необходимый размер памяти возрастает. Оцифрованный кадр может затем быть изменен, отредактирован обычным графическим редактором, могут быть убраны или добавлены детали, изменены цвета, масштабы, добавлены спецэффекты, типа мозаики, инверсии и т.д. Естественно, интерактивная экранная обработка возможна лишь в пределах разрешения, обеспечиваемого данным конкретным видеоадаптером. Обработанные кадры могут быть записаны на диск в каком–либо графическом формате и затем использоваться в качестве реалистического неподвижного фона для компьютерной анимации. Возможна также покадровая обработка исходного изображения и вывод обратно на видеопленку для создания псевдореалистического мультфильма. Запись последовательности кадров в цифровом виде требует от компьютера больших объемов внешней памяти: частота кадров в американском ТВ–стандарте NTSC — 30 кадров/с (PAL, SECAM — 25 кадров/с), так что для запоминания одной секунды полноцветного полноэкранного видео требуется 20–30 Мбайт, а оптический диск емкостью 600 Мбайт вместит менее полминуты изображения. Но последовательность кадров недостаточно только запомнить, ее надо еще вывести на экран в соответствующем темпе. Подобной скоростью передачи информации — около 30 Мбайт / с — не обладает ни одно из существующих внешних запоминающих устройств. Чтобы выводить на экран компьютера оцифрованное видео, приходится идти на уменьшение объема передаваемых данных, (вывод уменьшенного изображения в небольшом окне, снижение частоты кадровой развертки до 10–15 кадров / с, уменьшение числа бит / пиксель), что, в свою очередь приводит к ухудшению качества изображения. Более радикально обе проблемы — памяти и пропускной способности — решаются с помощью методов сжатия / развертки данных, которые позволяют сжимать информацию перед записью на внешнее устройство, а затем считывать и разворачивать в реальном режиме времени при выводе на экран. Так, для движущихся видео–изображений существующие адаптивные разностные алгоритмы могут сжимать данные с коэффициентом порядка 100:1— 160:1, что позволяет разместить на CD–ROM около часа полноценного озвученного видео. Работа этих алгоритмов основана на том, что обычно последующий кадр отличается от предыдущего лишь некоторыми деталями, поэтому, взяв какой–то кадр за базовый, для следующих можно хранить только относительные изменения. При значительных изменениях кадра, например, при монтажной склейке, наезде или панорамировании камеры, автоматически выбирается новый базовый кадр. Для статических изображений коэффициент сжатия, естественно, ниже — порядка 20–30:1. Для аудиоданных применяют свои методы компрессии. Существует симметричная и асимметричная схемы сжатия данных. При асимметричной схеме информация сжимается в автономном режиме (т.е. одна секунда исходного видео сжимается в течение нескольких секунд или даже минут мощными параллельными компьютерами и помещается на внешний носитель, например CD–ROM. На машинах пользователей устанавливаются сравнительно дешевые платы декодирования, обеспечивающие воспроизведение информации мультимедиа в реальном времени. Использование такой схемы увеличивает коэффициент сжатия, улучшает качество изображения, однако пользователь лишен возможности разрабатывать собственные продукты мультимедиа. При симметричной схеме сжатие и развертка происходят в реальном времени на машине пользователя, благодаря чему за персональными компьютерами и в этом случае сохраняется их основополагающее достоинство: с их помощью любой пользователь имеет возможность производить собственную продукцию, в том числе и коммерческую, не выходя из дома. Правда, при симметричной схеме несколько падает качество изображения: появляются “смазанные” цвета, картинка как бы расфокусируется. С развитием технологии эта проблема постепенно уходит, однако пока иногда предпочитают смешанную схему, при которой разработчик продукта готовит, отлаживает и испытывает продукт мультимедиа на своей машине с симметричной схемой, а затем “полуфабрикат” в стандартном формате отсылается на фирму, где его подвергают сжатию на мощном компьютере, с использованием более совершенных алгоритмов и помещают результирующий продукт на CD–ROM. В настоящее время целый ряд фирм активно ведет разработку алгоритмов сжатия видеоинформации, стремясь достичь коэффициента сжатия порядка 200:1 и выше. В основе наиболее эффективных алгоритмов лежат различные адаптивные варианты: DCT (Discrete Cosine Transform, дискретное косинус–преобразование), DPCM (Differential Pulse Code Modulation, разностная импульсно–кодовая модуляция), а также фрактальные методы. Алгоритмы реализуются аппаратно — в виде специальных микросхем, или “firmware” — записанной в ПЗУ программы, либо чисто программно. Разностные алгоритмы сжатия применимы не только к ви