Технологии передачи аудиоинформации через интернет

БАЛТИЙСКАЯ ГОСУДАРСТВЕННАЯ АКАДЕМИЯ РЫБОПРОМЫСЛОВОГО ФЛОТА
КАФЕДРА СУДОАВТОМАТИКИ И ВЫЧИСЛИТЕЛЬНОЙ ТЕХНИКИ
ДОКЛАД
на тему
СОВРЕМЕННЫЕ ТЕХНОЛОГИИ ПЕРЕДАЧИ
АУДИОИНФОРМАЦИИ ЧЕРЕЗ ИНТЕРНЕТ
Выполнил: студент группы К-11
Ефимов А. Е.
Научный руководитель: доцент
кафедры СА и ВТ
Плешков В. М.
Калининград
2000
В настоящий момент Интернет – глобальная компьютерная сеть, своеобразная сеть
сетей, подобна мировому океану информации, однако не стихийной, а структурированной
и упорядоченной, подчиняющаяся самым передовым в мире законам и нормам
информационного права, являющаяся самой демократичной и доступной практически
каждому жителю Земли. Интернет, вместе со своими меньшими братьями
(корпоративными сетями) Интранет, давно и уверенно трансформируется в направлении от
элитарной коммуникационной среды для обмена данными среди ученых и специалистов к
прообразу мировой коммуникационной мультимедийной супермагистрали, одинаково
пригодной в качестве среды для множества видов профессиональной деятельности и
бизнес-применений, включая такие виды массового обслуживания, как торговля,
информационная и развлекательная индустрия, средства массовой информации.
Разработчики аппаратно-программных приложений к ПЭВМ давно уже прошли
этап освоения мультимедиа-функций для отдельно стоящих персональных компьютеров и
компьютеров в локальных вычислительных сетях. Теперь многие сосредоточили свои уси-
лия на передаче аудио- и видеоданных в режиме реального времени в компьютерных се-
тях. Если объединенные усилия увенчаются успехом, то Интернет станет привычной и по-
вседневной рабочей средой для не только для телефонии и видеоконференций, но и для
радио- и телевизионного вещания, причем такие традиционные вещательные проблемы
как сложный рельеф местности или расстояние от студии до слушателей и зрителей, так же
как нехватка эфирных частот в больших городах и промышленно развитых странах, могут
просто перестать быть значимыми, причем даже быстрее, чем кажется.
Передача звука в реальном времени
Компания Progressive Networks разработала расширение языка HTML для прослу-
шивания звуковых файлов с помощью системы RealAudio, состоящей из сервера, где хра-
нятся звуковые файлы в гипертекстовом формате, и "проигрывателя", встраиваемого в
программу просмотра. Щелчком мыши по значку звуковой связи на Web-странице пользо-
ватель инициирует непрерывную передачу пакетов информации с сервера по сети Интер-
нет. "Проигрыватель" системы RealAudio вместе со звуковой картой персонального ком-
пьютера превращает этот поток данных в звук.
Как и многие другие компании, Progressive Networks ориентирует систему RealAudio на
использование модемов со скоростью передачи 14,4 или 28,8 Кбит/с, которые установлены
у большинства пользователей. Звуковая информация при этом пересылается сервером в
виде непрерывного потока по протоколу транспортного уровня с доставкой данных без
предварительного установления соединения User Datagram Protocol (UDP). Данные по уп-
рощенному протоколу UDP передаются с большей скоростью, так как нет механизма по-
вторной передачи, который протокол TCP использует для предотвращения потери части
данных. В результате можно лишиться около 20% (в худшем случае) исходящих пакетов,
что не всегда приводит к снижению качества, поскольку существующие алгоритмы обра-
ботки звукового сигнала довольно точно восстанавливают оригинал при потере части дан-
ных.
Специалисты предсказывают дальнейшее повышение качества звука по мере со-
вершенствования ПЭВМ. В настоящий момент при пересылке звукоданных через модемы
на скорости 14,4 Кбит/с обеспечивается качество звучания, как у радиоприемников с ам-
плитудной модуляцией (АМ-качество). Однако при увеличении скорости передачи до 28,8
Кбит/с можно добиться качества звучания радиоприемников с частотной модуляцией (ЧМ-
качество). В общем, перспектива получения качественного звука с помощью микросхем
обработки цифровых сигналов, расположенных на звуковой плате или в модеме, выглядит
весьма привлекательно.
Компьютерная телефония
Самой заметной из последних новинок звуковых коммуникаций в Интернет явля-
ется ПО, позволяющее географически удаленным пользователям устанавливать телефон-
ную связь через Интернет и платить за нее намного меньше, чем за такой же звонок по
обычным телефонным линиям. Попросту говоря, шлюз способен соединить обыкновенный
телефон с сетью Интернет. Но данные могут поступать и из других источников. В теории
ограничений на способ связи нет: вы можете воспользоваться компьютером (если общают-
ся два компьютера, иногда можно обойтись вовсе без шлюза), обыкновенным телефоном,
радиопередатчиком, и т.п.
В общем виде схема связи выглядит так:
Абонент 1 - [локальная телефонная сеть 1] - [шлюз 1] - Интернет - [шлюз 2] - [локальная
телефонная сеть 2] - Абонент 2.
Ключевым элементом интернет-телефонии является связка шлюз – Интернет.
Шлюз представляет собой компьютер-сервер, дополненный специальными платами рас-
ширения и соответствующим программным обеспечением. Он служит интерфейсом между
передающим звук устройством пользователя (телефоном, компьютером и т.п.) и сетью Ин-
тернет. Шлюз обеспечивает прием и преобразование данных в форму, удобную для пере-
сылки по Сети (и обратное преобразование). Абоненту всего лишь нужно связаться с ним
тем или иным способом. Шлюз, имеющий выход в Интернет, передаст по Сети данные на
другой такой же шлюз, ближайший к абоненту номер 2, после чего, претерпев обратное
преобразование, звук достигнет цели своего путешествия.
Но, какое влияние оказывает сеть Интернет на звуковой сигнал? Рассмотрим вари-
анты использования интернет-телефона и оценим воздействие Сети в различных случаях.
1) Компьютер - компьютер
Два компьютера, подключенные к сети Интернет, могут общаться без посредников.
Из общей схемы исчезнет шлюз, поскольку необходимость преобразования сигнала отпала
(если быть более точным, в качестве шлюза выступает некая программа - интернет-
телефон, запущенная на обоих компьютерах). Данные сразу передаются по стандартным
протоколам Интернета, поэтому помехи проникнуть в пакет данных не могут. Единствен-
ное негативное воздействие помех – задержка пакетов. Неудивительно, что именно за-
держки являются главной проблемой интернет-телефонии. Причин их возникновения не-
сколько. Одни связаны с принципом построения сетей TCP/IP и особенностями коммута-
ции пакетов, другие зависят от общей загрузки сети, качества линии связи и скорости мо-
дема. Если задержка превышает 250 миллисекунд, она становится заметной. Поскольку
программа не контролирует контекст передаваемого разговора, паузы вклиниваются в бе-
седу случайным образом – чаще на полуслове. Окончание слова возникает в наушниках
или колонках после секундного затишья. Повлиять на качество звука можно, лишь купив
более быстрый модем и выбрав провайдера с мощными каналами связи.
2) Телефон - телефон
Звонок по такой схеме внешне мало,чем отличается от обычного телефонного. Последова-
тельность действий такова: сначала набирается телефонный номер ближайшего шлюза ин-
тернет-телефонии (предварительно нужно подписаться на его услуги); затем после пере-
ключения телефонного аппарата в тоновый режим, набирается номер абонента; вводится
идентификационный номер – и далее следует разговор Счет за разговор через сеть Интер-
нет окажется значительно меньше (иногда на порядок) счета за идентичный по времени
разговор по традиционному междугородному телефону.
Для связи в режиме телефон - телефон не нужен ни компьютер, ни модем (подключение к
сети Интернет и связанные с этим расходы тоже не потребуются). До шлюза сигнал пере-
дается как и обычные телефонные звонки. При этом в него (как и в любой другой теле-
фонный сигнал) могут примешаться помехи. На уровень задержек, а следовательно, на
комфортность и качество разговора в режиме телефон – телефон влияние оказывают лишь
пропускная способность линий связи провайдера интернет-телефонии и загруженность се-
ти Интернет на маршруте следования пакетов. В настоящий момент, технологически про-
блема качества звука решается путем оптимизации задержек на пути следования сигнала.
Из нескольких возможных система выбирается наименее загруженные маршруты; где это
допустимо, повышается приоритет голосовых пакетов. Кроме того, ни под каким видом не
допускается перегрузка собственных каналов традиционным трафиком. За счет этих мер
паузы в разговоре удается сделать практически незаметными даже в часы максимальной
загрузки.
Претендуя на полноценный сервис, фирма, предлагающая услуги интернет-телефонии,
обязана обеспечить своим клиентам возможность позвонить на любой телефон мира. При-
чем для этого совсем не обязательно создавать большое количество шлюзов повсеместно,
Интернет позволяет провайдерам интернет-телефонии обмениваться трафиком, пере адре-
суя звонки друг другу.
Если в непосредственной близости от абонента шлюза все-таки не оказалось, зво-
нок отправляется по обычным телефонным маршрутам. Однако и в этом случае его стои-
мость оказывается существенно ниже стоимости прямой телефонной связи.
3) Компьютер - телефон (телефон - компьютер)
Установив на свой компьютер программу интернет-телефонии, пользователь не ут-
ратите возможности связаться с не владеющим компьютером человеком. Напротив, ком-
пьютер существенно расширит возможности связи и облегчит дозвон. Чтобы в полной ме-
ре использовать возможности интернет-телефона, необходимо подписаться на услуги про-
вайдера интернет-телефонии.
Виртуальный офис
С помощью интернет-телефонии можно организовать "виртуальный офис", связав
через сеть Интернет представительства фирмы в разных городах. Достаточно поместить в
компьютеры специальные платы расширения (например, Dialogic), превратив их тем са-
мым в шлюзы, установить программное обеспечение VocalTec и подключиться к Интерне-
ту. Стоимость звонка в этом случае окажется эквивалентной лишь сумме, выплачиваемой
провайдеру за пользование Интернетом. Кому бы то ни было платить за международ-
ную/междугородную связь уже не придется. Телефонной связью можно оснастить даже
веб-страницу. Пользователь щелкнет по ссылке и получит возможность поговорить, на-
пример, с оператором службы поддержки вашей фирмы. Нужно сказать, что подобный
сервис доступен только посетителям, имеющим на своем компьютере программу интер-
нет-телефонии или подключаемый модуль (plug-in) к броузеру.
Интернет-телефония в России
На сегодняшний день существует довольно много программ для голосового обще-
ния в Сети. К сожалению, не все друг с другом совместимы. Несмотря на то, что сущест-
вует общий стандарт, основанный на рекомендациях Н.323 ITU (International
Telecommunications Union), большинство разработчиков, хотя и включают его в новые вер-
сии программ, предпочтение отдают собственным протоколам передачи и сжатия данных.
Наверное, главным "монстром" интернет-телефонии является Internet Phone фирмы
VocalTec. Internet Phone сохраняет очень хорошее качество звука даже при скорости 14
400, имеет многолюдные чат-серверы и серверы конференций. Компания VocalTec, наце-
ливаясь на наиболее емкий сегмент рынка, оптимизировала пакет Internet Phone для рабо-
ты с модемами V.32bis со скоростью передачи 33.6 Кбит/с, число которых, по данным кор-
порации IDC, к концу 2000 г. вырастет до 80 млн. Одновременно продолжается совершен-
ствование алгоритмов восстановления потерянных пакетов для повышения качества вос-
произведения речи. А внедрение модемов со скоростью передачи 56.6 Кбит/с позволяет
передавать речь и одновременно работать с другими приложениями Интернет.
Другие программы по своим функциональным возможностям стоят на несколько
ступенек ниже, однако, и они иногда демонстрируют неплохие результаты. Можно отме-
тить, наверное, первую отечественную разработку, интернет-телефон Easy Talk фирмы
AMSD. Программа максимально приспособлена к российским проблемам телефонных ли-
ний. Вы можете услышать голос собеседника даже при скорости передачи данных 2400!
Причем программа автоматически отслеживает изменения в линии, при необходимости
снижая или повышая качество звука. Для свободного общения организован чат-сервер. В
ближайшее время планируется создать шлюз в городскую телефонную сеть.
Из систем, хорошо работающих на низких скоростях, определенный интерес может
представлять программа Free Tell. Она привлекает, прежде всего, маленьким размером
(около 300 кб) и неплохим качеством звука. Немаловажно и то, что программа распростра-
няется бесплатно.
Нельзя не упомянуть еще одного лидера в области услуг связи компьютер-телефон, фирму
Net2Phone. Сетью телефонных серверов Net2Phone (сравнимой с сетью Delta Three) охва-
чены практически все мало-мальски развитые регионы. Система позволяет пользователям
сети Интернет звонить на обычный телефон, не отходя от компьютера (и только так: в ре-
жиме телефон-телефон система не функционирует). У программы Net2phone удивительно
хорошее качество звука даже на медленных линиях. В этом легко убедиться, загрузив по-
следнюю версию программы. Она позволяет бесплатно звонить на телефонные номера, на-
чинающиеся с 800 и 888 - бесплатные американские и европейские номера (ими, как пра-
вило, оснащены службы поддержки крупных компаний). Перед началом работы с про-
граммой нужно зарегистрироваться на сервере и выбрать себе идентификационный код.
Однако если вы захотите получить возможность звонить на любой другой, кроме 800-ых,
телефонный номер, вам придется открыть собственный счет (или приобрести дебетную
карту), с которого и будут взиматься деньги за каждую минуту разговора.
Радиовещание в Интернет
Появилось несколько возможных способов применения звуковых потоков в Интер-
нет. Почти очевидным стало перенесение систем радиовещания из обычного радиоэфира в
цифровые сети. Тысячи радиостанций установили у себя потоковые серверы и начали пе-
редавать свои обычные «живые» программы в Интернет.
История радиовещания насчитывает не один десяток лет, и здесь уже давно про-
изошло разделение по жанровому признаку. Одни радиостанции передают только новости,
комментарии, интервью, а другие – только различную музыку. Немало радиостанций рабо-
тают в смешанном режиме, т. е. регулярно передают новости, а между ними – тематиче-
ские программы. И наконец, радиостанции так называемого иновещания используют осо-
бенный формат, учитывающий условия распространения радиоволн и поясное время в
местах приема.
В принципе руководство радиостанций стремится обеспечить качество приема че-
рез Интернет, по крайней мере, не хуже, чем с помощью радиоволн. Это означает, что речь
желательно передавать в полосе частот до 5-6 кГц, а музыку – до 10-12 кГц, причем в сте-
реофоническом режиме, т. е. передавать два канала одновременно.
Однако скорости передачи звуковых потоков в Интернет для большинства потен-
циальных слушателей все еще ограничены, и приходится идти на некоторые компромиссы.
Усовершенствование алгоритмов кодирования позволило получить вполне удовлетвори-
тельное качество звука при умеренной скорости передачи. С учетом реального положения
дел сложился ряд значений скоростей, применяемых для радиовещания через Интернет.
Хотя новостные и тематические передачи неплохо звучат при скорости потока всего 8
Кбит/с, многие радиостанции используют скорость 16 Кбит/с. При такой скорости хорошо
воспроизводится и музыка, а для стереофонической передачи музыкальные радиостанции
используют скорость потока 20 Кбит/с. Качество воспроизведения такого сигнала уже
можно признать отличным.
Форматы передачи звукоданных
Как уже стало понятно из вышеизложенного звук сегодня является действительно
неотъемлемым элементом мультимедийных домашних страниц в Интернет. Современные
звуковые технологии в Интернет ориентированы на решение самых разнообразных задач –
от вещательной передачи звуковых фрагментов в реальном масштабе времени до традици-
онных систем с растянутой во времени загрузкой файлов и последующим их воспроизве-
дением, причем применяются для этого самые различные форматы передачи звукоданных.
Сегодня в распоряжении пользователей целый ряд стандартных форматов звуко-
вых файлов:
WAV (от waveform - форма сигнала), или просто wave-файлы. Это наиболее рас-
пространенный формат звукоданных в компьютерах на платформе IBM/Windows. (При на-
личии соответствующего программного обеспечения можно воспроизводить WAV-файлы
на персональных компьютерах платформы Macintosh и других системах);
AU (Sparc-аудио) является одним из самых старых звуковых форматов для Интер-
нет и средства его воспроизведения разработаны практически для всех компьютерных
платформ;
AIFF (Audio Interchange Format) - формат обмена звуковой информацией, особенно
распространенный на платформе Macintosh. Он широко применяется в мультимедиа- при-
ложениях, но не является общепринятым в Web;
MIDI (Musical Instrument Digital Interface) - интерфейс электронных музыкальных
инструментов. Данный формат представляет не оцифрованный звук, а ноты и другую ин-
формацию, с помощью которой можно затем синтезировать музыку. Формат MIDI имеет
широкую поддержку и позволяет получить компактные файлы, но в Интернет полезен
лишь для ограниченного класса приложений;
MPEG - (Moution Picture Enhancing Group) стандартизованное в ИСО (стандарты
11172-3 и 13818-3) семейство форматов различного уровня сложности с гибкими возмож-
ностями сжатия аудио- и видеоданных.
В то же время MPEG еще не настолько распространен, как многие привыкли считать, и
разработка и стандартизация MPEG еще не завершена (сейчас готовится новый стандарт
MPEG-4). И, несмотря на хорошее качество и высокую эффективность передачи, аппарат-
но-программные средства кодирования и декодирования MPEG пока не так уж распро-
странены.
Звуковые файлы форматов AU и WAV воспроизводятся вспомогательными прило-
жениями и интегрируемыми модулями, но собственная поддержка данных форматов в
пользовательских программах-браузерах (навигаторах) по Интернет, наиболее распростра-
ненных сегодня - Netscape 3.0 и Internet Explorer 3.0 отсутствует. Качество воспроизведе-
ния формата WAV не настолько хорошее, как можно было бы ожидать от файлов такого
размера. MIDI-файлы могут аппаратно воспроизводиться звуковыми картами персональ-
ных компьютеров (такими, например, как SoundBlaster) и по качеству напоминают мело-
дии, издаваемые простым электромузыкальным клавишным инструментом.
Если необходим звук профессионального качества при высоком уровне уплотне-
ния, то единственным выбором является формат MPEG. Он дает приемлемые результаты и
в тех случаях, когда очень хорошее качество необязательно, однако такой недостаток про-
граммного обеспечения для его воспроизведения, как реализация только в виде вспомога-
тельных приложений, а не интегрируемых модулей или собственных средств браузеров,
нередко заставляет отдавать предпочтение другим форматам.
Хотя в общем случае при загрузке и воспроизведении звуковых файлов через Ин-
тернет следует придерживаться стандартных форматов, один патентованный формат за-
служивает особого упоминания. Это RapidTransit фирмы FastMan. В нем используется
схема адаптивного уплотнения волнового сигнала. Например, 30-секундный музыкальный
фрагмент "Hootie and the Blowfish" такого же качества, какое достигается воспроизведени-
ем записи с компакт-диска, в неуплотненном виде занимает объем 2,69 Мбайт, а после
сжатия в формате RapidTransit - всего 90 Кбайт. Патентованные форматы предлагают то,
чего не хватает многим "стандартным" форматам цифрового звука, а именно возможности
организации непрерывного потока данных (т.е. передачи в реальном масштабе времени).
Потоковые звукоданные не требуют дискового пространства и допускают произвольный
доступ к любому месту звукового файла.
Между тем у поточных звукоданных есть несколько потенциальных недостатков.
Во-первых, чтобы в достаточной мере сжать звукоданные для поточновой переда-
чи, приходится жертвовать качеством звукопередачи. Во-вторых, сами протоколы Интер-
нет не приспособлены к непрерывному поточному обмену. Каждый, кому в течение како-
го-то времени приходилось работать с Интернет, без сомнения, сталкивался с периодиче-
ски возникающими задержками.
RealAudio - звук "в реальном времени"
Впервые практическая передача звука через Интернет в непрерывном поточном
режиме была реализована в разработках фирмы Progressive Networks. На ее узле RealAudio
для пересылки непрерывных звукоданных вспомогательному приложению браузера, ин-
тегрируемому модулю Netscape (Shockwave Xtra) или элементу управления ActiveX ис-
пользуется специальный программный сервер. Благодаря наличию средств воспроизведе-
ния на всех основных компьютерных платформах RealAudio является сегодня наиболее
распространенным форматом непрерывной передачи звукоданных в Интернет.
Формат передачи звукоданных RealAudio (*.ra) сегодня самый популярный в Ин-
тернет, его используют большинство крупных звуковых служб и звуковых серверов, в Ин-
тернет. В настоящее время, несмотря на значительную конкуренцию и архитектурные ог-
раничения, формат RealAudio доминирует на рынке звуковых средств в Интернет.
"Бессерверные" методы звукопередачи в Интернет
Многие фирмы, которые хотели бы сделать доступной через Интернет звуковую
информацию ограниченного объема, не могут позволить себе выделить для этого специ-
альный сервер. К счастью, существует ряд решений, позволяющих использовать для этого
уже имеющийся Web-сервер. Одним из наиболее рациональных вариантов реализации зву-
ковой поддержки домашних страниц в Интернет является технология TrueSpeech компа-
нии DSPG.
Алгоритм кодирования звукоданных TrueSpeech создает достаточно компактные
файлы, что позволяет передавать непрерывные звукоданные на линиях с пропускной спо-
собностью 14,4 Кбит/с, сохраняя при этом такое же качество, как RealAudio. При неболь-
шой буферизации TrueSpeech способна передавать поток интегрируемому модулю или
вспомогательному приложению, функционирующим в программной среде Macintosh или
Windows.
Среди других популярных "бессерверных" аудиотехнологий можно упомянуть
лишь формат ToolVox фирмы Voxware. Предлагая впечатляющий алгоритм работы, спо-
собный сжимать звуковые файлы с коэффициентом 53:1, ToolVox реализует непрерывную
звукопередачу даже для пользователей Интернет, работающих на линиях с пропускной
способностью 2400 бит/с. Однако такое чудо возможно лишь для низкокачественной пере-
дачи речи. Как сообщает фирма-разработчик в своей документации, Voxware не подходит
для музыки и даже на речи иногда дает неудовлетворительные результаты.
На фоне отвлеченных споров о будущем Интернет, о протоколах и стандартах,
призванных обеспечить внедрение новейших технологий, отрадно наблюдать, как одна из
них – передача звукоданных – развивается практически. Причем в данном конкретном
случае понятно назначение информации и известны ее потребители. Разработанные звуко-
вые технологии масштабируемы, опираются на уже существующие стандарты и готовы к
переносу в более скоростные сети, как только те станут реальностью. Тогда по сети будут
передаваться звуковые потоки с качеством CD и без всяких перерывов.
Список литературы:
- Новости мира компьютерных технологий №4 , 1999 г.
- Network World №6, 1999 г
- LAN Magazine (Russian Edition)
- Системный Интегратор // Территориально-распределенные сети:
выбор технологии