Электронная почта

ПЛАН РАБОТЫ
ВВЕДЕНИЕ 2
1. ПОЧТОВЫЕ ПРОГРАММЫ 3
1.1. NETSCAPE NAVIGATOR 3
1.2. MS INTENET MAIL 3
1.3. EUDORA MAIL 4
1.4. ДРУГИЕ ПОЧТОВЫЕ ПРОГРАММЫ 4
2. СТРУКТУРА ЭЛЕКТРОННОГО ПИСЬМА 6
2.1. ОСНОВНЫЕ ПОНЯТИЯ 6
2.2. АДРЕСАЦИЯ 6
2.3. КОНВЕРТ 7
3. СИСТЕМЫ КОДИРОВКИ 9
3.1. КОДИРОВКА KOI8-R 9
3.2. КОДИРОВКА MS DOS 9
3.3. КОДИРОВКА MS WINDOWS 9
3.4. КОДИРОВКА ISO 8859-5 10
Коды символов 11
СПИСОК ЛИТЕРАТУРЫ 12
ВВЕДЕНИЕ
Электронная почта (E-mail) является самой популярной и распространенной служ-
бой Internet в нашей стране.
Родоначальником массового распространения E-mail в нашей стране является сеть
EuNet/Relcom, которая всем диктовала свои правила использования. Это было нормально
и все с этим мирились пока в стране сеть Relcom являлась единственной сетью, предос-
тавляющей телекоммуникационные услуги, и операционная система MS DOC являлась
основной системой на которой работали пользователи.
На самом деле электронная почта как средство передачи сообщений между пользо-
вателями ЭВМ, в том числе и у нас в стране, возникла задолго до появления Internet и
Relcom'а.
Если Вы работаете только с английским алфавитом и отправляете свои сообщения
тоже, используя только английский шрифт, то у Вас навряд ли возникнут проблемы с ис-
пользованием и установкой на свой компьютер программы поддержки E-mail. Основные
проблемы возникнут, когда Вы захотите отправить сообщение, используя кириллический
(русский) шрифт. Все дело в том, что у нас в стране не существует единого стандарта ко-
дировки русских букв.
1. ПОЧТОВЫЕ ПРОГРАММЫ
1.1. Netscape Navigator
Если на Вашей рабочей станции установлен Netscape Navigator, то выход на элек-
тронную почту Вам обеспечен почтовой оболочкой, входящей в его состав. Netscape
Navigator версии 3.0 автоматически распознает кодировки KOI8, Win1251 и ISO8859-5.
Правда чтобы прочитать письмо написанное в этих кодировках на Ваше рабочей станции
должны быть установлены соответствующие фонты, которые в свою очередь должны
быть подключены к Netscape Navigator (меню: Options, General Preferens, Fonts). Фонты
KOI8 можно взять с FTP сервера.
Для более корректной работы с русским языком следует использовать версию
Netscape Navigator 3.0 или 4.01, которую можно загрузить с FTP сервера ИВТ СО РАН.
Имея в своем распоряжении фонты KOI8, Вы можете читать практически любую
русскоязычную почту (кроме той, что пришла, например, в альтернативной кодировке или
в кодировке ISO 8859-5). Отметим, что для версии 4.0 и выше при работе под MS Windows
95/NT нет необходимости загружать шрифты KOI8 на Ваш компьютер, так сам про-
смотрщик делает необходимую перекодировку.
Подготовку почтовых сообщений для Netscape Navigator под MS Windows 3.11
можно организовать, используя драйверы клавиатуры KOI8, выбор которых зависит от
вида русификатора, установленного на вашей машине:
KOI8-R keyboard for ParaWin
KOI8-R keyboard for CyrWin 4.0
KOI8-R keyboard variant for WinKey
KOI8-R keyboard for Win95
Гораздо сложнее с отправкой почты под MS Windows 95 c Netscape Navigator 3.0,
так как он категорически не желает воспринимать драйвер клавиатуры для кодировки
KOI8, и Вы вынуждены набирать свои сообщения только в кодировке MS Windows. К со-
жалению, такое почтовое отправление правильно поймет почтовая программа, которая
знает эту кодировку. Большинство почтовых программ, работающих под DOS'ом к сожа-
лению этого не понимают и Ваш корреспондент будет всегда стоять перед проблемой пе-
рекодировки.
Если Вы получили сообщение в кодировке KOI8, а Вам для работы нужен текст в
альтернативной кодировке, то для перекодировки можно использовать программу cat.exe.
Обойти эту проблему можно, установив на своей машине Local proxy 1251 - koi8r
for Win95, осуществляющий перекодировку почтовых сообщений (протоколы: SMTP - от-
правка, POP3 - получение почты).
1.2. MS Intenet Mail
Если на рабочей станции установлена OS Windows 95 (или NT), то разумнее всего
использовать оболочку MS Intenet Mail, которая является компонентой Microsoft Internet
Expplorer полной версии 3.0, 4.0 или 5.0, который можно получить с WWW сервера фир-
мы Microsoft.
Для MS Windows 95/NT Microsoft Internet Expplorer доступен также на FTP сервере
ИВТ СО РАН.
Microsoft Internet Expplorer использует два режима передачи расширенной табли-
цы: MIME и UUENCODE.
Если Вы укажите ему использовать MIME, правильно работает с русскими текста-
ми (выставляет нужный charset), однако для прицепленных файлов он использует методы
передачи бинарных файлов по электронной почте Quoted Printable и base64, о которых ма-
ло кто в нашей стране знает.
В режиме UUENCODE MS Internet Mail использует 7 битную передачу с кодиров-
кой основного текста, не используя charset, и передает текст как он есть. На этом могут
споткнуться "умные" DOS'овские почтовые программы, которые захотят перекодировать
Ваше сообщение в альтернативную кодировку. Поэтому в этом случае, чтоб быть пра-
вильно понятым следует использовать режим передачи почты в кодировке KOI8.
Отметим, что для использования MS Inernet Mail нет необходимости загружать
фонты и драйвер клавиатуры KOI8.
Русскую инструкцию по использованию MS Inernet Mail можно найти на сервере
www.binet.lv: кодировки: [MS Windows] и [KOI8], ee автор: Егор Чемисов (E-Mail:
egor@binet.lv).
Кстати, если понадобится послать или прочитать сообщение в кодировке ISO8859-
5, то можно воспользоваться MS Exchange Translation Tables for koi8-r and iso8859-5.
Существует так же вариант программы MS Internet Mail в составе Microsoft Internet
Explorer для MS Windows 3.11 на WWW сервере фирмы Microsoft версии 2.01.
Вместе с почтовой программой и brouser'ом пакет содержит поддержку протоколов
TCP/IP, SMTP и DIAL-UP соединения. Вместе с русской версией пакета поставляется
файл автоматической перекодировки в KOI8.
1.3. Eudora MAIL
Почтовая оболочка Eudora является небольшим свободно распространяемым про-
граммным продуктом (Free Whare), работающим под MS Windows 3.11 и MS Windows 95
(существует также принципиальная возможность запустить эту оболочку и под MS DOS,
установив при этом пакет Winsoket - резидентная программа, занимающая около 100 Kb
оперативной памяти).
Основное преимущество оболочки Eudora - то, что она является многопользова-
тельской.
Eudora получает и отправляет почту в том виде, в котором она подготовлена (в
этом отношении правильно работает с русскими шрифтами), самостоятельно определяет,
используется ли в отправляемом сообщении вторая половина таблицы (русские шрифты)
и выставляет соответствующий charset.
К сожалению Eudora умеет работать только с одной расширенной кодовой табли-
цей (в стандартном варианте это кодировка ISO8859-2).
Кроме того, что Eudora небольшая программа (сама программа имеет размер 700
Kb, Help File - 1 Mb и около 400 Kb английский спеллинг, который можно удалить после
установки), основным ее достоинством является то, что она может работать в многополь-
зовательским режиме (в отличие от Netscape Navigator или MS Internet Mail).
Для установки программы Eudora нужно распаковать ее в директорию, установить
драйвер клавиатуры KOI8 и хотя бы один из шрифтов KOI8 (а лучше два: один для про-
смотра, другой для печати).
Пользовательский режим определяется командной строкой запуска программы:
c:\eudora\eudora.exe c:\usermail c:\userini\usereudora.ini
где
c:\eudora - каталог с программой Еudora;
c:\usermail - почтовый (рабочий) каталог пользователя User;
c:\userini\usereudora.ini - файл настроек пользователя User.
Данная командная строка записывается в соответствующий PIF файл для
MS Windows 3.11 и в параметры ярлыка для MS Windows 95.
Создать первоначальные копии файлов настроек пользователя можно, размножив
файл настроек eudora.ini из каталога, где находится Eudora.
1.4. Другие почтовые программы
Существующие версии программы WinPmail (Pegasus Mail for Windows), в отличие
от DOS'овского варианта (который использует стандартную перекодировку KOI8 --
CP855) плохо работает в стандартном режиме с русскими буквами. Использование спосо-
ба передачи MIME, как уже отмечалось, не уживается со старым программным обеспече-
нием.
Среди других почтовых программ можно предложить оболочку Mail Connection.
Кстати, распространенная для UNIX систем почтовая программа PINE (свободно распро-
страняемая оболочка, разработанная в Вашингтонском университете) работает так же и
под MS Windows.
2. СТРУКТУРА ЭЛЕКТРОННОГО ПИСЬМА
2.1. Основные понятия
Для того чтобы иметь возможность обмениваться письмами по электронной почте,
пользователь должен стать клиентом одной из компьютерных сетей. Также как и в теле-
фонных сетях, клиенты компьютерных сетей называются абонентами.
Для каждого абонента на одном из сетевых компьютеров выделяется область памя-
ти - электронный почтовый ящик. Доступ к этой области памяти осуществляется по адре-
су, который сообщается абоненту, и паролю, который абонент придумывает сам. Пароль
известен только абоненту и сетевому компьютеру. Став абонентом компьютерной сети и
получив адрес своего почтового ящика, пользователь может сообщить его друзьям, зна-
комым. Каждый абонент электронной почты может через свой компьютер и модем по-
слать письмо любому другому абоненту указав в послании его почтовый адрес. Но сде-
лать это можно, только сообщив компьютерной сети свой почтовый адрес и пароль (как
доказательство того, что это действительно абонент).
Все письма, поступающие на некоторый почтовый адрес, записываются в выделен-
ную для него область памяти сетевого компьютера. Сетевой компьютер, содержащий поч-
товые ящики абонентов носит название хост компьютера (от host - хозяин). Существуют
два основных типа электронной почты. Первый способ, называется off-line (вне линии, вне
связи, произносится: офлайн), заключается в том, что при каждом сеансе связи компьюте-
ра абонента с сетевым компьютером происходит обмен письмами в автоматическом ре-
жиме: все заранее подготовленные письма абонента передаются на сетевой компьютер, а
все письма, пришедшие на адрес абонента, передаются на его компьютер. Название off-
line подчеркивает тот факт, что сам процесс ознакомления с письмами и их чтение проис-
ходит, когда связь с сетевым компьютером уже прекращена.
Второй способ, названный, естественно, on-line (на линии, на связи, произносится:
онлайн), заключается в том, что абонент во время сеанса связи со своего компьютера по-
лучает возможность обратиться к содержимому своего почтового ящика, просмотреть его
и прочитать письма. Некоторые письма можно удалить не читая, на другие письма можно
сразу дать ответ, воспользовавшись клавиатурой своего компьютера. Можно также по-
слать все заготовленные заранее письма, являющиеся ничем иным как текстовыми файла-
ми. В режиме on-line абонент не пользуется автоматическим режимом, а отсылает все
письма сам, указывая их адреса и задавая соответствующую команду сетевому компьюте-
ру.
Один компьютер может обслуживать нескольких абонентов. В случае использова-
ния on-line сети, каждый абонент осуществляет связь с компьютерной сетью и выполняет
необходимые манипуляции для получения или отправки информации в соответствии со
своими задачами во время сеанса связи.
Для абонентов сети off-line существует возможность иметь отдельный почтовый
ящик на одном компьютере. Каждый абонент пользуется только своим почтовым ящиком,
а рассылка и получение писем, связь с телеконференциями и обращения к базам данных
для всех абонентов, пользующихся данным компьютером, осуществляются автоматически
в момент сеанса связи с компьютерной сетью. Такая сложная организация обмена инфор-
мацией с использованием одного компьютера приводит к необходимости выделения спе-
циального администратора для координации всего обмена информацией, осуществления
сеансов, связи и обнаружения заблудившихся писем.
2.2. Адресация
Адрес электронной почты, так же как и обычный почтовый адрес должен содер-
жать всю необходимую информацию для того, чтобы письмо дошло до адресата из любой
части земного шара. Точно так же, как и почтовый, электронный адрес состоит из двух
частей:
раздел "Куда" - содержит указание на хост компьютер;
раздел "Кому" - содержит учетное имя абонента.
В разных системах используются различные способы представления адреса. На-
пример, в системе INTERNET и совместимых с ней разделы "Кому" и "Куда" разделены
знаком "@", причем слева указывается "Кому". Например,
user@adonis.iasnet...,
где user - учетное имя абонента, а adonis.iasnet... - имя хост компьютера (adonis) и
указание, как его найти. Раздел "Куда" имеет иерархическую структуру. Уровни иерархии
называются доменами (domain - владение, сфера деятельности) и разделены точками. Ко-
личество доменов в адресе, вообще говоря, не ограничено. Самый правый домен пред-
ставляет собой домен верхнего уровня. В данном случае, ru - код России. Для всех стран
существуют двухбуквенные коды. Например :
au - Австралия,
br - Бразилия,
by - Беларусь,
ca - Канада,
cn - Китай,
de - Германия,
jp - Япония,
ua - Украина,
uk - Великобритания,
us - США.
Домен верхнего уровня не обязательно является кодом страны. Ниже приведены
примеры нескольких доменов верхнего уровня, используемых в США:
COM - коммерческие организации и бизнес;
EDU - образовательные учреждения;
NET - структурные организации системы;
ORG - неприбыльные организации;
INT - международный домен.
Домен второго уровня дает уточнение для поиска хост компьютера. Это может
быть код города или региона, в США - штата. В нашем случае домен второго уровня ука-
зывает на компьютерную сеть Института Автоматизированных систем (iasnet).
2.3. Конверт
Для того чтобы написанное вами письмо добралось до адресата, надо поместить
его в конверт, написать адрес и отправить по почте. Адресат, получив письмо, помимо
своего адреса обнаружит на конверте некоторые дополнительные данные, которые могут
оказаться полезными.
Если на конверте указан обратный адрес, то он может оказаться единственной воз-
можностью для обеспечения отправки ответа. Штемпели почтовых отделений покажут
даты прохождения письма через эти учреждения.
По аналогии с конвертом каждое письмо, приходящее по электронной почте снаб-
жено "шапкой", имеющей тот же смысл. В зависимости от того, какая телекоммуникаци-
онная система используется, структура адреса может выглядеть по-разному.
Структура электронного послания в системе INTERNET выглядит следующим об-
разом:
From: User Name
Date:2, November 1998 14:25
To: user1@adonis.iasnet...
Cc: user2@adonis.iasnet...
Bcc: user3@adonis.iasnet...
Subject: Hello
Первая строка сообщает адрес и имя отправителя. Строка, начинающаяся с Date,
содержит дату и время, когда послание было отправлено. Далее указывается адрес полу-
чателя. В строке начинающийся с Сс указывает адрес, которому посылается копия письма.
В следующей же строке указывается адрес пользователя, которому оправляется, невиди-
мая для адресата, копия письма. Таких строк может быть несколько или не быть ни одной.
В следующей строке указывается содержание письма, его заголовок (иногда так делается
и с обычными письмами, например в случае, когда организация требует помечать направ-
ляемые в нее письма, некоторым кратким сообщением, например, "На конкурс"). В пред-
последней строке указывается идентификатор послания, его уникальный номер. Если это
письмо послано в ответ на некоторое другое письмо, то номер этого исходного письма
указывается в последней строке. Для первоначальных, инициативных писем эта строка
отсутствует.
Однако точный порядок строк шапки послания может меняться от системы к сис-
теме. Кроме того, в шапку могут добавляться дополнительные строки, например,
Importance - важность послания. Указанный в примере состав шапки послания является
обязательным, так как все его компоненты существенны для правильной доставки посла-
ния.
3. СИСТЕМЫ КОДИРОВКИ
В настоящее время в нашей стране на разных компьютерах используются множест-
во различных кодировок русских букв: самые популярные из них это Кодировка KOI8
(RFC1489) - используется в большинстве OS UNIX (charset=KOI8-R);
3.1. Кодировка KOI8-R
Кодировка KOI8-R используется в большинстве компьютеров, работающих под OS
UNIX на территории бывшего Советского Союза.
С легкой руки КИЯИ - RELCOM'a (родоначальника Internet в нашей стране) эта ко-
дировка получила название "Русская сетевая кодировка" (Russian Network Code). Коди-
ровка зарегистрирована в Internet Architecture Board (IAB) в июле 1993 г. (см. RFC1489 ).
Русские буквы в кодовой таблице KOI8-R
В данной таблице указано расположение русских букв в вто-
рой половине расширенной кодовой таблицы.
Преимущество данной кодировки в том, что она не имеет разрывов - недостатки в
том, что она лексиграфически не упорядочена.
3.2. Кодировка MS DOS
Кодировка MS DOS СР866 предложена фирмой Microsoft для MS DOS 6.22.
Следует отметить, что эта кодировка немного отличается от кодировки, используе-
мой ранее фирмой Microsoft для MS DOC (CP855) и от альтернативной кодировки, разра-
ботанной для персональных компьютеров.
Русские буквы в кодовой таблице MS DOS
В данной таблице указано расположение русских букв в вто-
рой половине расширенной кодовой таблицы.
3.3. Кодировка MS Windows
Кодировка русского языка MS Windows СР1251 предложена фирмой Microsoft для
своих продуктов.
Ввиду гигантской экспансии фирмы Microsoft на Российский и Восточноевропей-
ский рынок эта кодировка является в настоящее время самой популярной (распространен-
ной в сети Internet) кодировкой русских букв в стране.
Русские буквы в кодовой таблице MS Windows
В данной таблице указано расположение русских букв в вто-
рой половине расширенной кодовой таблицы.
Преимущество данной кодировки в том, что она не имеет разрывов и лексиграфи-
чески упорядочена, однако до сих пор не "узаконена".
3.4. Кодировка ISO 8859-5
Единственная "узаконенная" международной организацией стандартизации (ISO)
кодировка русского языка. Используется на больших UNIX машинах (в основном фирм
DEC и Sun Microsystems). (см. RFC1345, RFC1700).
Русские буквы в кодовой таблице ISO 8859-5
В данной таблице указано расположение русских букв в вто-
рой половине расширенной кодовой таблицы.
Стандарт ISO 8859-5 определяет однобайтную восьмибитную кодировку символов
кириллицы и латинского алфавита ISO/IEC 8859-5:1988 (Information Processing - 8-bit
single-byte coded graphic character sets - Part 5: Latin/Cyrillic alphabet).
Стандарт ISO 8859-5 является международным и поэтому в нем представлены не
только символы алфавита русского языка, но и других языков, использующих кириллицу:
Белорусский
Украинский
Болгарский
Сербский
Македонский
Это обстоятельство является особенно важным при разработке систем передачи,
обработки и хранения информации. Именно поэтому кодировка ISO 8859-5 получила ши-
рокое распространение в программных продуктах, устройствах ввода и отображения ин-
формации крупных производителей программного обеспечения и вычислительной техни-
ки. Кроме этого, кодировка ISO 8859-5 широко используется в основных международных
и индустриальных стандартах средств обработки, и передачи информации.
В сети Internet, кодировка ISO 8859-5 определена в стандарте STD-2:
Name: ISO_8859-5:1988
Source: ECMA registry
Alias: iso-ir-144
Alias: ISO_8859-5
Alias: ISO-8859-5
Alias: cyrillic
Замечание: в настоящий момент в сети Internet для этой кодовой таблицы исполь-
зуются и другие синонимы (alias).
Коды символов
Русские буквы в кодировке ISO 8859-5 расположены в алфавитном порядке. Коды
с 176 по 207 - заглавные буквы, коды с 208 по 239 - строчные буквы. Остальные символы
кириллицы, включая русскую букву "Ё", располагаются на местах 161 - 175 (заглавные
буквы) и 241 - 255 (строчные буквы). Коды символов кириллицы имеют смещение 864
(0x0360) относительно универсальной шестнадцатибитной кодировки ISO 10646.
Управляющие, латинские и специальные символы с кодами от 0 до 160 эквива-
лентны соответствующим символам в кодировке ISO 8859-1 (Latin Alphabet No. 1).
Буквы русского алфавита и их коды в стандарте ISO 8859-5 приведены в таблицах
1, и 2. В таблицах также приведены дескриптивные имена и коды символов согласно
стандарту ISO 10646, а также имена символов, используемые в приложениях языка SGML,
например, широко известного языка гипертекстовой разметки HTML (HyperText Markup
Language).
Кроме них существуют еще кодировка MacOS, а также почти забытая альтернатив-
ная кодировка (CP855), и уже совсем забытые кодировки основная (или болгарская) и
ГОСТ.
Замечание: в настоящий момент в сети Internet для этой кодовой таблицы исполь-
зуются и другие синонимы (alias) для указателя charset.
Из всех перечисленных кодировок только кодировка ISO8859-5 "узаконена"
Международной Организацией по Стандартизации (ISO), но, к сожалению, она очень ред-
ко используется на современных компьютерах.
Сеть Internet развивалась первоначально как сеть UNIX машин и унаследовала все
свойства представления информации в OS UNIX. Для передачи информации первоначаль-
но использовался только 7 битный код (т.е. передавалась только первая половина кодовой
таблицы). Позже были разработаны различные способы передачи всей кодовой таблицы
(transfer encoding=8 bit).
Наследие UNIX'а коснулось и системы передачи электронной почты. Неписаным
телекоммуникационным стандартом передачи русских букв изначально стал стандарт OS
UNIX кодировка KOI8. Практически все почтовые оболочки (изначально разработанные
для MS DOS) перекодировали DOS'овскую кодировку CP855 в KOI8 и после этого пере-
давали сообщение.
Такое единообразие нарушилось с появлением в нашей стране других сетей, вхо-
дящих в систему Internet, таких как HEPNet (Radio-MSU) (этой сети принадлежит "Сеть
Internet Новосибирского научного центра"), FreeNet, RUNNet (сеть университетов России)
и др., и новых операционных систем, таких как MS Windows NT, MacOS, OS/2 и др. и сис-
темы передачи всей кодовой таблицы. Начиная с 1995 года старая система передачи рус-
ских сообщений стала постоянно давать сбои и корреспонденты то и дело вместо русского
текста стали получать абракадабру, которую правда можно было расшифровать, или хуже
всего сплошные квадратики (или точки), которые уже не поддавались расшифровке. Тем
самым единый способ перекодировки русских букв оказался неприемлемым для исполь-
зования в передаче почтовых сообщений.
Для правильной работы, используемая оболочка для передачи почтовых сообще-
ний, которые содержат русские символы, должна правильно выставлять указатель кодо-
вой таблицы (Code Page) (transfer encoding=8 bit Charset="УКАЗАТЕЛЬ ТАБЛИЦЫ") (см.
список синонимов - alias - кодовых таблиц).
К сожалению старые DOS'овские почтовые системы не понимают различных сис-
тем кодировок. Поэтому, если корреспондент сидит за рабочей станцией, которая является
DOS'овской машиной, то, чтоб не создавать лишних трудностей, рекомендуется отправ-
лять почту в кодировке KOI8-R, а DOS'совская почтовая оболочка аккуратно переведет
сообщение в альтернативную (или в кодировку CP866) кодировку.
СПИСОК ЛИТЕРАТУРЫ
1. Богданова Д.А., Телекоммуникации в школе. //Информатика и образование,
№№ 1-3, 1996
2. Кенин А.М., Печенкина Н.С., IBM PC для пользователей или как научится
работать на компьютере.- Екатеринбург: АРД ЛТД, 1997
3. Шафрин Ю., Основы компьютерной технологии.- М.: АБФ, 1997
4. Якубайтис Э.А., Информатика-электроника-сети.- М.: Финансы и статисти-
ка, 1989