План работы
Введение.. 2
1. Почтовые программы... 3
1.1. Netscape Navigator. 3
1.2. MS Intenet Mail. 3
1.3. Eudora MAIL.. 4
1.4. Другие почтовые программы.. 4
2. Структура электронного письма.. 6
2.1. Основные понятия. 6
2.2. Адресация. 6
2.3. Конверт. 7
3. Системы кодировки.. 9
3.1. Кодировка KOI8-R.. 9
3.2. Кодировка MS DOS. 9
3.3. Кодировка MS Windows. 9
3.4. Кодировка ISO 8859-5. 10
Коды символов. 11
Список литературы... 12
Введение
Электронная почта (E-mail) является самой популярной и распространенной службой Internet в нашей стране.
Родоначальником массового распространения E-mail в нашей стране является сеть EuNet/Relcom, которая всем диктовала свои правила использования. Это было нормально и все с этим мирились пока в стране сеть Relcom являлась единственной сетью, предоставляющей телекоммуникационные услуги, и операционная система MS DOC являлась основной системой на которой работали пользователи.
На самом деле электронная почта как средство передачи сообщений между пользователями ЭВМ, в том числе и у нас в стране, возникла задолго до появления Internet и Relcom'а.
Если Вы работаете только с английским алфавитом и отправляете свои сообщения тоже, используя только английский шрифт, то у Вас навряд ли возникнут проблемы с использованием и установкой на свой компьютер программы поддержки E-mail. Основные проблемы возникнут, когда Вы захотите отправить сообщение, используя кириллический (русский) шрифт. Все дело в том, что у нас в стране не существует единого стандарта кодировки русских букв.
1.1. Netscape Navigator
Если на Вашей рабочей станции установлен Netscape Navigator, то выход на электронную почту Вам обеспечен почтовой оболочкой, входящей в его состав. Netscape Navigator версии 3.0 автоматически распознает кодировки KOI8, Win1251 и ISO8859-5. Правда чтобы прочитать письмо написанное в этих кодировках на Ваше рабочей станции должны быть установлены соответствующие фонты, которые в свою очередь должны быть подключены к Netscape Navigator (меню: Options, General Preferens, Fonts). Фонты KOI8 можно взять с FTP сервера.
Для более корректной работы с русским языком следует использовать версию Netscape Navigator 3.0 или 4.01, которую можно загрузить с FTP сервера ИВТ СО РАН.
Имея в своем распоряжении фонты KOI8, Вы можете читать практически любую русскоязычную почту (кроме той, что пришла, например, в альтернативной кодировке или в кодировке ISO 8859-5). Отметим, что для версии 4.0 и выше при работе под MS Windows 95/NT нет необходимости загружать шрифты KOI8 на Ваш компьютер, так сам просмотрщик делает необходимую перекодировку.
Подготовку почтовых сообщений для Netscape Navigator под MS Windows 3.11 можно организовать, используя драйверы клавиатуры KOI8, выбор которых зависит от вида русификатора, установленного на вашей машине:
KOI8-R keyboard for ParaWin
KOI8-R keyboard for CyrWin 4.0
KOI8-R keyboard variant for WinKey
KOI8-R keyboard for Win95
Гораздо сложнее с отправкой почты под MS Windows 95 c Netscape Navigator 3.0, так как он категорически не желает воспринимать драйвер клавиатуры для кодировки KOI8, и Вы вынуждены набирать свои сообщения только в кодировке MS Windows. К сожалению, такое почтовое отправление правильно поймет почтовая программа, которая знает эту кодировку. Большинство почтовых программ, работающих под DOS'ом к сожалению этого не понимают и Ваш корреспондент будет всегда стоять перед проблемой перекодировки.
Если Вы получили сообщение в кодировке KOI8, а Вам для работы нужен текст в альтернативной кодировке, то для перекодировки можно использовать программу cat.exe.
Обойти эту проблему можно, установив на своей машине Local proxy 1251 - koi8r for Win95, осуществляющий перекодировку почтовых сообщений (протоколы: SMTP - отправка, POP3 - получение почты).
1.2. MS Intenet Mail
Если на рабочей станции установлена OS Windows 95 (или NT), то разумнее всего использовать оболочку MS Intenet Mail, которая является компонентой Microsoft Internet Expplorer полной версии 3.0, 4.0 или 5.0, который можно получить с WWW сервера фирмы Microsoft.
Для MS Windows 95/NT Microsoft Internet Expplorer доступен также на FTP сервере ИВТ СО РАН.
Microsoft Internet Expplorer использует два режима передачи расширенной таблицы: MIME и UUENCODE.
Если Вы укажите ему использовать MIME, правильно работает с русскими текстами (выставляет нужный charset), однако для прицепленных файлов он использует методы передачи бинарных файлов по электронной почте Quoted Printable и base64, о которых мало кто в нашей стране знает.
В режиме UUENCODE MS Internet Mail использует 7 битную передачу с кодировкой основного текста, не используя charset, и передает текст как он есть. На этом могут споткнуться "умные" DOS'овские почтовые программы, которые захотят перекодировать Ваше сообщение в альтернативную кодировку. Поэтому в этом случае, чтоб быть правильно понятым следует использовать режим передачи почты в кодировке KOI8.
Отметим, что для использования MS Inernet Mail нет необходимости загружать фонты и драйвер клавиатуры KOI8.
Русскую инструкцию по использованию MS Inernet Mail можно найти на сервере www.binet.lv: кодировки: [MS Windows] и [KOI8], ee автор: Егор Чемисов (E-Mail: [email protected]).
Кстати, если понадобится послать или прочитать сообщение в кодировке ISO8859-5, то можно воспользоваться MS Exchange Translation Tables for koi8-r and iso8859-5.
Существует так же вариант программы MS Internet Mail в составе Microsoft Internet Explorer для MS Windows 3.11 на WWW сервере фирмы Microsoft версии 2.01.
Вместе с почтовой программой и brouser'ом пакет содержит поддержку протоколов TCP/IP, SMTP и DIAL-UP соединения. Вместе с русской версией пакета поставляется файл автоматической перекодировки в KOI8.
1.3. Eudora MAIL
Почтовая оболочка Eudora является небольшим свободно распространяемым программным продуктом (Free Whare), работающим под MS Windows 3.11 и MS Windows 95 (существует также принципиальная возможность запустить эту оболочку и под MS DOS, установив при этом пакет Winsoket - резидентная программа, занимающая около 100 Kb оперативной памяти).
Основное преимущество оболочки Eudora - то, что она является многопользовательской.
Eudora получает и отправляет почту в том виде, в котором она подготовлена (в этом отношении правильно работает с русскими шрифтами), самостоятельно определяет, используется ли в отправляемом сообщении вторая половина таблицы (русские шрифты) и выставляет соответствующий charset.
К сожалению Eudora умеет работать только с одной расширенной кодовой таблицей (в стандартном варианте это кодировка ISO8859-2).
Кроме того, что Eudora небольшая программа (сама программа имеет размер 700 Kb, Help File - 1 Mb и около 400 Kb английский спеллинг, который можно удалить после установки), основным ее достоинством является то, что она может работать в многопользовательским режиме (в отличие от Netscape Navigator или MS Internet Mail).
Для установки программы Eudora нужно распаковать ее в директорию, установить драйвер клавиатуры KOI8 и хотя бы один из шрифтов KOI8 (а лучше два: один для просмотра, другой для печати).
Пользовательский режим определяется командной строкой запуска программы:
c:\eudora\eudora.exe c:\usermail c:\userini\usereudora.ini
где
c:\eudora - каталог с программой Еudora;
c:\usermail - почтовый (рабочий) каталог пользователя User;
c:\userini\usereudora.ini - файл настроек пользователя User.
Данная командная строка записывается в соответствующий PIF файл для MS Windows 3.11 и в параметры ярлыка для MS Windows 95.
Создать первоначальные копии файлов настроек пользователя можно, размножив файл настроек eudora.ini из каталога, где находится Eudora.
1.4. Другие почтовые программы
Существующие версии программы WinPmail (Pegasus Mail for Windows), в отличие от DOS'овского варианта (который использует стандартную перекодировку KOI8 -- CP855) плохо работает в стандартном режиме с русскими буквами. Использование способа передачи MIME, как уже отмечалось, не уживается со старым программным обеспечением.
Среди других почтовых программ можно предложить оболочку Mail Connection. Кстати, распространенная для UNIX систем почтовая программа PINE (свободно распространяемая оболочка, разработанная в Вашингтонском университете) работает так же и под MS Windows.
2.1. Основные понятия
Для того чтобы иметь возможность обмениваться письмами по электронной почте, пользователь должен стать клиентом одной из компьютерных сетей. Также как и в телефонных сетях, клиенты компьютерных сетей называются абонентами.
Для каждого абонента на одном из сетевых компьютеров выделяется область памяти - электронный почтовый ящик. Доступ к этой области памяти осуществляется по адресу, который сообщается абоненту, и паролю, который абонент придумывает сам. Пароль известен только абоненту и сетевому компьютеру. Став абонентом компьютерной сети и получив адрес своего почтового ящика, пользователь может сообщить его друзьям, знакомым. Каждый абонент электронной почты может через свой компьютер и модем послать письмо любому другому абоненту указав в послании его почтовый адрес. Но сделать это можно, только сообщив компьютерной сети свой почтовый адрес и пароль (как доказательство того, что это действительно абонент).
Все письма, поступающие на некоторый почтовый адрес, записываются в выделенную для него область памяти сетевого компьютера. Сетевой компьютер, содержащий почтовые ящики абонентов носит название хост компьютера (от host - хозяин). Существуют два основных типа электронной почты. Первый способ, называется off-line (вне линии, вне связи, произносится: офлайн), заключается в том, что при каждом сеансе связи компьютера абонента с сетевым компьютером происходит обмен письмами в автоматическом режиме: все заранее подготовленные письма абонента передаются на сетевой компьютер, а все письма, пришедшие на адрес абонента, передаются на его компьютер. Название off-line подчеркивает тот факт, что сам процесс ознакомления с письмами и их чтение происходит, когда связь с сетевым компьютером уже прекращена.
Второй способ, названный, естественно, on-line (на линии, на связи, произносится: онлайн), заключается в том, что абонент во время сеанса связи со своего компьютера получает возможность обратиться к содержимому своего почтового ящика, просмотреть его и прочитать письма. Некоторые письма можно удалить не читая, на другие письма можно сразу дать ответ, воспользовавшись клавиатурой своего компьютера. Можно также послать все заготовленные заранее письма, являющиеся ничем иным как текстовыми файлами. В режиме on-line абонент не пользуется автоматическим режимом, а отсылает все письма сам, указывая их адреса и задавая соответствующую команду сетевому компьютеру.
Один компьютер может обслуживать нескольких абонентов. В случае использования on-line сети, каждый абонент осуществляет связь с компьютерной сетью и выполняет необходимые манипуляции для получения или отправки информации в соответствии со своими задачами во время сеанса связи.
Для абонентов сети off-line существует возможность иметь отдельный почтовый ящик на одном компьютере. Каждый абонент пользуется только своим почтовым ящиком, а рассылка и получение писем, связь с телеконференциями и обращения к базам данных для всех абонентов, пользующихся данным компьютером, осуществляются автоматически в момент сеанса связи с компьютерной сетью. Такая сложная организация обмена информацией с использованием одного компьютера приводит к необходимости выделения специального администратора для координации всего обмена информацией, осуществления сеансов, связи и обнаружения заблудившихся писем.
2.2. Адресация
Адрес электронной почты, так же как и обычный почтовый адрес должен содержать всю необходимую информацию для того, чтобы письмо дошло до адресата из любой части земного шара. Точно так же, как и почтовый, электронный адрес состоит из двух частей:
раздел "Куда" - содержит указание на хост компьютер;
раздел "Кому" - содержит учетное имя абонента.
В разных системах используются различные способы представления адреса. Например, в системе INTERNET и совместимых с ней разделы "Кому" и "Куда" разделены знаком "@", причем слева указывается "Кому". Например,
[email protected],
где user - учетное имя абонента, а adonis.iasnet.ru - имя хост компьютера (adonis) и указание, как его найти. Раздел "Куда" имеет иерархическую структуру. Уровни иерархии называются доменами (domain - владение, сфера деятельности) и разделены точками. Количество доменов в адресе, вообще говоря, не ограничено. Самый правый домен представляет собой домен верхнего уровня. В данном случае, ru - код России. Для всех стран существуют двухбуквенные коды. Например :
au - Австралия,
br - Бразилия,
by - Беларусь,
ca - Канада,
cn - Китай,
de - Германия,
jp - Япония,
ua - Украина,
uk - Великобритания,
us - США.
Домен верхнего уровня не обязательно является кодом страны. Ниже приведены примеры нескольких доменов верхнего уровня, используемых в США:
COM - коммерческие организации и бизнес;
EDU - образовательные учреждения;
NET - структурные организации системы;
ORG - неприбыльные организации;
INT - международный домен.
Домен второго уровня дает уточнение для поиска хост компьютера. Это может быть код города или региона, в США - штата. В нашем случае домен второго уровня указывает на компьютерную сеть Института Автоматизированных систем (iasnet).
2.3. Конверт
Для того чтобы написанное вами письмо добралось до адресата, надо поместить его в конверт, написать адрес и отправить по почте. Адресат, получив письмо, помимо своего адреса обнаружит на конверте некоторые дополнительные данные, которые могут оказаться полезными.
Если на конверте указан обратный адрес, то он может оказаться единственной возможностью для обеспечения отправки ответа. Штемпели почтовых отделений покажут даты прохождения письма через эти учреждения.
По аналогии с конвертом каждое письмо, приходящее по электронной почте снабжено "шапкой", имеющей тот же смысл. В зависимости от того, какая телекоммуникационная система используется, структура адреса может выглядеть по-разному.
Структура электронного послания в системе INTERNET выглядит следующим образом:
From: User Name <[email protected]>
Date:2, November 1998 14:25
To: user1
@adonis.iasnet.ru
Cc: [email protected]
Bcc: [email protected]
Subject: Hello
Первая строка сообщает адрес и имя отправителя. Строка, начинающаяся с Date, содержит дату и время, когда послание было отправлено. Далее указывается адрес получателя. В строке начинающийся с Сс указывает адрес, которому посылается копия письма. В следующей же строке указывается адрес пользователя, которому оправляется, невидимая для адресата, копия письма. Таких строк может быть несколько или не быть ни одной. В следующей строке указывается содержание письма, его заголовок (иногда так делается и с обычными письмами, например в случае, когда организация требует помечать направляемые в нее письма, некоторым кратким сообщением, например, "На конкурс"). В предпоследней строке указывается идентификатор послания, его уникальный номер. Если это письмо послано в ответ на некоторое другое письмо, то номер этого исходного письма указывается в последней строке. Для первоначальных, инициативных писем эта строка отсутствует.
Однако точный порядок строк шапки послания может меняться от системы к системе. Кроме того, в шапку могут добавляться дополнительные строки, например, Importance - важность послания. Указанный в примере состав шапки послания является обязательным, так как все его компоненты существенны для правильной доставки послания.
В настоящее время в нашей стране на разных компьютерах используются множество различных кодировок русских букв: самые популярные из них это Кодировка KOI8 (RFC1489) - используется в большинстве OS UNIX (charset=KOI8-R);
3.1. Кодировка KOI8-R
Кодировка KOI8-R используется в большинстве компьютеров, работающих под OS UNIX на территории бывшего Советского Союза.
С легкой руки КИЯИ - RELCOM'a (родоначальника Internet в нашей стране) эта кодировка получила название "Русская сетевая кодировка" (Russian Network Code). Кодировка зарегистрирована в Internet Architecture Board (IAB) в июле 1993 г. (см. RFC1489 ).
Русские буквы в кодовой таблице KOI8-R
|
В данной таблице указано расположение русских букв в второй половине расширенной кодовой таблицы.
|
Преимущество данной кодировки в том, что она не имеет разрывов - недостатки в том, что она лексиграфически не упорядочена.
3.2. Кодировка MS DOS
Кодировка MS DOS СР866 предложена фирмой Microsoft для MS DOS 6.22.
Следует отметить, что эта кодировка немного отличается от кодировки, используемой ранее фирмой Microsoft для MS DOC (CP855) и от альтернативной кодировки, разработанной для персональных компьютеров.
Русские буквы в кодовой таблице MS DOS
|
В данной таблице указано расположение русских букв в второй половине расширенной кодовой таблицы.
|
3.3. Кодировка
MS Windows
Кодировка русского языка MS Windows СР1251 предложена фирмой Microsoft для своих продуктов.
Ввиду гигантской экспансии фирмы Microsoft на Российский и Восточноевропейский рынок эта кодировка является в настоящее время самой популярной (распространенной в сети Internet) кодировкой русских букв в стране.
Русские буквы в кодовой таблице MS Windows
|
В данной таблице указано расположение русских букв в второй половине расширенной кодовой таблицы.
|
Преимущество данной кодировки в том, что она не имеет разрывов и лексиграфически упорядочена, однако до сих пор не "узаконена".
3.4. Кодировка ISO 8859-5
Единственная "узаконенная" международной организацией стандартизации (ISO) кодировка русского языка. Используется на больших UNIX машинах (в основном фирм DEC и Sun Microsystems). (см. RFC1345, RFC1700).
Русские буквы в кодовой таблице ISO 8859-5
|
В данной таблице указано расположение русских букв в второй половине расширенной кодовой таблицы.
|
Стандарт ISO 8859-5 определяет однобайтную восьмибитную кодировку символов кириллицы и латинского алфавита ISO/IEC 8859-5:1988 (Information Processing - 8-bit single-byte coded graphic character sets - Part 5: Latin/Cyrillic alphabet).
Стандарт ISO 8859-5 является международным и поэтому в нем представлены не только символы алфавита русского языка, но и других языков, использующих кириллицу:
Белорусский
Украинский
Болгарский
Сербский
Македонский
Это обстоятельство является особенно важным при разработке систем передачи, обработки и хранения информации. Именно поэтому кодировка ISO 8859-5 получила широкое распространение в программных продуктах, устройствах ввода и отображения информации крупных производителей программного обеспечения и вычислительной техники. Кроме этого, кодировка ISO 8859-5 широко используется в основных международных и индустриальных стандартах средств обработки, и передачи информации.
В сети Internet, кодировка ISO 8859-5 определена в стандарте STD-2:
Name: ISO_8859-5:1988
Source: ECMA registry
Alias: iso-ir-144
Alias: ISO_8859-5
Alias: ISO-8859-5
Alias: cyrillic
Замечание: в настоящий момент в сети Internet для этой кодовой таблицы используются и другие синонимы (alias).
Коды символов
Русские буквы в кодировке ISO 8859-5 расположены в алфавитном порядке. Коды с 176 по 207 - заглавные буквы, коды с 208 по 239 - строчные буквы. Остальные символы кириллицы, включая русскую букву "Ё", располагаются на местах 161 - 175 (заглавные буквы) и 241 - 255 (строчные буквы). Коды символов кириллицы имеют смещение 864 (0x0360) относительно универсальной шестнадцатибитной кодировки ISO 10646.
Управляющие, латинские и специальные символы с кодами от 0 до 160 эквивалентны соответствующим символам в кодировке ISO 8859-1 (Latin Alphabet No. 1).
Буквы русского алфавита и их коды в стандарте ISO 8859-5 приведены в таблицах 1, и 2. В таблицах также приведены дескриптивные имена и коды символов согласно стандарту ISO 10646, а также имена символов, используемые в приложениях языка SGML, например, широко известного языка гипертекстовой разметки HTML (HyperText Markup Language).
Кроме них существуют еще кодировка MacOS, а также почти забытая альтернативная кодировка (CP855), и уже совсем забытые кодировки основная (или болгарская) и ГОСТ.
Замечание: в настоящий момент в сети Internet для этой кодовой таблицы используются и другие синонимы (alias) для указателя charset.
Из всех перечисленных кодировок только кодировка ISO8859-5 "узаконена" Международной Организацией по Стандартизации (ISO), но, к сожалению, она очень редко используется на современных компьютерах.
Сеть Internet развивалась первоначально как сеть UNIX машин и унаследовала все свойства представления информации в OS UNIX. Для передачи информации первоначально использовался только 7 битный код (т.е. передавалась только первая половина кодовой таблицы). Позже были разработаны различные способы передачи всей кодовой таблицы (transfer encoding=8 bit).
Наследие UNIX'а коснулось и системы передачи электронной почты. Неписаным телекоммуникационным стандартом передачи русских букв изначально стал стандарт OS UNIX кодировка KOI8. Практически все почтовые оболочки (изначально разработанные для MS DOS) перекодировали DOS'овскую кодировку CP855 в KOI8 и после этого передавали сообщение.
Такое единообразие нарушилось с появлением в нашей стране других сетей, входящих в систему Internet, таких как HEPNet (Radio-MSU) (этой сети принадлежит "Сеть Internet Новосибирского научного центра"), FreeNet, RUNNet (сеть университетов России) и др., и новых операционных систем, таких как MS Windows NT, MacOS, OS/2 и др. и системы передачи всей кодовой таблицы. Начиная с 1995 года старая система передачи русских сообщений стала постоянно давать сбои и корреспонденты то и дело вместо русского текста стали получать абракадабру, которую правда можно было расшифровать, или хуже всего сплошные квадратики (или точки), которые уже не поддавались расшифровке. Тем самым единый способ перекодировки русских букв оказался неприемлемым для использования в передаче почтовых сообщений.
Для правильной работы, используемая оболочка для передачи почтовых сообщений, которые содержат русские символы, должна правильно выставлять указатель кодовой таблицы (Code Page) (transfer encoding=8 bit Charset="УКАЗАТЕЛЬ ТАБЛИЦЫ") (см. список синонимов - alias - кодовых таблиц).
К сожалению старые DOS'овские почтовые системы не понимают различных систем кодировок. Поэтому, если корреспондент сидит за рабочей станцией, которая является DOS'овской машиной, то, чтоб не создавать лишних трудностей, рекомендуется отправлять почту в кодировке KOI8-R, а DOS'совская почтовая оболочка аккуратно переведет сообщение в альтернативную (или в кодировку CP866) кодировку.
Список литературы
1. Богданова Д.А., Телекоммуникации в школе. //Информатика и образование, №№ 1-3, 1996
2. Кенин А.М., Печенкина Н.С., IBM PC для пользователей или как научится работать на компьютере.- Екатеринбург: АРД ЛТД, 1997
3. Шафрин Ю., Основы компьютерной технологии.- М.: АБФ, 1997
4. Якубайтис Э.А., Информатика-электроника-сети.- М.: Финансы и статистика, 1989
|