Форматы автоматизированных библиографических систем USMARC и UNIMARC
 
Содержание:
Введение
Глава 1. Описание формата USMARC
1.1. Термины USMARC и их определения
1.2. Коммуникативный формат USMARC
Глава 2. Формат UNIMARC
2.1. Цели создания формата UNIMARC
2.2. Отличие формата UNIMARC от формата USMARC
2.3. Конвертирование данных по структуре USMARC“UNIMARC
Заключение
 
ВВЕДЕНИЕ.
Термин MARC представляет собой акроним названия системы Machine- Readable Catalogue or Cataloguing (Машиночитаемый каталог или каталогизация) . Однако это название не совсем точно, поскольку MARC не является ни каким-либо видом каталога, ни методом каталогизации. Фактически MARC- это краткий и удобный термин для обозначения процесса маркировки любой части каталогизационной записи так, чтобы она могла быть обработана с помощью компьютера.
В общих словах, коммуникативный формат MARC должен обеспечивать:
возможность его применения для всех видов библиотечных документов;
достаточную гибкость для решения разнообразных задач в дополнение к каталогизации;
удобство применения в различных автоматизированных системах.
Применение стандарта MARC в библиотеке, которая до этого работала с каталожными карточками, заметно увеличит скорость работы, то есть не будет необходимости стоять "бог знает сколько времени" у каталога, чтобы найти нужную карточку. Стандарт MARC позволяет найти любую книгу, которая имеется в библиотеке, в считанные секунды. Например, если читатель забыл или не знает какого- либо нужного описания книги (автор, название и т.п.) , то MARC даёт возможность найти эту книгу по ключевым словам. К достоинствам MARC-а следует отнести и то, что он требует минимум один компьютер, то есть все те каталоги с карточками становятся ненужными.
Использование стандарта MARC предотвращает дублирование работы и помогает библиотекам лучше распорядится библиотечными ресурсами. Выбор для работы формата MARC даёт библиотекам возможность приобретать надёжные каталогизационные данные, представленные в правильной форме.
Применение стандарта MARC при управлении библиотечными операциями позволяет библиотекарям использовать имеющиеся автоматизированные библиотечные системы. Многие системы, доступные библиотекам разного уровня, спроектированы для работы с форматом MARC. Они технически обслуживаются и совершенствуются, так что библиотеки могут пользоваться преимуществами последних достижений в компьютерной технологии. Стандарт MARC позволяет также библиотекам заменить одну систему на другую с уверенностью, что их данные будут совместимы.
Несмотря на сотрудничество стран в этой области появилось несколько версий формата MARC таких, как UKMARC, INTERMARC, USMARC, расхождения в которых были вызваны различиями в национальных правилах и практике каталогизации.
ГЛАВА 1. ОПИСАНИЕ ФОРМАТА USMARC.
Библиотека Конгресса является официальным депозитарием публикаций Соединённых Штатов и первичным источником каталогизационных записей для международных публикаций и публикаций США. В 1960-е гг. Библиотека Конгресса разработала формат MARC Библиотеки Конгресса (формат LC MARC) , систему, использующую в каталогизационной записи цифры, буквы и другие символы для обозначения различных типов информации. В процессе развития формат LC MARC стал форматом USMARC (форматом MARC США) . Ведение библиографического формата USMARC, также как и официальной документации USMARC, осуществляется Библиотекой Конгресса.
1.1 ТЕРМИНЫ USMARC И ИХ ОПРЕДЕЛЕНИЯ.
Указатели данных (Signposts) : Чтобы считывать и интерпретировать библиографическую запись, компьютеру необходима помощь. Таблица 1 иллюстрирует информацию, для обозначения которой требуются "signposts".
Таблица 1. Запись с текстовыми "signposts": Та же запись с метками MARC:
"SIGNPOSTS"
ДАННЫЕ
"SIGNPOSTS"
ДАННЫЕ

Заголовок основной библиографической записи: Имя:
King, Stephen
100 1 $а
King, Stephen

Заглавие и сведения об ответственности: Основное заглавие: Сведения об ответственности:
Misery Jim Arnosky
245 10 $а $с
Misery Jim Arnosky

Область издания: Сведения об издании:
1 st ed.
250 $а
1 st ed.

и так далее...
Сравнение одной и той же записи с текстовыми "signposts" и с метками USMARC иллюстрирует компактность формата USMARC, то есть экономное расходование объёма компьютерной памяти.
Таблица 1 иллюстрирует запись MARC, размеченную "signposts". Наименованиями этих "signposts" являются: ПОЛЕ, МЕТКА, ИНДИКАТОР, ПОДПОЛЕ, КОД ПОДПОЛЯ И ОПРЕДЕЛИТЕЛЬ СОДЕРЖАНИЯ. Рассмотрим эти термины в отдельности.
Поле: Каждая библиографическая запись логически делится на поля. Имеется поле для автора, поле для информации о заглавии и т.д. Эти поля подразделяются на одно или несколько "подполей".
Как было отмечено ранее, текстовые наименования полей слишком длинные, чтобы их приводить в каждой записи USMARC. Вместо этого поля представляются 3-х цифровыми метками.
Метка: Каждое поле ассоциируется с трёхцифровым числом, которое называется меткой. Метка идентифицирует поле (тип данных) , которое следует после неё. Даже если на экране дисплея сразу после метки выведены ещё и индикаторы (таким образом, может появиться число из 4 или 5 цифр) , метка всегда представляет собой первые три цифры.
См. ниже пример записи поля. Число 100 является меткой, определяющей поле заголовка основной библиографической записи на имя лица (автора) .
100 1# $a King, Stephen

В записи USMARC 10% меток используются достаточно, другие 90% встречаются только в редких случаях.
Индикаторы : За каждой меткой поля следуют две позиции символов (за исключением полей 001- 009) . Одна или обе эти позиции символов могут использоваться для индикаторов. В некоторых полях применяется только первая или вторая позиция; в других полях используются обе позиции; а в таких полях, как 020 или 300, позиции не используются совсем. Если позиция индикатора не используется, индикатор характеризуется как "неопределённый", позиция остаётся незаполненной. В данной работе, в примерах, незаполненные или неопределённые позиции индикатора обозначаются символом " # ".
Значением каждого индикатора является цифра от 0 до 9. (Хотя правилами допускаются буквы, они используются редко) . Даже, если два индикатора вместе могут казаться 2-хзначным числом, в действительности они являются двумя отдельными цифрами. В приведённом ниже примере первые 3 цифры являются меткой (245 определяет поле заглавия) , 2 следующие цифры (1 и 4) являются значениями индикаторов. "1"- первый индикатор; "4"- второй индикатор.
24514 $a The waste lands / $c adapted from Stephen King.

Значение 1 первого индикатора в поле заглавия указывает, что в данном каталоге должна быть отдельная библиографическая запись на заглавие. В карточном каталоге это означает, что для единицы описания должна распечатываться карточка с добавочной библиографической записью на заглавие, а в справке о добавочных записях должно быть указано "Заглавие".
С помощью второго индикатора на экране дисплея указывается количество символов в начале поля (включая пробелы (spaces) ) , которые не должны учитываться компьютером в процессе сортировки и расстановки. Для заглавия The waste lands второй индикатор устанавливается на цифре "4", чтобы первые четыре символа ("T", "h", "e", пробел) не учитывались при сортировке и заглавие сортировалось в файле на слово "waste".
Подполе: Большинство полей содержит несколько отдельных взаимосвязанных данных. Каждый тип данных в поле называется подполем, и каждому подполю предшествует код подполя. Поля от 001 до 009 не имеют подполей.
Например, поле физического описания для книг (определённое меткой 300) включает подполе для объёма (количество страниц) , подполе для других физических характеристик (информация об иллюстрациях) , а также подполе для размеров (сантиметры) :
300 ## $a 675 p. ; $b ill. ; $c 24 см.

Код подполя: Код подполя представляет собой одну букву нижнего регистра (в отдельных случаях цифру) , которой предшествует разделитель подполя. Каждый код подполя указывает, какой тип данных следует после него.
Разделитель: Различные программы математического обеспечения для представления разделителя на экране или в распечатке используют различные символы. Примерами могут служить двойной кинжал (Ш) , знак "эт" (@) , знак доллара ($) , линия подчёркивания (_) и другие. В данной работе в качестве части кода подполя, являющейся разделителем, используется знак доллара ($) .
В приведённом выше примере кодами подполей являются: $a для обозначения объёма, $b для других физических характеристик и $c для размера.
1.2. КОММУНИКАТИВНЫЙ ФОРМАТ USMARC.
Записи USMARC называют "теговыми" записями (записи с метками) . Прежде чем стать теговой записью, запись USMARC (в так называемом коммуникативном формате USMARC) выглядит совсем по-другому, - как одно длинное слитное предложение. Коммуникативный формат USMARC состоит из маркера и справочника. В коммуникативном формате метки перед полями не проставляются. Однако, непосредственно за маркером следует блок данных, называемых справочником. Этот справочник показывает, какие метки имеются в записи и где о