Organizacija znanja letnik 9, zvezek 3, 2004

DOI:10.3359/oz0403105

PRIMERJAVA FORMATOV MARC 21 – UNIMARC – COMARC

Tadeja Brešar

Institut informacijskih znanosti, Maribor, kontaktni naslov: tadeja.bresar@izum.si


Kazalo

KAJ JE MARC?
NASTANEK FORMATOV MARC
VRSTE FORMATOV
RAZVOJ FORMATOV
RAZLIKE MED FORMATOMA COMARC IN UNIMARC
Sistemsko polje in identifikacijska številka
Uvodnik zapisa in direktorij
Kodirana polja s fiksnimi pozicijami
Zapisi za sestavne dele
4XX – Blok za povezovanje
Druge razlike pri bibliografskih zapisih
Normativni zapisi
PRIMERJAVA FORMATOV MARC 21 ZA BIBLIOGRAFSKE PODATKE IN COMARC/B
Pregled polj
Kontrolna polja
Struktura polj za bibliografski opis
OBRAVNAVANJE RAZLIČNIH PISAV
PRESLIKAVE MED RAZLIČNIMI FORMATI
ZAKLJUČEK
Reference
Spletne povezave

KAJ JE MARC?

Format MARC je namenjen shranjevanju in izmenjavi bibliografskih zapisov in sorodnih informacij v strojno čitljivi obliki. Zapis v formatu MARC vsebuje podatke ter navodila za interpretacijo teh podatkov.

Beseda MARC pomeni MAchine-Readable Cataloging, torej katalogizacijo v taki obliki, da jo zna prebrati stroj. Kot stroj je mišljen računalnik, ki zna brati in interpretirati podatke v kataložnih zapisih. Vendar računalnik tega ne zna, če vanj samo prenesemo podatke s kataložnega listka. Podatke je namreč treba primerno strukturirati [1].

Zapis v formatu MARC je sestavljen iz treh elementov [2]:

  • Struktura zapisa je implementacija mednarodnega standarda ISO 2709 Format for Information Interchange, ki določa splošno strukturo zapisov. Ti morajo biti sestavljeni iz uvodnika zapisa, direktorija polj in podatkov.

  • Označevalci vsebine so kode in dogovori, ki so namenjeni prepoznavanju podatkovnih elementov. Omogočajo nadaljnje upravljanje z zapisom. Sem štejemo oznake polj in podpolj ter indikatorje.

  • Vsebina podatkovnih elementov je običajno definirana s standardi, ki sami niso del formata: s kataložnimi pravili, pravili za predmetno obdelavo itd.

NASTANEK FORMATOV MARC

Začetek MARC-a sega v leto 1965, ko so v Kongresni knjižnici pripravili prvi osnutek formata za strojno čitljive kataložne zapise. Nastali so LC-MARC, MARC II, USMARC in nazadnje MARC 21, katerega prva tiskana izdaja je izšla leta 1999. Ta izdaja z naslovom MARC 21 Format for Bibliographic Data je nadomestila prejšnji USMARC Format for Bibliographic Data in kanadski format Canadian MARC Communication Format for Bibliographic Data. Priročnik so do danes tirikrat posodobili. MARC 21 je format, ki ga danes v svetu uporablja največ knjižnic.

Format MARC 21 je bil prvotno razvit za izmenjavo podatkov, predvsem za posredovanje zapisov iz Kongresne knjižnice drugim institucijam. Zato je bil tesno povezan s potrebami in prakso tistih ameriških knjižnic, ki imajo splošne zbirke. Kot format za komunikacijo ni obvezen za interno shranjevanje podatkov ali za njihov prikaz.

Pri razvoju formata skušajo ohraniti kompatibilnost z drugimi nacionalnimi in mednarodnimi formati, kot je npr. UNIMARC. Tudi MARC 21 je opredeljen kot mednarodni format. Njegova uporaba se čedalje bolj širi tudi izven anglo-ameriškega govornega področja [3].

Osnovni namen formata UNIMARC je bil omogočiti mednarodno izmenjavo zapisov med nacionalnimi bibliografskimi ustanovami, služi pa lahko tudi kot model za nove formate za bibliografske podatke. UNIMARC ne določa interne oblike, vsebine ali strukture zapisov, temveč le priporoča obliko, vsebino in strukturo podatkov, kadar jih želimo izmenjavati.

Format UNIMARC je bil prvič objavljen leta 1977 pod okriljem Ifline Sekcije za katalogizacijo pod naslovom UNIMARC Universal MARC Format. Sledile so še štiri izdaje: UNIMARC: Universal MARC Format, UNIMARC Handbook in dve izdaji pod naslovom UNIMARC Manual. V uporabi je druga izdaja UNIMARC Manual, ki je izšla leta 1994 kot publikacija z nevezanimi listi, ki omogoča posodabljanje vsebine. Do zdaj so bile pripravljene štiri posodobitve [4].

Format COMARC temelji na formatu UNIMARC. Ob nastanku sistema vzajemne katalogizacije se je pri delu najprej uporabljal prevod prve izdaje UNIMARC Manual. Z razvojem novih funkcij v sistemu COBISS je bilo treba format UNIMARC dopolnjevati z novimi polji in podpolji, kar je privedlo do razvoja formata COMARC/B.

Najprej so bila leta 1990 izdana navodila Serijske publikacije, nato pa je leta 1991 sledila priprava formata COMARC/B za monografske publikacije, doktorske disertacije in serijske publikacije ter kasneje še številne druge dopolnitve.

Leta 1994 je bila sprejeta odločitev o združitvi navodil za posamezne vrste gradiva v enoten format za bibliografske podatke COMARC/B. Naknadno je bilo pridobljeno tudi soglasje Programa IFLA UBCIM za uporabo delov prevoda druge izdaje UNIMARC Manual. Bibliographic Format (UBCIM Publications – New Series, Vol. 14, 1994) pri pripravi priročnika za format COMARC/B. Do zdaj smo za priročnik pripravili 22 posodobitev [5].

VRSTE FORMATOV

Format za bibliografske podatke je le eden od formatov za izmenjavo bibliografskih informacij. V okviru družine formatov MARC 21 jih nastopa pet: za normativne podatke MARC 21 Format for Authority Data,za bibliografske podatke MARC 21 Format for Bibliographic Data, za podatke o stanju zaloge MARC 21 Format for Holdings Data, za podatke o klasifikaciji MARC 21 Format for Classification Data ter za podatke o organizacijah, javnih službah in dogodkih MARC 21 Format for Community Information.

Tudi formatov UNIMARC je več. Poleg formata za bibliografske podatke obstaja še format za normativne podatke, do konca leta pa naj bi v tiskani obliki izšel tudi format za podatke o stanju zaloge. Na domači strani Ifle je objavljen še kratki (concise) format UNIMARC za podatke o klasifikaciji.

Formati COMARC so trije. Poleg formata COMARC/B za bibliografske podatke uporabljamo še format COMARC/H za podatke o stanju zaloge in COMARC/A za normativne podatke.

Format COMARC/H smo oblikovali v IZUM-u, ker v času zasnove sistema vzajemne katalogizacije še ni obstajal UNIMARC za podatke o stanju zaloge, pri njegovi pripravi pa so imela ključno vlogo priporočila iz predloga standarda ISO/TC46/SC9-N34.

Format COMARC/A je povzet po formatu UNIMARC za normativne podatke. Zaenkrat je objavljen le tisti del besedila, ki se nanaša na normativno kontrolo osebnih imen in korporacij, in to kot delovno gradivo. Ob naslednji posodobitvi formata načrtujemo izid celotnega priročnika v mapi z nevezanimi listi, enako kot že obstaja za COMARC/B in COMARC/H. Pri pripravi COMARC/A smo upoštevali drugo izdajo UNIMARC Manual. Authorities Format iz leta 2001.

RAZVOJ FORMATOV

Za revizije dokumentacije v zvezi s formatom MARC 21 sta odgovorni dve skupini: Machine-Readable Bibliographic Information Committee (MARBI) in MARC Advisory Committee. MARBI je komisija organizacije ameriških knjižnic American Library Association (ALA). Ta skuša zagotoviti, da MARBI sestavljajo člani z različnim znanjem in tako pokrivajo čim širše strokovno področje. MARC Advisory Committee sestavljajo predstavniki nacionalnih knjižnic, bibliografskih servisov, ponudniki računalniške opreme in drugih organizacij s področja knjižničarstva.

MARBI se na vsaki konferenci ALA (dvakrat letno) sestane z MARC Advisory Committee. Glavna aktivnost komisije MARBI je obravnava predlogov za dopolnitve in spremembe formata, ki jih predloži Kongresna knjižnica v obliki člankov za razpravo. Predlog lahko pripravi kateri koli uporabnik MARC 21, vendar ga mora za obravnavo posredovati Kongresna knjižnica. MARBI je zadolžen tudi za to, da se zagotovi podpora v formatu za novonastala področja [6].

Kongresna knjižnica in Nacionalna knjižnica Kanade opravljata naloge agencije za vzdrževanje formatov MARC 21. Kongresna knjižnica kot del te obveznosti vzdržuje forum MARC in diskusijsko listo (marc@loc.gov). Tu poteka najširša razprava o predlaganih spremembah formata in o preostalih vprašanjih, ki zanimajo uporabnike MARC 21 po vsem svetu. Kongresna knjižnica in Nacionalna knjižnica Kanade prirejata tudi odprta srečanja, namenjena razpravi o spremembah formata.

Razvoj formata UNIMARC je do leta 2003 potekal v okviru Iflinega programa Universal Bibliographic Control and International MARC Core Activity (UBCIM). Sedež UBCIM je bil v Deutsche Bibliothek. Lani je bil ta program ukinjen. Tisti del aktivnosti UBCIM, ki se je nanašal na UNIMARC, je nasledil IFLA UNIMARC Core Activity. Ta koordinira aktivnosti, potrebne za razvoj, vzdrževanje in promocijo formata UNIMARC.

Vzdrževanje in posodabljanje formata pa je naloga komiteja PUC – Permanent UNIMARC Committee, ki je bil ustanovljen leta 1991. Člani (7 ali 9 ) prihajajo iz različnih držav in institicij z aktivnimi izkušnjami pri uporabi formata UNIMARC.

Tudi za UNIMARC obstaja diskusijska lista (unimarc-dis@infoserv.inist.fr), ki pa v zadnjem času ni preveč aktivna.

Za razumevanje formata UNIMARC so zelo koristna tudi navodila UNIMARC Guidelines : No. 1. Component Parts. Journal Articles and Articles in Books, No. 2. Microforms, No. 3. Older Monographic Publications (Antiquarian), No. 4. Minimal Level Record, No. 5. Multi-Level Description, No. 6. Electronic Resources. Objavljena so na spletnem naslovu http://www.ifla.org/VI/3/nd1/publist.htm.

Format COMARC vzdržuje IZUM. Pri razvoju formata COMARC/B s svojimi predlogi in pripombami sodelujejo strokovnjaki iz različnih ustanov. Dopolnitve se sprejemajo na pobudo knjižnic, ki sodelujejo v sistemu ali pa zaradi novosti, ki potrebujejo ustrezno podporo v formatu.

Ko uvajamo novost v formatu COMARC, skušamo slediti formatu UNIMARC, da bi dobili čimbolj standardno rešitev. Če UNIMARC načrtovane dopolnitve ne vsebuje, preverimo, ali ponuja rešitev MARC 21. Če rešitve ne najdemo niti v MARC 21, jo pripravimo sami.

Vsebino gradiva za priročnike pripravimo večinoma sami, za format COMARC/B pa včasih pa tudi v sodelovanju z drugimi ustanovami, navadno z NUK. Pripravljeno gradivo sami oblikujemo za tisk in sami razmnožimo v nakladi, ki zadosti potrebe IZUM-a in knjižnic, ki sodelujejo v sistemu.

RAZLIKE MED FORMATOMA COMARC IN UNIMARC

Format COMARC/B vsebuje 142 polj, UNIMARC za bibliografske podatke pa kar 175. Pri formatu COMARC/A je to razmerje drugačno, saj zaenkrat uporabljamo le polja za zapise za osebna imena in korporacije. COMARC/A vsebuje 34 polj, UNIMARC za normativne podatke pa 80. Polja iz formata COMARC so večinoma prevzeta iz UNIMARC, nekatera pa so v COMARC tudi dodana. V COMARC/B je dodanih 21 polj, v COMARC/A pa 7.

Uporaba nekaterih polj v formatu COMARC se razlikuje od uporabe v formatu UNIMARC. Prav tako so v formatu COMARC dodana v nekaterih poljih podpolja, ki jih v formatu UNIMARC ni, in kode v šifrantih za nekatera kodirana polja.

Sistemsko polje in identifikacijska številka

Format COMARC pozna posebno polje, ki mu rečemo sistemsko polje in ga vsebuje vsak zapis. Vanj se vpišejo podatki o osebah, ki so zapis ažurirale, datumi manipulacij z zapisom, verzija zapisa ipd. Kreira se programsko.

V formatu UNIMARC sistemskega polja ni. Večino od podatkov iz sistemskega polja iz formata COMARC se v formatu UNIMARC vnese v različne dele zapisa, največ v polje 801 – Originating source.

Identifikacijska številka zapisa v formatu COMARC ni del podatkov (ni polje), temveč deluje kot ključ do zapisa. Kreirana je programsko po algoritmu, ki zagotavlja, da je iz identifikacijske številke možno izračunati, v kateri lokalni bazi je bil zapis kreiran. V formatu UNIMARC se identifikacijska številka beleži v polju 001.

Uvodnik zapisa in direktorij

COMARC je format za interno shranjevanje podatkov in ne, tako kot UNIMARC, format za izmenjavo. Zato osnovna struktura zapisa ne sledi standardu ISO 2709, saj ta ni primeren za shranjevanje zapisov v bazo (oz. za priklic iz nje), ki jo uporabljamo v sistemu COBISS.

Tako je uvodnik zapisa strukturiran drugače kot v formatu UNIMARC. Ima enako obliko kot vsa druga polja. Posamezne elemente iz uvodnika zapisa v formatu COMARC vpišemo kar v posamezna podpolja polja 001 za razliko od istih podatkov v formatu UNIMARC, ki stojijo na fiksnih pozicijah na začetku zapisa. Nekateri podatki iz uvodnika zapisa v formatu UNIMARC v polju 001 v formatu COMARC manjkajo. Prav tako v COMARC posebej ne shranjujemo dolžine zapisa, saj za to skrbi datotečni sistem sam.

Uvodnik zapisa v formatu UNIMARC poleg vsebine polja 001 iz formata COMARC vsebuje še dolžino zapisa in indikatorjev ter oznake podpolja ter še nekaj drugih podatkov, potrebnih za procesiranje zapisa.

Slika 1. Primer uvodnika zapisa v strukturi ISO 2709, ki jo predpisuje format UNIMARC

Uvodnik zapisa v formatu COMARC deluje tudi kot sistem za razreševanje podvojenih zapisov. V ta namen je vanj dodano podpolje x, v katero v primeru duplikata vnesemo identifikacijsko številko odgovarjajočega veljavnega zapisa.

Standard ISO 2709 predpisuje tudi uporabo direktorija zapisa. To je seznam oznak polj iz zapisa skupaj z dolžino posameznega polja in pozicijo prvega znaka iz polja. V strukturi formata COMARC direktorija zapisa ne shranjujemo, namesto tega se v zapisu oznaka polja pojavi neposredno pred vsebino polja.

Kodirana polja s fiksnimi pozicijami

V formatu COMARC so lahko kodirana le celotna podpolja, ne pa tudi posamezni deli podpolj. Kodirana polja formata UNIMARC pa so lahko razdeljena po vsebinskih delih glede na pozicijo znaka v podpolju. Pomen kode je v tem primeru odvisen od njene pozicije v podpolju. Taka polja v formatu UNIMARC navadno vsebujejo le podpolje a. V formatu COMARC pa so razdeljena na podpolja za vsak samostojno kodiran sklop podatkov.

UNIMARC:  105 $acf a 000yb  

Tabela 1. Primer kodiranega polja 105 – Monografsko tekstovno gradivo v obeh formatih

Pozicija znaka

Vrednost

Pomen

0-3

cf_ _

Enota vsebuje portrete in slikovne priloge, drugih ilustracij pa ni. Za ilustracije so predpisana štiri mesta, zato sta zadnji dve prazni.

4-7

a_ _ _

Enota vsebuje bibliografijo. Za vrsto vsebine so predpisana štiri mesta, zadnja tri so prazna.

8

0

Ni konferenčna publikacija.

9

0

Ni spominski zbornik.

10

0

Ne vsebuje kazala.

11

y

Ni literarno besedilo.

12

b

Enota vsebuje osebno biografijo.

COMARC:  105 $ac$af$ba$g

Podpolje

Vrednost

Pomen

$a

c, f

Enota vsebuje portrete in slikovne priloge. Potrebujemo dve kodi, zato je podpolje ponovljeno.

$b

a

Enota vsebuje bibliografijo.

$c

-

Ni konferenčna publikacija, zato podpolja c ni.

$d

-

Ni spominski zbornik, zato podpolja d ni.

$e

-

Ne vsebuje kazala, zato podpolja e ni.

$f

-

Ni literarno besedilo, zato podpolja f ni.

$g

b

Enota vsebuje osebno biografijo.

Zapisi za sestavne dele

Posebnost formata COMARC je obravnava sestavnih delov. V zapis za sestavni del vnesemo le podatke, ki se nanašajo na sestavni del sam, podatkov o viru pa ni treba vnašati. Ti se pri prikazu zapisa dodajo avtomatsko iz zapisa za vir. Kot povezava na vir služi številka ISSN (polje 011), če gre za članek iz serijske publikacije, ali pa identifikacijska številka zapisa za vir (polje 464), če gre za sestavek v monografski publikaciji.

Format UNIMARC za podatke o viru predpisuje polje 463 – Piece. V polje je poleg identifikacijske številke zapisa za vir obvezno vnesti še vsaj naslov vira in njegovega avtorja (če ta sploh obstaja). Neobvezno pa je možno dodati še precej drugih podatkov.

Slika 2. Primer predstavlja relevantne podatke iz zapisa za vir in iz zapisa za sestavni del v obeh formatih

Za podporo strukturiranega vnosa podatkov o lokaciji sestavnega dela v viru je bilo razširjeno tudi polje za fizični opis (215). Dodana so bila podpolja za vnos podatkov o posameznih nivojih številčenja in o kronologiji.

4XX – Blok za povezovanje

Največ razlik med formatoma COMARC/B in UNIMARC za bibliografske podatke je gotovo pri uporabi bloka 4XX. To je blok polj, ki se uporabljajo za vnos podatkov o drugih bibliografskih enotah, ki so kakor koli povezane z opisovano enoto.

Osnovna izdaja UNIMARC-a iz leta 1994 je predpisala, da v polja iz bloka 4XX vnašamo s t. i. tehniko vgrajenih polj. V polje je možno vgraditi zapis ali del zapisa za drugo bibliografsko enoto skupaj z vsemi polji, podpolji ter indikatorji, ki sicer nastopajo v tem zapisu. Tehnika vgrajenih polj je ponazorjena s primerom v poglavju Zapisi za sestavne dele.

Ta tehnika se je pokazala kot zapletena tako s stališča vnosa kot tudi s stališča kasnejšega procesiranja podatkov. Zato in tudi zaradi približevanja drugim formatom, ki takega načina ne poznajo, so kasneje v UNIMARC dodali možnost vnosa bloka 4XX s tehniko standardnih podpolj. Podatki se vnesejo v standardna podpolja, katerih oznake so neodvisne od tega, v katero polje (vgrajenega) zapisa bi sicer spadali. Na ta način ni treba vnašati oznak polj in podpolj v podpolje 1, temveč vnesemo zgolj vsebino v podpolja s standardnimi oznakami.

Slika 3. Primer iz slike 2 obdelan s tehniko standardnih podpolj

V formatu COMARC se s tehniko vgrajenih polj vnašajo tista polja iz bloka 4XX, ki se uporabljajo v zapisih za monografske publikacije. Dodatno je omejeno, katera polja smemo vgraditi v posamezna polja iz bloka 4XX. Normativna kontrola teh polj ne zajame.

Polja za povezovanje, ki jih uporabljamo v zapisih za serijske publikacije, vnašamo s tehniko standardnih podpolj. Dodatna omejitev formata COMARC je, da vnašamo le številko ISSN in naslov. Tak način je bil v formatu COMARC uveljavljen, še preden je UNIMARC dovolil tehniko standardnih podpolj. Zato se oznaka podpolja z naslovom v formatu COMARC (podpolje a) ne ujema z oznako podpolja z naslovom v formatu UNIMARC (podpolje t).

V zapisih za članke uporabljamo samo polje 464, kamor vnesemo identifikacijsko številko zapisa za vir.

Druge razlike pri bibliografskih zapisih

Največ podatkovnih elementov je bilo v COMARC/B dodanih za podporo izdelave osebnih bibliografij. To so:

  • tipologija dokumenta (001t),

  • šifra raziskovalca (70X7), ki jo bo zaradi uvedbe normativne kontrole individualnih avtorjev možno opustiti,

  • šifra organizacije (70X8),

  • polje 970 za izpis bibliografske enote v formatu ISO.

Različen je tudi način vnosa številke ISSN. Formata UNIMARC in COMARC predpisujeta za vnos številke ISSN polje 011, vendar je COMARC uporabo polja razširil. Številka ISSN je za serijske publikacije obvezen podatek. Če publikacija ne vsebuje številke ISSN, vnašamo v polje 011 interno številko serijske publikacije, ki jo dodeli nacionalni center ISSN.

Polje 011 se uporablja tudi v zapisih za članke. Vanj vnesemo ISSN serijske publikacije, v kateri je bil članek objavljen in služi kot povezava med zapisom za članek in zapisom za vir.

Blok 9XX je v UNIMARC predviden za nacionalno uporabo. To pomeni, da lahko v posamezni implementaciji UNIMARC-a v bloku 9XX definiramo poljubna polja. COMARC/B je ta blok izkoristil predvsem za polja za variantne značnice (polja 90X, 91X, 96X). Vanje vnašamo variantne značnice za značnice iz polj 70X, 71X in 60X.

Drugi podatkovni elementi, ki so dodani v format COMARC/B, so:

  • polje 041 za kode, ki se pojavljajo na serijskih publikacijah,

  • naslov vnesen z ukazi LaTeX (539),

  • več podpolj polja za UDK (675) za različne namene,

  • polje 992, ki se uporablja kot polje za lokalne potrebe,

  • posamezna podpolja v okviru nekaterih polj,

  • posamezne kode v nekaterih kodiranih poljih.

V nekaterih poljih so definirane dodatne vrednosti indikatorjev.

Normativni zapisi

Format COMARC/A se precej dosledno drži formata UNIMARC za normativne podatke, če ne štejemo zgoraj omenjenih razlik v strukturi zapisov (identifikacijska številka, uvodnik zapisa, kodirana polja, sistemsko polje). Zaenkrat uporabljamo le polja, ki se nanašajo na normativno kontrolo oseb in korporacij.

Kljub temu je v formatu COMARC/A dodanih nekaj podatkov:

  • polji za datum rojstva ter datum smrti osebe (190, 191),

  • šifra raziskovalca (200r),

  • podatki, ki se nanašajo na inicialni programski vpis zapisov za osebe (911, 915, 916),

  • polje za prevezovanje bibliografskih zapisov (990),

  • polje 992 , ki se uporablja kot polje za lokalne potrebe.

PRIMERJAVA FORMATOV MARC 21 ZA BIBLIOGRAFSKE PODATKE IN COMARC/B

Format MARC 21 enako kot format UNIMARC pri strukturi zapisa sledi standardu ISO 2709. Format COMARC take strukture ne pozna, zato zgoraj opisane razlike v strukturi zapisa v formatih COMARC oziroma UNIMARC v enaki meri veljajo tudi, če primerjamo formata COMARC in MARC 21. Razlike so v identifikacijski številki, sistemskem polju, uvodniku zapisa in kodiranih poljih.

Pregled polj

Osnovna razdelitev polj v formatu MARC 21 za bibliografske podatke je podana v spodnji tabeli. V tretji koloni so pripisana polja, ki istim podatkom okvirno odgovarjajo v formatu COMARC/B.

Tabela 2. Pregled polj iz formata MARC 21 za bibliografske podatke

Pomen

MARC 21

COMARC/B

Uvodnik zapisa

Leader

001

Direktorij

Directory

-

Kontrolna polja

00X

Identifikacijska številka, sistemsko polje, večina polj v bloku 1XX.

Številke in kode

01X-09X

Sistemsko polje, del bloka 1XX, polja za klasifikacije.

Polja za značnice

X00, X10, X11, X30

7XX, 500

Glavni vpisi

1XX

7X0

Naslovi in polja sorodna naslovom

20X-24X

200, 5XX

Edition, Imprint, Etc. Fields

25X-28X

205, 206, 208, 210, 211, 230

Fizični opis

3XX

215

Zbirka

4XX

225

Opombe

5XX

3XX

Predmetne oznake

6XX

600-609

Dodatni vpisi

70X-75X

423, 500, 620, 7X1, 7X2

Polja za povezave

76X-78X

4XX

Dodatni vpisi za zbirke

80X-840

410

Podatki o stanju zaloge

841-856

COMARC/H, 856

Kontrolna polja

MARC 21 pozna 6 kontrolnih polj. Tri se nanašajo na identifikacijsko številko in datume transakcij. Preostala tri so 006 –  Fixed-Length Data Elements-Additional Material Characteristics, 007 –  Physical Description Fixed Field in 008  – Fixed-Length Data Elements. Ta tri polja so ekvivalentna skoraj celotnemu bloku 1XX v COMARC/B. To so kodirana polja, ki niso razdeljena na podpolja, prav tako nimajo indikatorjev. Pomen kode je definiran glede na njeno pozicijo v polju in je za različne vrste gradiva različen.

Najpomembnejše kodirano polje je polje 008. V njem so kodirani splošni podatki, kot so jezik, država, leto izida itd. Fizične značilnosti gradiva so kodirane v polju 007. Polje 006 pa se uporablja v primeru, ko ima enota značilnosti več vrst gradiva. Primarne značilnosti kodiramo v polju 008, druge pa v 006.

Struktura polj za bibliografski opis

Polja so v formatih UNIMARC in COMARC strukturirana tako, da je po za večino elementov opisa po ISBD definirano svoje podpolje. Zato je treba pred posameznim podpoljem, ne glede na vsebino, dodati vedno isti interpunkcijski simbol. Tako interpunkcijskih simbolov ni treba vnašati, saj jih je možno ob prikazu podatkov določiti programsko. Vnos brez interpunkcijskih simbolov po formatu UNIMARC ni obvezen, je pa možen in priporočen. V zapise v formatu COMARC interpunkcijskih simbolov ne vnašamo.

Format MARC 21 ne sledi temu načelu. Bibliografski opis je, enako kot pri formatu COMARC, na polja razdeljen glede na območja ISBD. Posamezna polja pa so razdeljena na podpolja drugače. Po več elementov ISBD opisa se lahko vnese v eno podpolje, zato programsko dodeljevanje interpunkcijskih simbolov ni možno. Posledica je ročni vnos interpunkcijskih simbolov. Tipičen primer je polje za naslov in navedbo odgovornosti (245).

Spodnja primera kažeta, da sta polji za naslov in navedbo odgovornosti v obeh formatih različni tako po oznakah podpolj kot tudi po strukturi.

Slika 4. Polje za naslov in navedbo odgovornosti

OBRAVNAVANJE RAZLIČNIH PISAV

V formatu COMARC so definirana tudi pravila za vnos podatkov, ki jih kasneje želimo prikazati v cirilici. Izbira pisave za izpis je krmiljena z nekaterimi kodiranimi polji, nabor znakov COBISS pa vsebuje tudi znaka za vklop latinice in za vklop cirilice, ki ju uporabljamo takrat, ko krmiljenje s kodiranimi podatki ne zadostuje. Izpis v preostalih pisavah, razen latinice in cirilice, zaenkrat ni možen.

Format UNIMARC omogoča vnos podatkov v različnih pisavah. Za namen predstavitve podatkov v več pisavah se vsa polja (razen kodiranih iz bloka 1XX) lahko obravnavajo kot ponovljiva. Ponovimo jih za vsako pisavo, ponovitve pa vsebujejo dodatno podpolje s kodo pisave.

Tudi format MARC 21 omogoča vnos podatkov v različnih pisavah. V ta namen je definirano posebno polje (880), v katerem lahko v drugi pisavi ponovimo podatke iz poljubnega drugega polja. V polje dodamo tudi oznako polja, ki smo ga ponovili v drugi pisavi.

Slika 5. Polje za podatke o založniku za prikaz v cirilici

PRESLIKAVE MED RAZLIČNIMI FORMATI

Za izmenjavo zapisov, kreiranih v različnih formatih, je treba pripraviti preslikavo med formati. Preveriti je treba vse podatkovne elemente formata, v katerem so zapisi, in za vsakega določiti ustreznik v formatu, v katerega jih želimo preslikati.

Navadno so podatki v različnih formatih različno strukturirani, zato ni dovolj, da enostavno spremenimo oznake polj in podpolj. Pogosto je treba združevati po več podpolj v eno podpolje ali eno podpolje razbiti na več podpolj. Pri kodiranih poljih je treba za vsako kodo preveriti, kako je ista vsebina kodirana v obeh formatih in kode ustrezno spremeniti. Postopek zahteva precej časa in dobro poznavanje obeh formatov.

Precej že definiranih preslikav v MARC 21 najdemo na domači strani Library of Congress – Network Development and MARC Standards Office (http://www.loc.gov/marc/marc.html). Na tem naslovu so tudi nekatera orodja, ki jih lahko uporabljamo za zapise v formatu XML, ki so brezplačna in prosto dostopna. Med temi orodji so tudi konverzije v različne formate.

Tudi v IZUM-u se ukvarjamo s konverzijami med različnimi formati. Že pred časom smo pripravili program za konverzijo iz formata COMARC/B v format UNIMARC. Namenjen je izmenjavi zapisov v formatu UNIMARC. Dostopen je preko segmenta COBISS2/Izpisi za knjižnice, ki želijo izvažati svoje zapise.

Zaradi prevzemanja zapisov iz baze podatkov WorldCat smo morali pripraviti tudi preslikavo iz formata MARC 21 za bibliografske podatke v formata COMARC/B. Poleg preslikave smo pripravili tudi programsko opremo za konverzijo. Isto programsko opremo smo kasneje uporabili tudi za prenos normativnih zapisov iz baze LC Names, s tem da smo morali definirati še preslikavo iz MARC 21 za normativne podatke v COMARC/A.

V pripravi je tudi preslikava iz COMARC/B v MARC 21, pri kateri uporabljamo tehnologijo XML.

ZAKLJUČEK

Prednost formata UNIMARC pred formatom MARC 21 je gotovo v tem, da je UNIMARC nastal kasneje. Med drugim je zasnovan tudi na podlagi izkušenj, pridobljenih pri uporabi MARC 21 in njegovih predhodnikov. Odlike UNIMARC so koherentna struktura kodiranih podatkov in preglednejši vnos elementov ISBD. Pomembno je tudi to, da je bil razvit kot mednarodni format, in to pod okriljem Ifle.

Po drugi strani ima format MARC 21 širše zaledje uporabnikov. Ti prihajajo iz okolij, ki so prva začela z računalniško obdelavo knjižničnega gradiva. Postopki, potrebni za dopolnitve formata, so natančno definirani in ustaljeni. Zato lahko format MARC 21 hitreje sledi razvoju. Čeprav imajo nosilno vlogo pri razvoju formata Američani, se zdaj tudi MARC 21 opredeljuje kot mednarodni format. Ne nazadnje je preveden v 11 jezikov.

Format COMARC temelji na formatu UNIMARC, zato je od njega podedoval tudi njegove prednosti. V format lahko sami dodajamo novosti, vendar je pri tem potrebna določena mera previdnosti. Če prehitevamo razvoj UNIMARC-a, imamo lahko težave kasneje. Neupoštevanje mednarodnega standarda pri dopolnjevanju formata ima za posledico nestandardne zapise, ki jih je treba pri vsaki izmenjavi podatkov uskladiti s standardom.

Reference

[1] Betty Furrie in conjunction with the Data Base Development Department of The Follett Software Company: Understanding MARC Bibliographic: Machine-Readable Cataloging.

[2] MARC 21 Format for Bibiliographic Data, 1999.

[3] Machine-Readable Bibliographic Information Committee in conjunction with Network. Development and MARC Standards Office: The MARC 21 Formats: Background and Principles, Revised November 1996.

[4] UNIMARC Manual : Bibliographic Format, 1994.

[5] Institut informacijskih znanosti (IZUM), COMARC/B format za bibliografske podatke.

[6] Betty Furrie in conjunction with the Data Base Development Department of The Follett Software Company: Understanding MARC Bibliographic: Machine-Readable Cataloging.

Spletne povezave


Copyright © 2002 IZUM. Vse pravice pridržane.