izumlogo.gif (16063 bytes)

                                                                                                                                                                                                      

                                                                                                                                                                                                    Datum:       05. 06. 2001
                                                                                                                                                                                                    Štev.:         0160/02-ar
                                                                                                                                                                                                                     (priloga)

                                                                                                                                                                                                                   

Predlog dopolnitev programske opreme in implementacije baze podatkov ELINKS

 

1    Obstoječe stanje

Trenutno je v Sloveniji do polnih besedil člankov iz serijskih publikacij, ki jih ponujajo različni informacijski servisi na osnovi konzorcialnih pogodb (v nadaljevanju: serijske publikacije), mogoče dostopati na različne načine oz. z različnih dostopnih mest (domača stran IZUM-a, domače strani knjižnic, npr. CTK, CMK, UKM, domača stran Društva bibliotekarjev Ljubljana). Za končnega uporabnika to pomeni, da mora poznati možna dostopna mesta, obvladati mora iskanje prek različnih uporabniških vmesnikov, za uspešen priklic pa mora imeti tudi informacijo o tem, katera tematska področja oz. katere serijske publikacije so z določenega dostopnega mesta dosegljive.

V letu 2001 je omogočen dostop do naslednjih servisov:

Servis Dostopen od Dostopnost Št. naslovov
ProQuest
(Bell & Howell)
januar 1999 ULJ, UMB, specialne knj. 1.570
FirstSearch ECO PSP
(OCLC)
april 1999 ULJ, UMB, specialne knj. 440
EIFL Direct
(EBSCO Publishing)
2000 knj. neprofitnih organizacij 5.869
ScienceDirect (Elsevier) 2001 ULJ 1.163
EngineeringVillage 2001 UMB  

Z vidika vzdrževanja je takšna rešitev optimalna, saj omogoča dodajanje in odvzemanje servisov enostavno na enem mestu.

Z vidika uporabnosti je rešitev zadovoljiva. Po izbiri posameznega servisa lahko uporabnik izkoristi možnosti za iskanje serijskih publikacij/člankov v okviru funkcionalnosti, ki jih ponuja posamezen servis.

V IZUM-u smo prejeli nekaj pobud, naj vključimo dostopne serijske publikacije v sistem tako, da jih bo mogoče najti prek programske opreme COBISS/OPAC.

Najbolj konkretno zahtevo je navedel CTK, ki je nosilec konzorcialne pogodbe za servis ScienceDirect. Ker ni ustrezne programske podpore, so se v CTK-ju odločili za ročni vnos približno 1.200 bibliografskih zapisov za serijske publikacije. Na IZUM so naslovili poseben dopis, v katerem nas opozarjajo na določene pomanjkljivosti obstoječih rešitev. Na to temo smo se še pred pričetkom vnosa sestali v IZUM-u (25. 1. 2001) in napovedali možnost strojne vključitve bibliografskih zapisov za serijske publikacije v COBIB.

Povzetek zahtev CTK-ja:

 

2    Cilji dopolnitev

Pri dostopu do tovrstnih servisov se pojavlja vprašanje, kako vključiti servise v sistem COBISS, da:

Z vidika učinkovite uporabe servisov si želimo, da bi kar največ uporabnikov dostopalo do servisov in tako v čim večji meri izkoristilo možnost, ki jo imajo.

Z vidika vzdrževanja pa je problematično nenehno spreminjanje števila servisov in števila vključenih serijskih publikacij, ki so dostopne prek posameznega servisa. Spreminja se tudi dostopnost do člankov iz različnih letnic/letnikov posamezne serijske publikacije. Vse navedeno se običajno spreminja vsaj enkrat letno (vključitev ali izključitev posameznega servisa), spremembe znotraj posameznega servisa (npr. seznam vključenih serijskih publikacij) pa se lahko pojavijo tudi nekajkrat letno.

Cilji:

Glede na zapisano smo se v IZUM-u lotili izdelave predloga za strojni vnos bibliografskih zapisov za serijske publikacije v COBIB. Razloga za to sta dva:

  1. Strojni vnos je učinkovitejši kot ročni.
  2. Strojni vnos omogoča učinkovitejše vzdrževanje; pri tem je še zlasti treba upoštevati značilnosti sistema vzajemne katalogizacije (prevzemanje zapisov iz COBIB-a v lokalne baze podatkov).

Pri pripravi predloga smo upoštevali:

  1. Vsebinske dileme pri vnosu, in to tako, da bo v čim večji meri zadoščeno obstoječim bibliografskim standardom, hkrati pa bo rešitev za uporabnike praktična.
  2. Velik del pozornosti smo namenili problematiki vzdrževanja povezav do serijskih publikacij. Predlagana rešitev omogoča, da je povezave do serijskih publikacij možno vzdrževati na enem mestu. V ta namen smo polje 856 ločili od preostalih bibliografskih podatkov. Polja 856 za posamezne serijske publikacije so tako v posebni bazi podatkov, ki smo jo poimenovali ELINKS.

 

2.1    Analiza

Najprej smo analizirali podatke, ki so bili na voljo za posamezne serijske publikacije, vključene v ponudbo posameznih servisov. Osnovni, za nas izhodiščni podatki so bili pri posameznih servisih prikazani na različne načine, tako da neposredna primerjava podatkov med servisi ni bila mogoča. Za nadaljnjo analizo smo tako lahko uporabili le ISSN in naslov.

Ugotovili smo, da posamezen servis ponuja seznam serijskih publikacij, dostopnih v elektronski obliki, kot identifikacijo pa posameznemu naslovu serijske publikacije običajno pripiše ISSN, ki je sicer dodeljen tiskani verziji te serijske publikacije.

Pregled stanja zapisov:

Število zapisov ProQuest FirstSearch ECO ScienceDirect
Servis 1.570 (100,00%) 3.063 (100,00%) 1.163 (100,00%)
ISSN 1.447 (92,17%) 2.898 (94,61%) 1.132 (97,33%)
COBIB 597 (38,03%) 1.819 (59,39%) 938 (80,65%)
Nikjer 119 (7,58%) 135 (4,41%) 22 (1,89%)

Nadaljnja analiza je pokazala, da se podatki o naslovih revij, ki jih navajajo posamezni servisi, močno razlikujejo med seboj in od podatkov o naslovih v bazah podatkov COBIB in ISSN, tako da kontroli ni ustrezalo približno 25% naslovov. Še natančnejše, ročno preverjanje naslovov, ki niso ustrezali kontroli, pa je pokazalo, da je dejanskih, realnih napak le malo. Večina neujemanj nastane, ker zaradi zelo različnih vhodnih podatkov ni mogoče postaviti zanesljivega splošnega algoritma za kontrolo naslovov.

Za ilustracijo navajamo nekaj številk za servis ProQuest:

Na osnovi teh ugotovitev v nadaljnjem postopku ujemanja naslovov nismo kontrolirali.

Nekaj dilem se je pojavilo zaradi nedoslednosti pri kreiranju bibliografskih zapisov v posameznih bazah podatkov. Primera:

Podatke, ki so pomanjkljivi, smo v nadaljnjem postopku le delno uporabili.

 

2.2    Možnosti avtomatskega vpisa v COBIB

Na osnovi dejstev, da:

je dopolnitev programske opreme za avtomatski vpis in vzdrževanje povezav možna in smiselna.

Če je v seznamu servisa za neko serijsko publikacijo naveden ISSN za tiskano verzijo, bi bilo možno:

a)    dodati povezavo k že obstoječemu zapisu za tiskano publikacijo

V tem primeru obstoječi bibliografski zapis povežemo z avtomatsko generiranim poljem 856 za povezavo, tako da bi bil zapis za tiskano verzijo serijske publikacije povezan tudi z elektronsko verzijo te publikacije. 

ali

b)    avtomatsko kreirati nov zapis za elektronsko publikacijo

V tem primeru bi strojno kreirali zapis za serijsko publikacijo v elektronski obliki. Osnovo bi predstavljal obstoječi bibliografski zapis za serijsko publikacijo (z istim ISSN-jem) v tiskani obliki, iz njega bi prevzeli koristne podatke in programsko dodali določene privzete vrednosti, ki bi na splošno ustrezale opisu elektronske publikacije. Tako dobljeni zapis bi povezali z avtomatsko generiranim poljem 856 za povezavo.

Po proučitvi rezultatov analize in po premisleku o prednostih in slabostih smo dali prednost prvi možnosti in obstoječim bibliografskim zapisom za tiskane serijske publikacije dodali povezave do elektronskih verzij.

 

3    Avtomatski vpis serijskih publikacij v COBIB

Izhodiščne podatke predstavlja seznam naslovov, ki jih ponuja posamezen servis. Za identifikacijo uporabimo ISSN, ki ga servis navaja (t. i. ISSN servisa), in preverimo, ali zapis v COBIB-u že obstaja (COMARC 011e, f).

  1. Če zapis obstaja v COBIB-u, v bazo podatkov ELINKS dodamo polje 856 za povezavo do elektronske verzije serijske publikacije. Podroben algoritem je opisan pod točko a).
  2. Če zapisa v COBIB-u ni, preverimo, ali za ta ISSN obstaja bibliografski zapis v bazi podatkov ISSN. Če zapis obstaja, ga prevzamemo v COBIB, v bazo podatkov ELINKS pa dodamo polje 856 za povezavo do elektronske verzije serijske publikacije. Podroben algoritem je opisan pod točko b).
  3. Če zapisa v bazi podatkov ISSN ni, podatke o taki serijski publikaciji vpišemo v posebno datoteko. Za vse serijske publikacije iz te datoteke bo treba bibliografske zapise v COBIB-u tvoriti ročno, saj nimamo ustreznih podatkov, na osnovi katerih bi zapise lahko generirali strojno. Postopek je opisan pod točko c).

Podroben algoritem:

a)   Zapis za ISSN servisa v bazi podatkov COBIB že obstaja, zato izvedemo naslednje kontrole:

Če za nek servis iz osnovnih podatkov ni mogoče jasno določiti, ali obstajajo polna besedila člankov (FT), predpostavljamo, da FT obstaja.

Glede na kombinacijo FT in LI generiramo indikatorja polja 856 po naslednji tabeli:

FR=LI FT indikatorja polja 856
DA DA ali ni podatka 40
NE DA ali ni podatka 41
DA NE 42

NE

NE 42


Polju 856 dodamo podpolja u, z, q, a z naslednjo vsebino (NR - neponovljivo, R - ponovljivo):

b)    Zapis za ISSN servisa v COBIB-u še ne obstaja; prevzamemo ga iz baze podatkov ISSN in mu dodamo polje s povezavo.

    Poiščemo ISSN servisa v bazi podatkov ISSN ( MARC 022a):

c)    Za določeno število serijskih publikacij, ki jih ponujajo posamezni servisi, ustreznih bibliografskih zapisov ne najdemo v nobeni od relevantnih baz podatkov. Podatki o teh serijskih publikacijah se bodo vpisovali v posebno datoteko .LOG. Na osnovi te datoteke bo možno podatke še enkrat ročno preveriti in v COBIB-u kreirati nove bibliografske zapise. Predvidevamo, da bo to zahteven in dolgotrajen postopek, predvsem zato, ker neobhodno zahteva vključevanje dela za to usposobljenega katalogizatorja.

Rezultat celotnega postopka je, da za bibliografski zapis v COBIB-u generiramo polje 856 s povezavo na elektronsko verzijo te serijske publikacije. Če se neka serijska publikacija pojavlja v ponudbi več servisov, bo za en zapis generiranih več polj 856 in s tem več povezav na elektronsko verzijo. Zaradi vzdrževanja ažurnosti povezav polja 856 ne bodo dodana v bibliografske zapise, ampak se bodo shranjevala v posebno bazo podatkov ELINKS, kjer bodo opremljena z ustrezno identifikacijo za povezavo z bibliografskim zapisom. Bibliografskih zapisov, ki bodo v bazi podatkov COBIB obstajali že pred izvedbo celotnega postopka, s tem postopkom ne bomo spreminjali, ampak jih bomo uporabili le za dodajanje povezav.

Bibliografski zapisi, ki jih bomo v COBIB prevzeli s strojnim kopiranjem iz baze podatkov ISSN, bodo prepoznavni po kreatorju, tj. IZUM::SYSTEM_, in po ustrezni opombi, vpisani v podpolju za opombe 300a.

 

4    Referenčna baza podatkov s povezavami ELINKS

Z ločitvijo polja 856 od preostalih bibliografskih podatkov pri serijskih publikacijah je nastala nova referenčna baza podatkov ELINKS. V njej so shranjena vsa polja 856 vključenih serijskih publikacij in nekateri dodatni podatki, ki so namenjeni za vzdrževanje povezav.



Image1.gif (23556 bytes)

 

Baza podatkov bo vključena kot referenčna baza podatkov v programsko opremo COBISS/Katalogizacija in kot specializirana baza podatkov v programsko opremo COBISS/OPAC. Baza podatkov omogoča katalogizatorjem in drugim uporabnikom sistema iskanje po vseh podpoljih 856 in izpise za različne namene (npr. seznam dostopnih serijskih publikacij po določenem kriteriju, mogoče je ugotoviti tudi prekrivanje med posameznimi servisi ipd.).

Seznam iskalnih predpon:

Predpona, pripona Pomen Indeksiranje
SN ISSN frazno
CI COBIB-ID frazno
TI, /TI Naslov frazno/besedno
TP Tip storitve frazno
ST, /ST Način avtorizacije frazno/besedno
SI Nosilec konzorcija frazno
PN, /PN Naziv ponudnika frazno/besedno
UR, /UR URL frazno/besedno
SC, /SC Tip dokumenta frazno/besedno
FR Format dokumenta frazno
DT Datum povezave frazno


5    Iskanje v COBIB-u

Referenčna baza podatkov ELINKS vključuje vsa podpolja 856 vključenih serijskih publikacij. Po vzpostavitvi baze podatkov se generira datoteka COBIB-ID-jev, ki imajo polje 856 vključeno v ELINKS. Ta datoteka se po vsakem ažuriranju podatkov o serijskih publikacijah prenese na lokalna okolja knjižnic, vključenih v sistem COBISS.

Hkrati smo dopolnili indeksiranje baz podatkov tako, da je omogočeno iskanje tistih zapisov, ki imajo izpolnjeno vsaj eno podpolje 856u. Generirana datoteka COBIB-ID-jev iz baze podatkov ELINKS in omenjena dopolnitev indeksiranja omogočata omejevanje na tiste zapise, ki imajo vsaj eno podpolje 856u vneseno v lokalne bibliografske podatke ali pa imajo polje 856 vključeno v referenčno bazo podatkov ELINKS.

Iskanje v osnovnem načinu:


Image2.gif (11803 bytes)

 

Pri izpisu zapisov v programski opremi COBISS/OPAC za WWW se preveri, ali obstaja polje 856 za izpisan COBIB-ID v referenčni bazi podatkov ELINKS. Če tako polje obstaja, se ustrezno polje 856 (ali več polj 856) prenese iz referenčne baze podatkov ELINKS med lokalne bibliografske podatke (samo za trenutni izpis, ne gre za shranjevanje v lokalno bazo podatkov).

Uporabnik tako pri izpisu zapisa vidi enak izpis, kot da bi bilo polje 856 shranjeno med lokalnimi bibliografskimi podatki.

Izpis:

Image3.gif (24493 bytes)

 

6    Vzdrževanje

Vzdrževanje povezav obsega:

  1. Vključitev novega servisa s seznamom dostopnih serijskih publikacij

    Nov servis se vključi tako, da se strojno izvede postopek, opisan v poglavju 3.
  2. Izključitev servisa

    Če se pogodba s posameznim servisom prekine, se v bazi podatkov ELINKS pobrišejo polja 856 za izključeni servis. Zapisi, ki jih je kopirala v svojo lokalno bazo vsaj ena knjižnica, v COBIB-u ostanejo, vendar brez povezave na izključeni servis. Ostali strojno generirani zapisi, ki jih v svojo lokalno bazo ni kopirala nobena knjižnica, bodo avtomatsko brisani iz COBIB-a.
  3. Sprememba seznama naslovov (ali dostopnosti) pri posameznem servisu

    Ko se spremeni seznam naslovov pri posameznem servisu, se opravi enak postopek kot pri izključitvi servisa in ponovno izvede postopek vključitve serijskih publikacij v COBIB (poglavje 3).

 

7    Dodatne možnosti uporabe referenčne baze podatkov ELINKS

Predlagana rešitev ponuja tudi dodatno uporabo. Referenčno bazo podatkov ELINKS je mogoče uporabiti tudi za povezavo med zapisi v COBIB-u in določenim informacijskim servisom, ki nudi dostop do polnih besedil. Raziskovalec npr., ki ima vzpostavljeno lastno bazo podatkov o svojih člankih, lahko poveže svoje članke z zapisi v COBIB-u na naslednji način:

  1. IZUM-u pošlje seznam člankov, ki so dostopni v njegovi bazi podatkov. Obliko in vsebino seznama predpiše IZUM. Seznam mora vsebovati identifikacijske podatke za iskanje v COBIB-u (npr. ISBN, ISSN pri članku, šifra raziskovalca ipd.) in povezave na zapise v njegovi lokalni bazi podatkov (npr. www.ijs.si/scripts/mojserver.exe?id=12121).
  2. IZUM strojno primerja seznam, ki ga je poslal raziskovalec, in zapise v COBIB-u. Najdene zapise v COBIB-u opremi s poljem 856, vendar ne v samih zapisih, ampak v referenčni bazi podatkov ELINKS.