Frigjør data – Hvad fanden nøler I efter?

Publisert Sist oppdatert

Frigjøring av offentlige data har blitt anbefalt politikk og trendy

ministernivå. Burde ikke da også tiden være inne for frigjøring av
bibliotekenes
data?

 

Av David Massey, Unni Knutsen og Kim Tallerås, Høgskolen i Oslo, Avd.
JBI
Frigjøring av offentlige data har blitt anbefalt politikk og trendy på
ministernivå. Burde ikke da også tiden være inne for frigjøring av bibliotekenes
data?

 

Av David Massey, Unni Knutsen og Kim Tallerås, Høgskolen i Oslo, Avd. JBI. 

Stortingsmeldinga Eit informasjonssamfunn for alle[1] viste
allerede i 2007 at norske myndigheter var inneforstått med
"verdiskapningspotensialet" ved gjenbruk av offentlige data. Nylig har
Fornyingsdepartementet fulgt opp med nettstedet data.norge.no – en portal til
offentlige data tilrettelagt for gjenbruk. Ideen henter inspirasjon fra USA og
England, som har etablert lignende tjenester. I England har man sågar leid inn
nettets «oppfinner», Tim Berners-Lee, til å lede prosjektet. I motsetning til dagens
situasjon hvor data gjerne er lagret i spesialiserte databaser og formater, ser
Berners-Lee for seg et «smartere» internett hvor data er gjort tilgjengelige i henhold til nettvennlige
standarder. Dette vil gi enklere tilgang til data, gjøre det mulig å lenke på
tvers av datasett og ikke minst legge til rette for utvikling av spennende
applikasjoner «på toppen».

     I rapporten Fra Altinn til alt ut?[2]
har Teknologirådet utredet prinsipper for offentliggjøring. Her konkluderer
de med at alle datasett, som «ikke utgjør en trussel mot rikets
sikkerhet eller individets personvern», som hovedregel bør offentliggjøres.
Det legges blant annet til grunn at dataproduksjon som finansieres av
skattepenger prinsipielt bør tilfalle fellesskapet. Enkelte av fellesskapets data,
for eksempel fra Meteorologisk institutt (yr.no) og Trafikanten, er da
også allerede gjort tilgjengelige gjennom populære nettjenester og
mobilapplikasjoner.

     Hva innebærer dette for bibliotekene?

     Vi sitter på data i form av mengder med
katalogposter. Kan man dermed uten videre offentliggjøre disse dataene via
data.norge.no i henhold til ministerens oppfordring? Og hva skulle man nå
egentlig vinne på å gjøre det?

 

Verdifulle data
Undersøkelser viser at bruken av bibliotekenes data i publikumskataloger er
beskjeden. Statistisk sentralbyrås bibliotekrapport fra 2006[3]
slår fast at bare 9 % av de intervjuede hadde brukt bibliotekets nettjenester i
eller utenfor bibliotekets lokaler i løpet av siste år. En undersøkelse utført
av OCLC i 2005 fant at kun 1 % av brukerne begynner informasjonssøking på
hjemmesiden til et bibliotek[4]
. Dette betyr verken at dataene er dårlige eller
uinteressante, men at de har et ikke-utløst brukspotensiale.

     Under årets KORG-dager på Høgskolen i Oslo[5]
ga André Nesse, mannen bak bokelskere.no, noen eksempler på hvilke verdier man
kan skape ved relativ enkel bearbeidelse av bibliografiske data. Bokelskere.no
er et aktivt litteraturformidlende nettsamfunn hvor folk anbefaler og
diskuterer litteratur. Her finner vi mye av funksjonaliteten som det strandede
prosjektet Litteratursiden.no
forsøkte å få på plass. Nesse kunne også fortelle at han tidlig i
utviklingsprosessen henvendte seg til biblioteksektoren på jakt etter rådata.
Usikkerhet fra sektorens side resulterte i at han etter lang ventetid kjøpte
data fra Den norske Bokdatabasen. Bibliotekdataene ble altså liggende igjen i
katalogen, mens formidlingstjenestene sektoren kunne bidratt til, blomstrer
uten bibliotekenes deltakelse eller innflytelse.

     Det viser seg at tanken på å gjøre data
allment tilgjengelig er uvant i offentlige institusjoner[6].
Produksjon av data knyttes gjerne til bruk innenfor tradisjonelle rammer og
frykten for misbruk er stor. Biblioteksektoren er nok ikke noe unntak i så
måte, men har samtidig en lang tradisjon for å dele data. Utviklingen av
MARC-formatet var i sin tid et eksempel på det. Nå er tiden inne til å ta enda
et skritt.

 

Pionerer

UBIT
2010-prosjektet lister opp 11 alternativ måter å nyttegjøre seg BIBSYS-data på,
fra referansehåndteringsverktøy til mobilapplikasjoner[7].
Dette er gode eksempler på formidling av data. UBIT går også videre, de ønsker
å legge til rette for at også andre kan bruke dataene i egne tjenester. I det
ABM-u-støttede prosjektet Rådata nå! ønsker de å eksperimentere med publisering
av autoritetsdata i tråd med Tim Berners-Lees visjon om åpne, sammenlenkede og
standardiserte datasett, såkalt Linked Data.

     Internasjonalt har enkelte bibliotek begynt
å spre postene sine på tilsvarende måte. Svenske LIBRIS var først ute, i
etterkant har både det ungarske nasjonalbiblioteket og Deutsche
Nationalbibliothek fulgt opp med offensive planer. Library of Congress har også
innrettet seg mot åpne rådata ved å legge til rette for gjenbruk av emnedata
samt autoritetsposter for navn i Virtual International Authority File (VIAF)[8].

 

Eierskap

Deling av
data forutsetter imidlertid at eierskapet til dem er avklart. I Norge er det
skattebetalerne som finansierer kjøp av bibliotekdata i de offentlig eide
bibliotekene. Blir disse dataene offentlig eiendom av den grunn? Selvsagt,
vil mange si. Nei, hevder andre, ikke så lenge produsenter som for eksempel
Biblioteksentralen ikke tillater spredning av postene sine til tredjepart.

     For å avklare disse grunnleggende
spørsmålene, ba ABM-utvikling tidligere jurist i Nasjonalbiblioteket, Vebjørn
Søndersrød, om en utredning[9].
I følge Søndersrød består katalogposter stort sett av sammenstilling av
elementer hentet fra publikasjonene (tittel, forlag, ISBN etc.). Man kan derfor
ikke kan snakke om verkshøyde etter Åndsverksloven[10].
Sagt med andre ord: en katalogpost er ikke
et åndsverk. Det vi gjerne omtaler som «katalogkrydder», for
eksempel omtale og omslagsbilde, er å betrakte som åndsverk, mens emneord ikke fyller
kriteriet. Ved å fjerne krydderelementer fra postene, kan data gjenbrukes uten
hensyn til åndsverkvern. Avtaler mellom opphavsperson til åndsverkene og eieren
av katalogen, kan imidlertid sikre at også katalogkrydder kan gjøres
tilgjengelig for videre bruk.

     Åndsverkslovens § 43 gir derimot en sammenstilling
av data
i for eksempel en database, en vernetid på 15 år
(katalogregelen). Hensikten med katalogregelen er å beskytte økonomiske
interesser. Institusjoner som Nasjonalbiblioteket, Biblioteksentralen eller Den
norske Bokdatabasen vil gjennom katalogregelen ha eierett til basene sine.
Institusjoner som betaler andre for å produsere data, vil også i utgangspunktet
være eiere og ha enerett på disse. Eneretten innebærer retten til å publisere
og kopiere data.

     Det er i utgangspunktet tillatt for bibliotek
å kopiere enkeltposter («uvesentlige deler») fra baser som faller inn under katalogregelen, men ikke større
mengder data eller «gjentatt og systematisk» nedlasting hvis dette «skader den
normale utnyttelse av arbeidet eller urimelig tilsidesetter frembringerens
legitime interesser». De som lever av å selge katalogdata, for eksempel Biblioteksentralen,
vil med andre ord kunne hevde at de blir økonomisk skadelidende ved at data
systematisk kopieres og gjenbrukes av tredjepart. Gjenbruk av enkeltposter er
imidlertid lovlig.

 

Hvem tar ansvar?

Selv om
jussen er innfløkt, fins det en enkel vei ut av eierskapsproblematikken, nemlig
å inngå juridiske avtaler om frigjøring av data. Og det er det flere grunner
til å gjøre. Noen av dem er prinsipielle, på bakgrunn av offentlig finansiering,
myndighetenes politiske vilje og internasjonale trender. Andre er av mer
funksjonell art, som bibliotekenes behov for samarbeid og utveksling av data med
andre produsenter, eller som synliggjøring av bibliotektjenester gjennom
spredning av data på nettet. Teknologirådet hevder at det på forhånd «kan være
vanskelig å vurdere gjenbruksverdien av et datasett», og at det
i seg selv er en god grunn for offentliggjøring. Eksempelet bokelskere.no viser
i så måte at sektorens data både kan være ettertraktede og verdifulle.
Bokelskere.no viser også at en liten og dynamisk aktør kan ha lettere for å
etablere og drive tjenester enn større offentlige institusjoner. Og så lenge
formålet med tjenestene er i tråd med bibliotekenes mandat, bør vel også bibliotekene
kunne stille opp med data?

     For å muliggjøre slike aktiviteter må det
settes i gang en prosess som sikrer at offentlig finansierte katalogdata
fristilles for bruk gjennom juridisk bindende avtaler mellom bibliotekene og
dataprodusenter som Biblioteksentralen og Den norske Bokdatabasen. Kunne kollegiet
av fylkesbiblioteksjefer, Nasjonalbiblioteket og/eller Universitets- og høgskolerådet tatt initiativ til dette?

 


[1] St. meld. nr. 17 (2006-2007). (2007). Eit informasjonssamfunn for alle.
Oslo:
Fornyings- og administrasjonsdepartementet. Hentet frahttp://www.regjeringen.no/Rpub/STM/20062007/017/PDFS/STM200620070017000DDDPDFS.pdf

[2] Teknologirådet. (2010). Fra
Altinn til alt ut?: Offentlige data for innovasjon og demokrati.
Hentet fra
http://teknologiradet.no/dm_documents/Offentlige_data_for_web_vmjSK.pdf 

[3] Buskoven, N.K. (2006). Undersøkelse om bibliotekbruk. Oslo:
Statistisk sentralbyrå. Hentet fra
http://www.ssb.no/emner/07/02/30/rapp_200614/ 

[4] OCLC. (2005). Perceptions of
libraries and information resources.
Dublin, OH:
OCLC.  Hentet fra http://www.oclc.org/reports/pdfs/Percept_all.pdf

[5] http://www.hio.no/Enheter/Avdeling-for-journalistikk-bibliotek-og-informasjonsfag/Konferanser/Kunnskapsorganisasjonsdagene-2010-28.-29.-januar

[6] Universitetet i Bergen. Institutt for informasjons- og medievitenskap.
(2010). Fakta først: Viderebruk av datakilder i offentlig sektor: Potensial
og hindringer.
Bergen: Universitetet i Bergen. Hentet fra
http://voxpublica.no/wp-content/uploads/2010/01/fakta_foerst_rapport.pdf 

[7] http://ubit.blogs.bibsys.no/ubit2010/2008/07/17/11-mater-a-s%C3%B8ke-i-bibsys-pa/  

[8]
http://www.viaf.org/

[9]
Søndersrød, V.(2009). Katalogdata:
Juridiske problemstillinger knyttet til eierskap og produksjon.
Oslo:
ABM-utvikling. Hentet fra http://www.abm-utvikling.no/publisert/abm-skrift/abm-skrift-53

[10]
http://www.lovdata.no/all/nl-19610512-002.html  

 

 

 

Powered by Labrador CMS