Open Access Repositories

Baggrund om Open Access Repositories og selvarkivering

Open Access Repositories findes kort fortalt i to former:

Institutional Repositories (institutionelle arkiver) og Subject Repositories (fag arkiver)

Baggrund – selvarkivering

Fagspecifikke og institutionelle arkiver/repositories eksisterer i dag side om side og er knytte sammen af protokollen OAI-PMH 1. Mens institutional repositories som vi kender dem i dag, først er opstået i 1999 og arXiv har eksisteret siden 1991, har traditionen for elektroniske preprints har eksisteret væsentlig længere.

En del af baggrunden for den nuværende anvendelse af selv-arkivering, og dennes eventuelt fremtidige succes, er givetvis historisk betinget. Den videnskabelige publiceringspraksis her i begyndelsen af det 21. århundrede – det vil sige primært opbygningen af en stærk akademiske forlagstradition og den fremherskende økonomiske model for tidsskrifter – er uden tvivl et produkt af forhistorien. Den videnskabelige kommunikations historie rummer mange elementer, der formentlig har haft stor betydning for den situation vi står i i dag, og dermed også for den relative succes af selvarkivering i faglige arkiver som arXiv, og behovet for øget arkivering i institutionelle arkiver: Det vil sige at historien strækkende sig fra de lærte akademikeres brevvekslinger, over laboratoriums- og observatoriumspublikationer, til udgivelser fra nationale videnskabelige selskaber. I efterkrigsårende, primært i det 20. århundredes vestlige verden, er det dog formentligt først og fremmest preprintkulturen, der har været fremmende for udviklingen af elektroniske arkiver.

Et preprint er en kladde af en videnskabelige artikel, der endnu ikke er publiceret i et videnskabeligt tidsskrift. Tilsvarende er et reprint, eller et postprint, et genoptryk eller en reproduktion af en allerede publiceret artikel. I den før-elektroniske tidsalder var det gængs praksis, at forfattere af artikler, eller disse forfatteres institutioner, fremsendte preprints (eller reprints) af videnskabelige artikler, til alle de institutioner og biblioteker i verden, som de mente måtte være interesseret i preprints emne. Et incitament var, naturligvis, at man havde et håb om at artiklen dermed måtte blive læst af flere kollegaer, samt at disse muligvis ville citerer værket – hvilket er med til at meritere forfatteren. En anden grund var, og er stadig, at forfattere typisk modtager et antal gratis reprints af sine artikler, undertiden før tidsskriftsbindet udkommer (derved er der tale om et preprint), og en måde at komme af med denne stak preprints, er at sende dem til kollegaer. Preprints og reprints (og postprints) er dermed et udtryk for en selv-valgt form for parallelpublisering, der finder sted løsrevet fra forlagene og tidsskrifternes egentlige kontrol – men dog delvist sanktioneret af disse. Og det er vel at bemærke en parallelpublisering, der sker på forfatterens eller denne institutions præmisser. Eksistensen af dette publikationsmønster – og den medfølgende tradition – er formentlig en vigtig brik, når vi ønsker at forstå hvorfor akademisk selv-arkivering overhovedet er en mulighed.

Institutional Repositories

Institutional Repositories, eller institutionelle arkiver på dansk, er lokale databaser på institutionerne som tilbyder forskeren et arkiv til at gemme og tilgængeliggøre sine publikationer og forskningsresultater. De to førende udbydere af repositories i verden er DSpace og EPrints, begge open source baserede software løsninger. I Danmark har alle universiteterne implementeret PURE som forskningsdatabase. PURE har på flertallet af universiteterne både rollen som repository og som forskningsdatabase der dokumentere forskernes output. På enkelte universiteter har man også valgt at implementere et decideret repository. I alle tilfælde er der tale om DSpace og systemerne er integreret med PURE, sådan at bruger oplevelse er at der er tale om et system.

Alle danske forskningsdatabaser bliver i dag høstet af Den Danske Forskningsdatabase her kan man søge i mere end 450.000 publikation og få adgang til ca. 15.000 fuldtekster.

Oversigt over Institutional Repositories/Forskningsdatabaser i Danmark

Læs mere – en historie om Institutional Repositories

Subject Repositories

Subject Repositories eller fagspecifikke arkiver er databaser der er vokset op omkring et behov for at dele preprints mellem kolleger inden for et fagområder, typisk inden for felter hvor “fra opdagelse til publicering” tempoet er meget vigtig.

Blandt de mest betydende Subject Repositories er:

ArXiv.org Eksakte naturvidenskaber – Cornell University Library (1991ff): 590.953 eprints

AEI Europapolitik – University of Pittsburgh (2003): 7.111 eprints

RePEc.org Økonomi – internationalt forum (1997ff): 735.000 eprints

CogPrints.org Psykolodi m.m. – Stevan Harnard, bruger EPrints (1997ff): 3.446 eprints

hprints.org Humaniora – Det Kongelige Bibliotek / Københavns Universitetsbibliotek m.fl. (2008, forelødigt til 2010): 59 eprints, men adgang til 106.400 eprints i moderarkivet HAL (under CNRS)

Læs mere – en historie om Subject Repositories

Institutional Repository bliver defineret som ”[…]digital collections capturing and preserving the intellectual output of a single or multi-university community […]“ 2 af Raym Crow i den grundlæggende artikel om IR fra 2002. Crow fortsætter med at skrive at sådanne repositories kan levere et vigtigt komponent i reformationen af det eksisterende videnskabelige kommunikationssystem (”system of scholarly communication”), ved at udvide adgangen til forskningsresultater og genvinde universiteternes kontrol over forskningen og dermed fravriste forlagenes monopol. Endvidere har IR potentiale til at dokumentere et universitets kvalitet ved at udstille den videnskabelige, samfundsmæssige og økonomiske relevans af dets forskningsaktiviteter, dermed øge institutionens synlighed, status og samfundsmæssige værdi.

Crow’s syn på IR er klart at det skal være redskab til at ændre det eksisterende magtforhold på markedet for videnskabelig kommunikation ved at fratage forlagene deres monopolistiske markedsposition. Det skal ske ved at tilbagevinde det intellektuelle ejerskab over forskernes publikationer til den akademiske verden og alene give forlagene en ikke eksklusiv ret til at publicere artiklerne og derved give forskerne ret til at distribuere deres artikler som de ønsker det, eksempelvis og helst i Crow’s perspektiv arkivere artiklen i IR. Således vil forlagenes aktiviteter bliver afgrænset til håndteringen af peer review processen, tilbyde værdigberigede services som ”overlay journals” baseret på indholdet i repositories. 3 Crow’s argumentation for IR var altså direkte forslag til hvordan den såkaldte ”serial-crisis” skulle håndteres, ikke overraskende når artiklen var skrevet i The Scholarly Publishing and Academic Resources Coalition (SPARC) navn 4.

Institutional Repository konceptet bygger videre på de idéer som blev introduceret med preprint arkivet arXiv. Men forsøget med at kopiere/overfører arXiv succesen til andre fagområder er kun lykkes for få fagdomæner som i økonomi (RePEc? ) og Psykologi og dertil relaterede emner (CogPrints? ), men disse fagområder har haft en eksisterende tradition for preprints udveksling som beskrevet ovenfor. Rationalet for deres succes er at preprint-kulturen har givet disse repositories kritiskmasse, således at det er uundgåeligt for forskerne inden for disse fagdomæner at bidrage til arkivering, hvis de da har ambitioner om at få indflydelse og karriere. Andre fagområder uden denne tradition har forskerne slet ikke dette behov, faktisk er ”Access” problemet et hypotetisk spørgsmål for mange forskere der er tilknyttet ressource stærke institutioner og ikke oplever nogen begrænsning i deres forskning pga. manglende adgang til andres eller egne resultater (Philip M. Davis and Matthew J.L. Connolly. (2007)). Crow konkluderer i sit paper at forskere inden for domæner hvor der endnu ikke er tradition for at selv-arkivere skal hjælpes på vej ved hjælp af repositories på universiteterne, Institutional Repositories.

Denne tanke var dog ikke ny allerede i 1994 forslog Stevan Harnad at forskere skulle tilgængeliggøre deres forskning via lokale FTP-servere 5. Modsat Crow, så Harnad parallelpubliceringen alene som et supplement til den traditionelle publicering. Ved at parallel publicere artiklerne i elektroniske arkiver kunne man give alle adgang til forskningsresultater uanset økonomisk formåen. Det ville styrke forskningens impact til gavn for forskerne selv og samfundet som helhed ved at øge innovations hastigheden. Teknisk var ideen dog reelt naiv og ikke realiserbar i praksis, da FTP-serverne krævede at brugerne og potentielle læsere skulle have forhåndskendskab til publikationernes placering. Selv om det tekniske forslag måske var naivt, så er det grundlæggende samme idé Harnad promoverer i dag som en markant stemme i Open Access debatten. Han er en af de varmeste fortalere for selv-arkivering post-print og forlagsversioner af artikler i IR. Men for at Harnad’s idé skulle kunne realiseres var der brug for en infrastruktur der kunne forbinde selvarkiveringsarkiverne.

OAI-PMH

I 1999 skete der noget meget vigtigt for selvarkiveringsbevægelsen. Paul Ginsparg, manden bag arXiv inviterede forfattere fra mange andre forskningsfelter end fysik til at selv-arkivere. Invitationen blev opfulgt af Santa Fee mødet 6 hvor Universal Preprint Server (UPS) blev præsenteret. UPS blev senere omdøbt til OAI-PMH af hensyn til navnesammenfaldet med Universal Parcels Service. OAI-PMH eller Open Archives Initiative – Protocol for Metadata Harvesting er som navnet siger en protokol til at høste metadata med. Idéen med at høste data var og er langt mere skalerbar end eksempelvis en model baseret på metasøgning via eksempelvis z39.50. Men da fulltekst og metadata via OAI-PMH blev skilt fra hinanden betød det også protokollen kunne anvendes til langt flere formål en at tilgængeliggøre fuldtekst eprints, noget der senere er blevet både værdsat og kritiseret.

OAI-PMH v1.0 blev frigivet i 2001.

Allerede i 2000 blev det første Open Source repository software udviklet af Southampton University, EPrints 7 og i 2002 frigav MIT, sammen med en række universiteter, og i et joint-venture med HP Dspace som et open source institutional repository 8. Kendetegnet for begge repositories var at de var OAI-PMH kompatible. I 2002 lancerede Universitetsbiblioteket ved University of Michigan OAIster, den første store service provider, dvs. en slags fælleskatalog med adgang til at søge i metadata fra en række data providers, altså IR der kan høste via OAI-PMH % ENDNOTE{http://www.oaister.org/}% I kølvandet på EPrints og Dspace fulgte en række andre repositoy software, men EPrints og Dspace forsætter dog med at være de to dominerende open source platforme til opsætningen af et IR. 9