Polaråret deler data

dataskjermer (Ingressbilde)

Enorme mengder data er samlet inn under Polaråret. Nå jobbes det iherdig med å lage oversikt og tilgang til alle dataene. Den norske delen av prosjektet lanserer denne uken nye nettsider, og håper Polarårets datadelingskultur vil spre seg.

Iskjerneprøver fra 90 meters dyp i Antarktis, 67 timer med flyving for å måle atmosfærisk trykk knyttet til ekstremvær i nord, og bruk av klappmyss og elefantsel som forskningsassistenter for å få tak i data mennesker hittil ikke har hatt tilgang til. Blant annet.

Det internasjonale polaråret 2006-2008 har vært en eneste stor datainnsamlingsfest - dyr, krevende og spektakulær. Men svært verdifulle data fra våre mest utilgjengelige områder er nå sikret. At de forblir sikret og tilgjengelige for framtiden, er en sentral oppgave for IPY, som slett ikke har lagt ned arbeidet, selv om det offisielle "året" er over.

Alle må dele
Øystein Godøy, prosjektleder for DOKIPYFoto: Meteorologisk institutt
Øystein Godøy, prosjektleder for DOKIPY
- Alle forskere som har fått IPY-midler fra Forskningsrådet, har skrevet under på at de skal dele sine data. I tillegg krever IPY at et prosjekt må oppfylle IPYs datapolicy for å kunne bruke IPY-stempel på prosjektet sitt. Vår oppgave er å sette opp datahåndteringstjenester som gjør det mulig for de norske IPY-prosjektene å oppfylle sine forpliktelser, sier Øystein Godøy.

Han er seniorforsker ved Meteorologisk institutt og leder for prosjektet DOKIPY, som er det norske bidraget i Det internasjonale polarårets verdensomspennende datadelingsprosjekt IPYDIS (IPY Data and Information Service).

Ifølge IPYs datapolicy skal alle prosjektene beskrive dataene sine på en bestemt måte (hvem som har målt hva, hvor og når), og etter en bestemt internasjonal standard. Prosjektene skal også gjøre dataene tilgjengelig online, og er dessuten forpliktet til å sende dataene til et arkiv med et langsiktig mandat for forvaltning av datasett.

Én virtuell database
DOKIPY lanserer denne uken sine nettsider på engelsk og norsk. Her kan både forskere og andre interesserte gå inn å finne informasjon om hvilke data som finnes fra de norskledete polarårsprosjektene (metadata), og få tilgang til selve datasettene. Noen datasett er passordbelagt i en overgangsperiode.

Nettsiden, som har adressen www.dokipy.no, fungerer også som inngang for norske IPY-prosjektledere som ønsker å få sine datasett registrert.

- DOKIPY er et eget IPY-prosjekt med midler fra Norges forskningsråd. Vi har imidlertid utnyttet eksisterende infrastruktur og kompetanse ved Havforskningsinstituttet, Norsk Polarinstitutt, NILU og Meteorologisk institutt i vårt arbeid, forklarer Godøy. - Dette har gitt oss en veldig kostnadseffektiv løsning.

- Ved disse institusjonene eksisterte det allerede databaser for forskningsdata. Vi har fått disse databasene til å snakke sammen teknisk, og har jobbet med å tilpasse dem IPYs krav og standarder. Til slutt har vi sydd de ulike databasene sammen til én virtuell database, sier Godøy.

(Teksten fortsetter under bildet)

FRA DYPET: Lou Albershardt har hentet opp en ny iskjerne fra et 
90-metershull.Foto: Stein Tronstad, Norsk Polarinstitutt
FRA DYPET: Lou Albershardt har hentet opp en ny iskjerne fra et 90-metershull.

Tre ulike "noder"
Den virtuelle databasen består av tre ulike ”noder”: Havforskningsinstituttet (HI), Norsk Polarinstsitutt (NP) og Meteorologisk institutt (METNO). Alle nodene håndterer metadata og gjør disse søkbare, mens det for øyeblikket kun er HI og METNO som håndterer selve datasettene. Foreløpig er det bare METNO som tilbyr tilgang til datasettene via internett.

Informasjon om systemet og de tre nodene er altså tilgjengelig på nettsiden www.dokipy.no. Metadata synkroniseres i dag mellom de tre nodene, slik at man kommer fram til den samme informasjonen uavhengig av hvilken node som benyttes.

Del av globalt nettverk

IPYDOK-prosjektet arbeider nå med å knytte den norske, virtuelle databasen sammen med andre polarårsdatabaser i verden, gjennom IPYDIS – et globalt nettverk av datasentre og dataarkiv for polarårsdata.

Ved hjelp av felles standarder for dokumentasjon av data, bidrar IPYDIS til å gi en samlet oversikt over data samlet inn og produsert under Polaråret, samt tilgang til datasettene.

Ikke alltid lett å få tak i dataene

DATA FRA DYR: Klappmyssen Simon var forskningsassistent for polarårsprosjektet MEOP.Foto: Kit Kovac
DATA FRA DYR: Klappmyssen Simon var forskningsassistent for polarårsprosjektet MEOP.
Godøy og hans kolleger i DOKIPY har jobbet i vel et og et halvt år med å tilrettelegge databasene og å få de norske prosjektene til å registrere sine data.

- Det er en utfordring å få alle de 28 polarårsprosjektene med norsk ledelse til å registrere dataene sine, sier Godøy.

- De flinkeste prosjektene er de som er knyttet til institusjoneer som allerede hadde en database for registrering av datasett, påpeker prosjektlederen.

-Og det er kanskje ikke så rart. Andre prosjekter er kanskje innenfor fagfelt hvor datasett er veldig forskjellig fra og lagres etter en annen metodikk enn de naturvitenskapelige dataene. For mange kan henvendelsene fra oss bli et irritasjonsmoment. Da gjelder det å gi en god forklaring på hvorfor vi gjør dette.

Per juni 2009 er det omtrent ni av de 28 polarårsprosjektene som ikke har levert data eller har levert mangelfulle data, og som ikke svarer på henvendelser fra oss, opplyser Godøy.

Sikring for ettertiden
Bakgrunnen for IPYs datapolicy, IPYDIS og DOKIPY, er et ønske om at Polaråret skal nå sitt mål om å knytte sammen fagområder, prosjekter og enkeltforskere. Dette tror man åpen datautveksling og fri tilgang vil bidra til.

- En annen begrunnelse for å lage en oversikt over alle polarårsdataene, er å sikre dem for ettertiden, påpeker Godøy.

- Ved neste Polarår, om kanskje 50 år, skal det være lett å orientere seg om hvilke data som allerede finnes, og om hvordan man kan få tilgang til dem. Slik unngår man overlapping og duplisering av data. Datainnsamling i polare områder er ingen billig affære.

(Teksten fortsetter under bildet)

MÅLINGER: Både satellitter og bakkestasjoner er brukt til målinger under Polaråret.Foto: Norsk Romsenter
MÅLINGER: Både satellitter og bakkestasjoner er brukt til målinger under Polaråret.


Vil bedre kulturen for deling
Det internasjonale polaråret er tidlig ute med noe som forhåpentlig kan bli gjengs praksis innenfor forskningen, nemlig gratis og åpen deling av data.

OECD har nettopp kommet med en anbefaling om at alle offentlig finansierte forskningsdata skal gjøres tilgjengelig for deling med andre, slik at forskere og institusjoner kan få tilgang til dem. Norge er ikke juridisk, men moralsk forpliktet til å følge opp dette.

I dag er tilgang til forskningsdata på tvers av landegrenser og institusjoner ofte begrenset. Data ligger som regel ikke lett tilgjengelig, men finnes i ikke-søkbare databaser og ofte i et utall forskjellige formater.

Det finnes selvsagt en del unntak, som for eksempel innenfor operasjonell meteorologi.

Og for polarårsdataene blir det altså også annerledes.

- Jeg har stor tro på den grunnleggende tanken om datadeling som Polaråret formidler. Dette er noe som etter min mening vil bringe forskningen framover. Jeg håper Polarårets prinsipper om åpen og gratis datadeling vil bidra til å endre måten forskere tenker på, sier Godøy.

Har du spørsmål angående bruk av databasene eller registrering av datasett? Ta kontakt med Øystein Godøy eller de andre som jobber med IPYDOK. Her er kontaktinformasjon.

Sist oppdatert: 17.06.2009