Què hi ha a l'horitzó per als serveis de dades científiques? L'últim del World Data System

El World Data System promou la gestió a llarg termini i l'accés universal i equitatiu a dades científiques de qualitat i serveis de dades, productes i informació en totes les disciplines.

Què hi ha a l'horitzó per als serveis de dades científiques? L'últim del World Data System

L'últim any ha estat un període de transició per al Sistema mundial de dades (WDS), un organisme afiliat a l'ISC.

L'Oficina de Programes Internacionals (IPO) s'ha traslladat a Knoxville, Tennessee, i Meredith Goins ha estat nomenada directora executiva. Es van contractar altres tres membres del personal i el Comitè Científic del programa també compta amb diversos membres nous.  

Ens vam posar al dia amb David Castle, president del Comitè Científic de WDS; Karen Payne, directora de l'Oficina Tecnològica Internacional de WDS; Suzie Allard, directora del Centre d'Estudis d'Informació i Comunicació de la Universitat de Tennessee, on ara té la seu de WDS IPO, i Meredith Goins, per obtenir més informació. 

Quin ha estat l'impacte dels canvis recents per a les activitats de WDS? 

David: Aquest és un període de consolidació i enfocament. Fa quatre o cinc anys, vam crear l'Oficina Internacional de Tecnologia (ITO) de WDS a la Universitat de Victòria, a Ocean Networks Canada, que és un important centre de recerca i membre de WDS. Vam contractar Karen per ser la directora associada de l'ITO, i això ens va iniciar en el camí de poder oferir més volum i serveis diversificats als nostres membres. L'últim any, l'IPO s'ha traslladat de Tòquio a Tennessee amb el suport de la Universitat de Tennessee i Oak Ridge National Lab, així com del Departament d'Energia (DOE).  

Suzie: Les dues oficines estan treballant molt bé juntes, i el suport que podem oferir als membres és encara més gran perquè les activitats s'estan coordinant molt de prop. Això ens dóna un gran potencial per al futur. 

David: Al voltant de la meitat dels membres del Comitè Científic també han canviat l'últim any. Hem afegit algunes persones noves clau per unir-se als membres que tornen, tots ells instal·lats al món dels dipòsits de dades. Durant els darrers anys hem posat la WDS en una base sòlida des de la qual podrem iniciar l'activitat programàtica i aconseguir una alineació amb els Plans d'Acció de l'ISC.

Estem intentant entendre on són ara els dipòsits i les dades i cap a on aniran en el proper període. Això inclou plantejar preguntes sobre la procedència de les dades, com es gestionen i com es mantenen segurs. Estem treballant en aspectes tècnics relacionats, com ara els objectes de dades FAIR, en col·laboració amb CODATA, i com treballar junts per aconseguir estàndards i expectatives d'interoperabilitat per a aquests. 

També ens enfrontem a un repte que no sempre s'esmenta: hi ha la creença i l'expectativa que una vegada que les coses estiguin en línia i estiguin disponibles, persistiran de manera gratuïta. Això, per descomptat, no és cert. Per satisfer l'expectativa que les dades siguin obertes i accessibles en la major mesura possible, hem de mantenir converses franques sobre d'on sortiran els recursos. Aquest és un problema per als nostres membres, i una de les principals prioritats per a nosaltres és com definim l'enorme valor que els dipòsits aporten a nivell nacional i internacional d'una manera que els ajudarà a relacionar-se amb els finançadors que puguin donar suport a plans sostenibles per fer que aquestes dades estiguin disponibles.  

Una altra prioritat important és fer que els nostres membres siguin més representatius a nivell mundial. La pertinença a WDS és predominantment del nord global, i té sentit col·laborar amb l'ISC i CODATA per fer un balanç de les activitats a Àfrica, Amèrica Llatina i del Sud i el sud-est asiàtic i potencialment identificar nous membres per a WDS. També estem treballant amb altres grups que proporcionen serveis de dades en diferents modalitats que el manteniment d'un repositori.  

Meredith: Una altra manera de fer que els nostres membres siguin més representatius és identificar repositoris de diverses àrees temàtiques, a més de les ciències biològiques i de la terra, per augmentar la diversitat dels nostres membres. Els dipòsits de ciències socials i humanitats digitals són tan valuosos com les ciències naturals. Augmentant la nostra diversitat de membres, podem augmentar el nostre suport per a tot tipus de repositoris.  

Karen: Estem tenint una gran empenta en alguns serveis federats. Per exemple, per a la investigació polar tenim l'oportunitat de posar a disposició dels investigadors les dades dels dos pols d'una manera completament alineada, la qual cosa és tremendament emocionant: és una cosa en la qual la comunitat ha estat treballant durant molt de temps i estem contents de ser-ho. una part d'això. 

Els serveis federats per a dades polars es divideixen en dues parts: la cerca federada, que s'està duent a terme durant molt de temps amb la recol·lecció de metadades tradicionals, i un nou conjunt de protocols i processos per a la recollida de metadades més orientats a la web. Es tracta menys d'un catàleg tradicional de serveis, i més en la línia del que trobaríeu per a la Cerca de Google. La infraestructura que hem creat ens permet enviar rastrejadors per indexar les pàgines de destinació dels dipòsits de dades que han implementat un tipus de marcatge particular a les seves pàgines de destinació de metadades. Oferim als investigadors la possibilitat de cercar dades tant de l'Àrtic com de l'Antàrtida, i treballem amb les comunitats de recerca per assegurar-nos que les ontologies que implementen (el marcatge) també estiguin alineades. 

Aconseguir finançament per a aquest tipus de treball és realment complicat. És un projecte internacional, així que hi ha moltes converses sobre finançament en diferents àmbits. Aquí, al Canadà, estan mirant diferents models de finançament, tant per a inversions nacionals com també perquè puguin formar part d'un conjunt cooperatiu global de finançadors. Per exemple, un dels models que estan revisant és la Global Biodata Coalition que està dissenyada per coordinar el finançament global dels recursos clau en les ciències de la vida. 

També tenim un grup de treball dins de la Research Data Alliance que mira el que anomenem Global Open Research Commons. Hi ha diferents organitzacions nacionals, pannacionals i específiques de domini que estan intentant orquestrar l'accés i la interoperabilitat a recursos com ara conjunts de dades, programari i recursos computacionals. A nivell nacional té sentit tenir una bona estructura de govern i un full de ruta per a totes les seves inversions en recerca, de manera que es veuen organitzacions com l'Australian Research Data Commons o la infraestructura japonesa coordinada a l'Institut Nacional d'Informàtica. A nivell nacional veieu projectes ambiciosos com el núvol europeu de ciència oberta i la plataforma africana de ciència oberta. I dominis com l'Aliança d'Observatori Virtual Internacional que serveix als astrònoms a nivell mundial són molt importants per donar suport a les seves respectives comunitats de recerca. L'objectiu del grup RDA és crear un full de ruta sobre com aquests béns comuns poden compartir recursos sense problemes, de manera que sigui més fàcil per als científics treballar junts a nivell mundial per al bé general. Estem basant-nos en el treball que s'està duent a terme durant molt de temps, però realment sembla que ara hi ha molta motivació per reunir aquestes peces. 

Pots explicar què significarà la cerca federada per als investigadors que intenten accedir a les dades en qüestió, per exemple per a la recerca polar? Què canviarà? 

Karen: Ara mateix els investigadors han d'anar a diferents llocs per trobar dades. I després, un cop trobeu aquestes dades, dediqueu temps a harmonitzar-ne l'estructura i, a continuació, comproveu el contingut per assegurar-vos que enteneu quin és el significat semàntic de les variables mesurades a les dades. Aquest és un primer intent de fer que aquest procés sigui més cohesionat i accionable per la màquina. Que jo sàpiga, aquest és l'únic portal que permet als usuaris cercar dades dels dos pols simultàniament. Ara mateix estem centrats en la cerca i el descobriment de conjunts de dades i en incorporar més repositoris a l'índex. Preveiem que la infraestructura evolucionarà per donar suport o alimentar altres iniciatives, com el Consorci canadenc per a la interoperabilitat de dades de l'Àrtic (CCADI), que està construint eines de visualització i anàlisi millorades. Volem donar suport als nostres socis, no reinventar la roda. 

Suzie: L'OPI es compromet a donar a conèixer tot el tipus de treball que està fent Karen i assegurar-se que es difongui bé. També estem treballant perquè tothom estigui al dia organitzant tallers o formacions i creant oportunitats perquè la gent participi. L'ITO està fent un treball d'avantguarda conjuntament amb tots aquests diferents grups. I l'IPO està ajudant a assegurar-se que tothom aprengui què està passant mentre continuem construint aquests grans dipòsits.

On veus el treball en dipòsits i dades avui? I cap a on va? Quins són els nous reptes o coses en què la gent haurà de pensar en els propers cinc o deu anys? 

David: Hi ha coses concretes que s'han de fer. Un d'ells és garantir que els nostres dipòsits de membres siguin segurs. Aquest és un factor crític per poder garantir la integritat de les dades, que sustenta tota la ciència. Una altra és que els volums de dades han crescut de manera tan significativa que ara s'estan canviant els models antics de traslladar dades a on realment treballaríeu amb ells en un entorn informàtic d'alt rendiment. Ara és el cas que hem de trobar maneres de poder analitzar les dades in situ, portant l'ordinador a les dades. Un repte és ajudar els dipòsits WDS a habilitar el núvol.  

L'altra part tracta sobre la capacitat i les competències de la força de treball, com ara la mobilització de científics de dades, científics d'investigació tècnica i administradors de dades. Es tracta de rols en evolució dins de l'empresa científica que s'han de controlar acuradament per garantir que es disposen de les competències adequades i que tenim l'educació i la formació per oferir a les persones interessades. 

Karen: Molta gent està treballant en components que permetrien als investigadors allunyar-se de la publicació d'articles estàtics en revistes i crear un article reproduïble que estigui disponible en línia. Algú podria publicar una dada o fer una peça d'anàlisi, després escriure-la i publicar-la com un tipus de paquet fàcilment reutilitzable que una altra persona pot agafar per reproduir els mateixos resultats, cosa que és important per fer les afirmacions. de ciència verificable, o per reutilitzar-lo d'una manera nova. Algú podria agafar el paquet, connectar una dada diferent o canviar un paràmetre en un programari d'anàlisi i crear un resultat nou que publiqui. Així doncs, es tracta d'una atomització de les dades i dels components del programari, de manera que pugueu agafar fragments de coses i publicar-les fàcilment. El document reproduïble ajuda a resoldre problemes amb la reproductibilitat dels resultats, la reutilització de dades i, potencialment, la redundància de la investigació. 

Veu aquesta tendència en el desenvolupament de programari, on hi ha una desagregació de les API (Interfícies de programació d'aplicacions) al fons, de manera que podeu utilitzar-ne parts. Dins de la comunitat de gestió de dades hi ha una idea similar al voltant dels objectes digitals FAIR: ja no voleu publicar tot aquest conjunt de dades descarregable, voleu proporcionar un servei de dades a cada observació o mesura i voleu que aquestes mesures siguin accionables per màquina, així que que podeu escollir i triar quines observacions voleu utilitzar sense molt de processament per part vostra: les dades s'han de presentar en la seva forma més accessible. 

Els components, com les dades, han de ser desagregats, atomitzats i accessibles tant per als humans com per les màquines allà on estiguin distribuïts per tot el món. Des del punt de vista d'un investigador i tecnòleg, tot passa de baix a dalt. Gairebé n'hi ha massa per fer-te pensar, de manera que es tracta de com fer petites incursions per fer-ho significatiu. L'American Geophysical Union (AGU), en particular, ha fet un molt bon treball centrant-se en els quaderns computacionals com a primer pas per veure com podria passar un paper reproduïble. Aquest és un cas d'ús realment fantàstic per al que es convertiran en infraestructures molt més complexes. 

És molt per assumir, i de vegades és difícil saber exactament on centrar-se. Però és d'esperar que aquesta sigui una de les propostes de valor amb les quals l'OPI i l'ITO de WDS poden ajudar els nostres membres. 

Com poden els lectors saber més sobre WDS i com es poden implicar en les vostres activitats o fer-se membres? 

David: La Meredith ha estat pensant-ho bé. Hem intensificat les nostres comunicacions periòdiques amb els nostres membres i estem millorant el nostre lloc web amb actualitzacions més periòdiques, que continuaran. També hi haurà tota una sèrie d'activitats a mesura que l'OPI tingui tot el personal i un cop es publiqui el nostre pla d'acció de dos anys. 

Meredith: A més de rellançar les nostres xarxes socials, actualment estem ultimant i provant un lloc web redissenyat. Les iniciatives futures inclouen seminaris web educatius i de divulgació per als nostres dipòsits de membres de WDS, socis i organitzacions associades. A més, disposem d'un butlletí quinzenal per als membres, de comunicacions temporals sobre oportunitats enviades per correu electrònic als membres i esperem crear un informe anual per a l'organització, cosa que no s'ha produït des del 2015-2016. També co-llançarem el premi WDS Data Stewardship i el ITO Data Prize al mateix temps aquest any per oferir als enginyers i científics de la seva carrera inicial dues oportunitats de mostrar la seva excel·lència amb les dades.


Imatge de NASA a través de Flickr.

VEURE TOTS ELS ARTICLES RELACIONATS

Anar al contingut