Kio estas ĉe la horizonto por sciencaj datumservoj? La plej nova el la Monda Datuma Sistemo

La Monda Datuma Sistemo antaŭenigas longperspektivan administradon de - kaj universalan kaj justan aliron al - kvalite certigitaj sciencaj datenoj kaj datumservoj, produktoj, kaj informoj trans ĉiuj disciplinoj.

Kio estas ĉe la horizonto por sciencaj datumservoj? La plej nova el la Monda Datuma Sistemo

La lasta jaro estis periodo de transiro por la Monda Datuma Sistemo (WDS), ISC Filiigita Korpo.

La Internacia Programoficejo (IPO) moviĝis al Knoxville, Tenesio, kaj Meredith Goins estis nomumita kiel ĝia Administra Direktoro. Tri aliaj laborantaranoj estis rekrutitaj, kaj la Scienca Komitato de la programo ankaŭ havas plurajn novajn membrojn.  

Ni renkontis David Castle, Prezidanton de la Scienca Komitato de WDS; Karen Payne, Direktoro de la Internacia Teknologia Oficejo de WDS; Suzie Allard, Direktoro de la Centro por Informoj kaj Komunikado-Studoj ĉe la Universitato de Tenesio, kie nun baziĝas la WDS IPO, kaj Meredith Goins, por ekscii pli. 

Kio estis la efiko de la lastatempaj ŝanĝoj por WDS-agadoj? 

David: Ĉi tio estas periodo de firmiĝo kaj fokuso. Antaŭ kvar aŭ kvin jaroj, ni kreis la WDS International Technology Office (ITO) ĉe la Universitato de Viktorio, ĉe Ocean Networks Canada, kiu estas grava esplorinstalaĵo kaj membro de WDS. Ni varbis Karen por esti la Asociita Direktoro de la ITO, kaj tio ekis nin sur vojo de povi provizi pli da volumeno kaj diversigitaj servoj al nia membreco. En la lasta jaro, la IPO moviĝis de Tokio al Tenesio kun subteno de la Universitato de Tenesio kaj Oak Ridge National Lab, same kiel de la Departemento de Energio (DOE).  

Suzie: La du oficejoj funkcias tre bone kune, kaj la subteno, kiun ni povas provizi membrojn, estas eĉ pli granda ĉar agadoj estas tiel proksime kunordigitaj. Tio donas al ni grandan potencialon por la estonteco. 

David: Ĉirkaŭ duono de la membraro en la Scienca Komitato ankaŭ ŝanĝiĝis en la lasta jaro. Ni aldonis kelkajn ŝlosilajn novajn individuojn por aliĝi al revenantaj membroj, kiuj ĉiuj estas loĝigitaj en la mondo de datumdeponejoj. Dum la pasintaj kelkaj jaroj ni metis la WDS sur solidan bazon de kiu ni povos lanĉi programan agadon, kaj fari akordigon kun la ISC-Agadplanoj.

Ni provas kompreni kie deponejoj kaj datumoj nun estas kaj kien ili iros en la venonta periodo. Ĉi tio inkluzivas levi demandojn pri la deveno de datumoj, kiel ĝi estas administrata kaj kiel ĝi estas sekura. Ni laboras pri rilataj teknikaj aspektoj kiel FAIR-datumobjektoj, en partnereco kun CODATA, kaj kiel kunlabori por estigi normojn kaj kunfunkcieblecojn por tiuj. 

Ni ankaŭ alfrontas defion, kiu ne ĉiam estas menciita: Estas kredo kaj atendo, ke post kiam aferoj estas interretaj kaj disponeblaj, ili senpage daŭros. Ĉi tio kompreneble ne estas vera. Por renkonti la atendon, ke datumoj estos malfermitaj kaj alireblaj laŭ la plej granda mezuro ebla, ni devas havi sincerajn konversaciojn pri de kie venos la rimedoj. Ĉi tio estas problemo por niaj membroj, kaj grava prioritato por ni estas kiel ni difinas la enorman valoron kiun deponejoj alportas nacie kaj internacie en maniero kiel kiu helpos deponejojn okupiĝi kun financantoj kiuj povas subteni daŭrigeblajn planojn por disponigi tiujn datumojn.  

Alia grava prioritato estas fari nian membrecon pli tutmonde reprezenta. WDS-membreco estas ĉefe de la Tutmonda Nordo, kaj havas sencon por ni kunlabori kun la ISC kaj CODATA pri bilanco de agadoj en Afriko, Latino kaj Sudameriko kaj Sudorienta Azio kaj eble identigado de novaj membroj por WDS. Ni ankaŭ laboras kun aliaj grupoj, kiuj provizas datumservojn en malsamaj kategorioj ol konservado de deponejo.  

Meredith: Alia maniero kiel ni igas nian membrecon pli reprezenta estas identigi deponejojn de diversaj fakoj, krom la biologiaj kaj tersciencoj, por pliigi la diversecon de niaj membroj. Sociaj sciencoj kaj ciferecaj homaraj deponejoj estas same valoraj kiel la natursciencoj. Pliigante nian membrecdiversecon, ni povas pliigi nian subtenon por ĉiuj specoj de deponejoj.  

Karen: Ni havas grandan puŝon sur iuj federaciaj servoj. Ekzemple, por polusa esplorado ni havas ŝancon disponigi datumojn de ambaŭ polusoj al esploristoj en maniero tute kongrua, kio estas ege ekscita: ĝi estas io, pri kio la komunumo laboras delonge kaj ni ĝojas esti. parto de tio. 

Federaciaj servoj por polusaj datumoj venas en du partoj: la federacia serĉo, kiu daŭras delonge kun tradicia metadatumo-rikoltlaboro, kaj nova aro de protokoloj kaj procezoj por rikolto de metadatumoj pli orientita al retejo. Ĝi estas malpli de tradicia katalogo de servoj, kaj pli laŭ la linioj de tio, kion vi trovus por Google Search. La infrastrukturo, kiun ni konstruis, permesas al ni sendi kraŭlojn por indeksi la landpaĝojn de datumdeponejoj, kiuj efektivigis apartan tipon de markado sur siaj metadatumaj landpaĝoj. Ni provizas la kapablon por esploristoj serĉi datumojn de kaj la Arkto kaj Antarkto, kaj laboras kun la esplorkomunumoj por certigi ke la ontologioj kiujn ili efektivigas (la markado) estas ĉiuj vicigitaj ankaŭ. 

Sekurigi financadon por tia laboro estas vere malfacila. Ĝi estas internacia projekto, do estas multaj konversacioj pri financado en malsamaj areoj. Ĉi tie en Kanado ili rigardas malsamajn financajn modelojn, kaj por naciaj investoj kaj ankaŭ por ke ili povu esti parto de tutmonda kunlabora aro de financantoj. Ekzemple, unu el la modeloj, kiujn ili revizias, estas la Tutmonda Biodata Koalicio, kiu estas dizajnita por kunordigi tutmondan financadon por ŝlosilaj rimedoj en la vivsciencoj. 

Ni ankaŭ havas laborgrupon ene de la Research Data Alliance rigardanta tion, kion ni nomas la Tutmonda Open Research Commons. Estas malsamaj naciaj, tutnaciaj kaj domajnaj specifaj organizoj, kiuj provas reĝisori aliron kaj kunfunkcieblecon al resursoj kiel datumaroj, programaro kaj komputilaj rimedoj. Sur la nacia nivelo havas sencon havi bonan regan strukturon kaj vojmapon por ĉiuj iliaj esplorinvestoj, do vi vidas organizojn kiel la Aŭstralia Esplora Datumo-Komunejo aŭ la japana infrastrukturo kunordigita ĉe la Nacia Instituto de Informadiko. Tutnacie vi vidas ambiciajn projektojn kiel la Eŭropa Malferma Scienca Nubo kaj la Afrika Malferma Scienca Platformo. Kaj domajnoj kiel la Internacia Virtuala Observatorio-Alianco kiu servas al astronomoj tutmonde estas ĉiuj tre gravaj por subteni siajn respektivajn esplorkomunumojn. La celo de la RDA-grupo estas krei vojmapon pri kiel tiuj komunpaŝtejo povas kunhavigi resursojn perfekte tiel ke estas pli facile por sciencistoj labori kune tutmonde por la pli granda bono. Ni konstruas sur laboro kiu daŭris dum longa tempo, sed vere sentas kvazaŭ ekzistas multe da instigo kunigi ĉi tiujn pecojn nun. 

Ĉu vi povas klarigi, kion signifos federacia serĉo por esploristoj, kiuj provas aliri la koncernajn datumojn, ekzemple por polusa esplorado? Kio ŝanĝiĝos? 

Karen: Nuntempe esploristoj devas iri al malsamaj lokoj por trovi datumojn. Kaj tiam, kiam vi trovas tiujn datumojn, vi pasigas tempon harmoniigante ĝian strukturon, kaj poste duoble kontrolas la enhavon por certigi, ke vi komprenas, kia estas la semantika signifo de la mezuritaj variabloj en la datumoj. Ĉi tio estas unua provo fari tiun procezon pli kohezia kaj maŝinprilaborebla. Laŭ mia scio ĉi tiu estas la sola portalo, kiu ebligas al uzantoj serĉi datumojn de ambaŭ polusoj samtempe. Ĝuste nun ni koncentriĝas pri serĉado kaj malkovro de datumaroj kaj alportado de pli da deponejoj en la indekson. Ni antaŭvidas, ke la infrastrukturo evoluos por subteni aŭ nutri aliajn iniciatojn, kiel la Kanada Konsorcio por Arkta Datuma Kunfunkciebleco (CCADI), kiu konstruas plibonigitajn bildigajn kaj analizajn ilojn. Ni volas subteni niajn partnerojn, ne reinventi la radon. 

Suzie: La IPO estas devontigita al diskonigo pri ĉiuj specoj de laboro kiun Karen faras kaj certigi ke ĝi estas bone disvastigita. Ni ankaŭ laboras por rapidigi ĉiujn per gastigado de laborrenkontiĝoj aŭ trejnadoj kaj kreante ŝancojn por homoj partopreni. La ITO faras avangardan laboron kune kun ĉiuj ĉi tiuj malsamaj grupoj. Kaj la IPO helpas certigi, ke ĉiuj lernu kio okazas dum ni daŭre konstruas ĉi tiujn bonegajn deponejojn.

Kie vi vidas laboron pri deponejoj kaj datumoj hodiaŭ? Kaj kien ĝi iras? Kiuj estas la novaj defioj aŭ aferoj, pri kiuj homoj devos pensi en la venontaj kvin ĝis dek jaroj? 

David: Estas konkretaj aferoj, kiujn oni devas fari. Unu el ili certigas, ke niaj membrodeponejoj estas sekuraj. Tio estas kritika faktoro por povi certigi la integrecon de datumoj, kiu subtenas la tutan sciencon. Alia estas, ke volumoj de datumoj kreskis tiel signife, ke malnovaj modeloj de translokado de datumoj al kie vi efektive laborus kun ĝi en alta rendimenta komputika medio, nun estas renversitaj. Nun estas la kazo, ke ni devas trovi manierojn povi analizi datumojn in situ, alportante la komputilon al la datumoj. Defio estas helpi WDS-deponejojn iĝi nubo-ebligitaj.  

La alia parto de ĉi tio temas pri laborfortkapacito kaj kompetentecoj, kiel mobilizado de datumsciencistoj, teknikaj esplorsciencistoj kaj datumaj administrantoj. Ĉi tiuj estas evoluantaj roloj ene de la scienca entrepreno, kiuj devas esti zorge kontrolitaj por certigi, ke la ĝustaj kompetentecoj estas en la loko, kaj ke ni havas la edukadon kaj trejnadon por provizi al interesitaj homoj. 

Karen: Multaj homoj laboras pri komponantoj, kiuj permesus al esploristoj malproksimiĝi de eldonado de senmovaj artikoloj en ĵurnaloj kaj anstataŭe krei reprodukteblan artikolon, kiu estas disponebla interrete. Iu povus publikigi datumon aŭ fari analizon, poste skribi ĝin kaj publikigi ĝin kiel speco de facile reuzebla pakaĵo, kiu povas esti prenita de iu alia por aŭ reprodukti la samajn rezultojn, kio estas grava por fari la asertojn. de scienco kontrolebla, aŭ reuzi ĝin en nova maniero. Iu povus preni la pakaĵon, ŝtopi alian datumon aŭ ŝanĝi parametron de analiza programaro kaj krei novan rezulton, kiun ili publikigas. Do temas pri atomigo de la datumoj kaj la programaj komponantoj, por ke vi povu preni pecetojn kaj publikigi ilin facile. La reproduktebla papero helpas solvi problemojn kun reproduktebleco de rezultoj, reuzo de datumoj kaj eble redundo de esplorado. 

Vi vidas tiun tendencon en programaro-disvolviĝo, kie estas malagregado de la API-oj (Application Programming Interfaces) en la malantaŭo, por ke vi povu uzi partojn de ili. Ene de la datumadministradkomunumo ekzistas simila ideo ĉirkaŭ FAIR ciferecaj objektoj - vi ne volas publikigi ĉi tiun tutan elŝuteblan datumaron plu, vi volas provizi datumservon al ĉiu observado aŭ mezurado kaj vi volas igi tiujn mezuradojn maŝinprilaboreblajn, do ke vi povas elekti kaj elekti kiujn observojn vi volas uzi sen multe da prilaborado ĉe via fino - la datumoj devus esti prezentitaj en ĝia plej alirebla formo. 

La komponantoj, kiel la datumoj, devas esti disigitaj kaj atomigitaj kaj alireblaj de homoj kaj maŝinoj kie ajn ili estas distribuitaj tra la tuta mondo. El la vidpunkto de esploristo kaj teknologo ĉio okazas de malsupre supren. Estas preskaŭ tro multe por pensigi, do temas pri kiel vi faras malgrandajn enpaŝojn por fari ĝin signifoplena. La Usona Geofizika Unio (AGU), precipe, faris vere bonan laboron koncentriĝi pri komputilaj kajeroj kiel unua paŝo por vidi kiel reproduktebla papero povus okazi. Tio estas vere bonega uzkazo por kio fariĝos multe pli kompleksaj infrastrukturoj. 

Estas multe por preni, kaj foje estas malfacile scii precize kie meti vian fokuson. Sed tio estas espereble unu el la valorproponoj kun kiuj la WDS IPO kaj ITO povas helpi nian membrecon. 

Kiel legantoj povas ekscii pli pri WDS kaj kiel ili povas partopreni viajn agadojn aŭ fariĝi membroj? 

David: Meredith pripensis ĉi tion. Ni plifortigis niajn periodajn komunikadojn kun niaj membroj kaj plibonigas nian retejon per pli regulaj ĝisdatigoj, kiuj daŭros. Ankaŭ estos amaso da aliaj agadoj dum la IPO plene funkciiĝos, kaj post kiam nia dujara agadplano estos publikigita. 

Meredith: Krom relanĉi niajn sociajn amaskomunikilarojn, ni nuntempe finas kaj testas restrukturitan retejon. Estontaj iniciatoj inkluzivas disvastigajn kaj edukajn retseminariojn por niaj deponejoj de membroj de WDS, partneroj kaj rilataj organizoj. Aldone, ni havas dusemajnan bultenon por membroj, temp-sentemajn komunikadojn pri ŝancoj senditaj per retpoŝto al membroj, kaj ni antaŭĝojas krei jaran raporton por la organizo, kio ne okazis ekde 2015-2016. Ni ankaŭ kunlanĉos la premion WDS Data Stewardship kaj la ITO Data Prize samtempe ĉi-jare por doni al fruaj karieraj inĝenieroj kaj sciencistoj du ŝancojn montri sian plejbonecon per datumoj.


bildo de NASA per Flickr.

VIDU ĈIUJN RILATANJ ARTOJN

Rekte al enhavo