Ce este la orizont pentru serviciile de date științifice? Cele mai recente de la World Data System

World Data System promovează gestionarea pe termen lung a – și accesul universal și echitabil la – date științifice și servicii de date, produse și informații de calitate asigurată în toate disciplinele.

Ce este la orizont pentru serviciile de date științifice? Cele mai recente de la World Data System

Ultimul an a fost o perioadă de tranziție pentru Sistemul mondial de date (WDS), un organism afiliat ISC.

Oficiul pentru programe internaționale (IPO) s-a mutat la Knoxville, Tennessee, iar Meredith Goins a fost numită director executiv. Au fost recrutați alți trei membri ai personalului, iar Comitetul științific al programului are și câțiva membri noi.  

L-am întâlnit pe David Castle, președintele Comitetului științific WDS; Karen Payne, Director al Biroului Tehnologic Internațional WDS; Suzie Allard, director al Centrului pentru Studii de Informare și Comunicare de la Universitatea din Tennessee, unde se află acum IPO WDS, și Meredith Goins, pentru a afla mai multe. 

Care a fost impactul modificărilor recente pentru activitățile WDS? 

David: Aceasta este o perioadă de consolidare și concentrare. În urmă cu patru sau cinci ani, am creat Biroul Tehnologic Internațional WDS (ITO) la Universitatea Victoria, la Ocean Networks Canada, care este o unitate de cercetare majoră și un membru al WDS. Am recrutat-o ​​pe Karen pentru a fi directorul asociat al ITO, iar asta ne-a pornit pe calea de a putea oferi mai mult volum și servicii diversificate membrilor noștri. În ultimul an, IPO s-a mutat din Tokyo în Tennessee cu sprijinul Universității din Tennessee și al Laboratorului Național Oak Ridge, precum și al Departamentului de Energie (DOE).  

Suzie: Cele două birouri lucrează foarte bine împreună, iar sprijinul pe care îl putem oferi membrilor este și mai mare, deoarece activitățile sunt coordonate atât de strâns. Asta ne oferă un mare potențial pentru viitor. 

David: Aproximativ jumătate din membrii Comitetului Științific s-au schimbat și ei în ultimul an. Am adăugat câteva persoane noi cheie pentru a se alătura membrilor care revin, toți fiind încadrați în lumea depozitelor de date. În ultimii ani, am pus WDS pe o bază solidă de la care vom putea lansa activități programatice și să realizăm o aliniere la Planurile de Acțiune ISC.

Încercăm să înțelegem unde sunt acum depozitele și datele și unde se vor îndrepta acestea în perioada următoare. Aceasta include ridicarea întrebărilor despre proveniența datelor, cum sunt gestionate și cum sunt păstrate în siguranță. Lucrăm la aspecte tehnice conexe, cum ar fi obiectele de date FAIR, în parteneriat cu CODATA și cum să lucrăm împreună pentru a crea standarde și așteptări de interoperabilitate pentru acestea. 

De asemenea, ne confruntăm cu o provocare care nu este întotdeauna menționată: există convingerea și așteptarea că, odată ce lucrurile sunt online și sunt disponibile, vor persista gratuit. Desigur, acest lucru nu este adevărat. Pentru a îndeplini așteptările că datele vor fi deschise și accesibile în cea mai mare măsură posibilă, trebuie să avem conversații sincere despre de unde vor veni resursele. Aceasta este o problemă pentru membrii noștri și o prioritate majoră pentru noi este modul în care definim valoarea extraordinară pe care depozitele o aduc la nivel național și internațional într-un mod care va ajuta depozitele să se angajeze cu finanțatori care pot sprijini planuri durabile pentru a face aceste date disponibile.  

O altă prioritate majoră este să facem membrii noștri mai reprezentativi la nivel global. Calitatea de membru WDS este predominant din Nordul Global și are sens pentru noi să colaborăm cu ISC și CODATA pentru a face bilanțul activităților din Africa, America Latină și de Sud și Asia de Sud-Est și, eventual, pentru a identifica noi membri pentru WDS. De asemenea, lucrăm cu alte grupuri care oferă servicii de date în modalități diferite decât susținerea unui depozit.  

Meredith: Un alt mod prin care ne facem membrii mai reprezentativi este să identificăm depozite dintr-o varietate de domenii, pe lângă științele biologice și ale pământului, pentru a crește diversitatea membrilor noștri. Arhivele de științe sociale și umaniste digitale sunt la fel de valoroase ca și științele naturii. Prin creșterea diversității noastre de membri, ne putem crește suportul pentru toate tipurile de depozite.  

Karen: Avem un impuls mare asupra unor servicii federate. De exemplu, pentru cercetarea polară avem ocazia de a pune la dispoziția cercetătorilor datele de la ambii poli într-un mod care este complet aliniat, ceea ce este extraordinar de interesant: este ceva la care comunitatea lucrează de mult timp și ne bucurăm să fim. o parte din asta. 

Serviciile federate pentru date polare sunt în două părți: căutarea federată, care se desfășoară de mult timp cu recoltarea tradițională de metadate, și un nou set de protocoale și procese pentru colectarea metadatelor, care este mai orientat pe web. Este mai puțin un catalog tradițional de servicii și mai mult pe linia a ceea ce ați găsi pentru Căutarea Google. Infrastructura pe care am construit-o ne permite să trimitem crawler-uri pentru a indexa paginile de destinație ale depozitelor de date care au implementat un anumit tip de marcare pe paginile lor de destinație de metadate. Oferim cercetătorilor posibilitatea de a căuta date atât din Arctica, cât și din Antarctica și colaborăm cu comunitățile de cercetare pentru a ne asigura că ontologiile pe care le implementează (marcajul) sunt, de asemenea, aliniate. 

Asigurarea finanțării pentru astfel de lucrări este foarte dificilă. Este un proiect internațional, așa că există o mulțime de conversații despre finanțare în diferite domenii. Aici, în Canada, se uită la diferite modele de finanțare, atât pentru investiții naționale, cât și pentru a putea face parte dintr-un set cooperativ global de finanțatori. De exemplu, unul dintre modelele pe care le examinează este Global Biodata Coalition, care este concepută pentru a coordona finanțarea globală pentru resurse cheie din științele vieții. 

Avem, de asemenea, un grup de lucru în cadrul Research Data Alliance care analizează ceea ce numim Global Open Research Commons. Există diferite organizații naționale, pan-naționale și specifice domeniului care încearcă să orchestreze accesul și interoperabilitatea la resurse precum seturi de date, software și resurse de calcul. La nivel național, are sens să existe o structură de guvernanță bună și o foaie de parcurs pentru toate investițiile lor în cercetare, astfel încât să vedeți organizații precum Australian Research Data Commons sau infrastructura japoneză coordonate la Institutul Național de Informatică. La nivel pannațional, vedeți proiecte ambițioase, cum ar fi European Open Science Cloud și African Open Science Platform. Iar domenii precum Alianța Observatorului Virtual Internațional, care deservește astronomii la nivel global, sunt toate foarte importante pentru susținerea comunităților lor de cercetare respective. Scopul grupului RDA este de a crea o foaie de parcurs pentru modul în care aceste bunuri comune pot împărtăși resursele fără probleme, astfel încât să fie mai ușor pentru oamenii de știință să lucreze împreună la nivel global pentru un bine mai mare. Ne bazăm pe munca care se desfășoară de mult timp, dar se simte cu adevărat că există multă motivație pentru a aduce aceste piese împreună acum. 

Puteți explica ce va însemna căutarea federată pentru cercetătorii care încearcă să acceseze datele în cauză, de exemplu pentru cercetarea polară? Ce se va schimba? 

Karen: În acest moment, cercetătorii trebuie să meargă în diferite locații pentru a găsi date. Și apoi, odată ce găsiți acele date, petreceți timp armonindu-și structura și apoi verificați de două ori conținutul pentru a vă asigura că înțelegeți care este sensul semantic al variabilelor măsurate din date. Aceasta este o primă încercare de a face acest proces mai coeziv și mai ușor de acționat. Din câte știu, acesta este singurul portal care permite utilizatorilor să caute date de la ambii poli simultan. În acest moment, ne concentrăm pe căutarea și descoperirea seturilor de date și pe aducerea mai multor depozite în index. Anticipăm că infrastructura va evolua pentru a sprijini sau a alimenta alte inițiative, cum ar fi Consorțiul canadian pentru interoperabilitatea datelor arctice (CCADI), care construiește instrumente îmbunătățite de vizualizare și analiză. Vrem să ne sprijinim partenerii, nu să reinventăm roata. 

Suzie: IPO se angajează să facă cunoscute toate tipurile de muncă pe care le face Karen și să se asigure că este bine diseminată. De asemenea, ne străduim să aducem toată lumea la curent, găzduind ateliere sau traininguri și creând oportunități pentru ca oamenii să participe. ITO lucrează de ultimă oră împreună cu toate aceste grupuri diferite. Iar IPO ne ajută să ne asigurăm că toată lumea învață ce se întâmplă în timp ce continuăm să construim aceste depozite grozave.

Unde vedeți lucrul în depozite și date astăzi? Și unde se duce? Care sunt noile provocări sau lucruri la care oamenii vor trebui să se gândească în următorii cinci până la zece ani? 

David: Sunt lucruri concrete care trebuie făcute. Una dintre ele este să ne asigurăm că depozitele noastre de membri sunt securizate. Acesta este un factor critic pentru a putea asigura integritatea datelor, care stă la baza întregii științe. Un alt aspect este că volumele de date au crescut atât de semnificativ încât modelele vechi de mutare a datelor la locul în care ați lucra cu ele într-un mediu de calcul de înaltă performanță sunt acum inversate. Acum este cazul că trebuie să găsim modalități de a putea analiza datele in situ, aducând computerul la date. O provocare este de a ajuta depozitele WDS să devină activate pentru cloud.  

Cealaltă parte a acestui lucru se referă la capacitatea și competențele forței de muncă, cum ar fi mobilizarea oamenilor de știință de date, a oamenilor de știință din cercetarea tehnică și a administratorilor de date. Acestea sunt roluri în evoluție în cadrul întreprinderii științifice care trebuie monitorizate cu atenție, astfel încât să ne asigurăm că există competențele potrivite și că avem educația și formarea pe care să le oferim persoanelor interesate. 

Karen: Mulți oameni lucrează la componente care le-ar permite cercetătorilor să se îndepărteze de la publicarea de lucrări statice în reviste și, în schimb, să creeze o lucrare reproductibilă care este disponibilă online. Cineva ar putea publica o bucată de date sau să facă o analiză, apoi să o scrie și să o publice ca un tip de pachet ușor reutilizabil care poate fi preluat de altcineva pentru a reproduce aceleași rezultate, ceea ce este important pentru a face afirmațiile. de știință verificabilă sau pentru a o reutiliza într-un mod nou. Cineva ar putea prelua pachetul, conecta o altă bucată de date sau poate modifica un parametru dintr-un software de analiză și poate crea un rezultat nou pe care îl publică. Deci, este vorba despre o atomizare a datelor și a componentelor software, astfel încât să puteți lua bucăți de lucruri și să le publicați cu ușurință. Lucrarea reproductibilă ajută la rezolvarea problemelor legate de reproductibilitatea rezultatelor, reutilizarea datelor și potențial redundanță a cercetării. 

Vedeți această tendință în dezvoltarea de software, unde există o dezagregare a API-urilor (Interfețe de programare a aplicațiilor) pe back-end, astfel încât să puteți utiliza porțiuni din ele. În comunitatea de gestionare a datelor există o idee similară în jurul obiectelor digitale FAIR – nu mai doriți să publicați întregul set de date descărcabil, doriți să oferiți un serviciu de date pentru fiecare observație sau măsurare și doriți să faceți acele măsurători operaționale, deci că puteți alege și alege ce observații doriți să utilizați fără multă prelucrare din partea dvs. - datele ar trebui să fie prezentate în forma sa cea mai accesibilă. 

Componentele, precum datele, trebuie să fie dezagregate și atomizate și accesibile atât de oameni, cât și de mașini, oriunde sunt distribuite pe tot globul. Din punctul de vedere al cercetătorului și al tehnologului, totul se întâmplă de jos în sus. Sunt aproape prea multe pentru a vă gândi, așa că devine despre modul în care faceți mici incursiuni pentru a le face semnificativ. Uniunea Geofizică Americană (AGU), în special, a făcut o treabă foarte bună concentrându-se pe caietele de calcul, ca prim pas pentru a vedea cum s-ar putea întâmpla o hârtie reproductibilă. Acesta este un caz de utilizare cu adevărat grozav pentru ceea ce vor deveni infrastructuri mult mai complexe. 

Este mult de asumat și, uneori, este greu să știi exact unde să-ți concentrezi. Dar aceasta este, sperăm, una dintre propunerile de valoare cu care WDS IPO și ITO ne pot ajuta membrii. 

Cum pot citi cititorii să afle mai multe despre WDS și cum se pot implica în activitățile dvs. sau deveni membri? 

David: Meredith s-a gândit bine la asta. Ne-am intensificat comunicările periodice cu membrii noștri și ne îmbunătățim site-ul web cu actualizări mai regulate, care vor continua. Vor fi, de asemenea, o serie întreagă de alte activități, pe măsură ce IPO va primi personal complet și odată ce planul nostru de acțiune pe doi ani va fi publicat. 

Meredith: Pe lângă relansarea rețelelor noastre sociale, în prezent finalizăm și testăm un site web reproiectat. Inițiativele viitoare includ webinarii de informare și educaționale pentru depozitele membre WDS, partenerii și organizațiile asociate. În plus, avem un buletin informativ bisăptămânal pentru membri, comunicări sensibile la timp despre oportunități trimise prin e-mail membrilor și așteptăm cu nerăbdare să creăm un raport anual pentru organizație, lucru care nu a mai avut loc din 2015-2016. Vom lansa, de asemenea, premiul WDS Data Stewardship și premiul ITO Data în același timp în acest an, pentru a oferi inginerilor și oamenilor de știință de la începutul carierei două oportunități de a-și arăta excelența cu datele.


Imagini de NASA prin Flickr.

VEZI TOATE ARTICOLELE LEGATE

Salt la conținut