Registreeri

Mis on teaduslike andmeteenuste silmapiiril? Uusim World Data Systemist

Maailma andmesüsteem edendab kvaliteetsete teadusandmete ja andmeteenuste, toodete ja teabe pikaajalist haldamist ja universaalset ja võrdset juurdepääsu kõikidele teadusharudele.

Möödunud aasta on olnud üleminekuperiood Maailma andmesüsteem (WDS), ISC-ga seotud asutus.

Rahvusvaheline programmibüroo (IPO) on kolinud Tennessee osariiki Knoxville'i ja selle tegevdirektoriks on määratud Meredith Goins. Tööle võeti veel kolm töötajat ja ka programmi teaduskomitees on mitu uut liiget.  

Jõudsime järele WDS-i teaduskomitee esimehe David Castle'iga; Karen Payne, WDS-i rahvusvahelise tehnoloogiabüroo direktor; Suzie Allard, Tennessee ülikooli teabe- ja kommunikatsiooniuuringute keskuse direktor, kus praegu asub WDS-i IPO, ja Meredith Goins, et rohkem teada saada. 

Milline on olnud hiljutiste muudatuste mõju WDS-i tegevustele? 

David: See on konsolideerumise ja keskendumise periood. Neli või viis aastat tagasi lõime Victoria ülikoolis Kanadas Ocean Networksis WDS-i rahvusvahelise tehnoloogiabüroo (ITO), mis on suur uurimisasutus ja WDS-i liige. Värbasime Kareni ITO asedirektoriks ja see pani meid liikuma teel, et saaksime pakkuda oma liikmeskonnale suuremaid ja mitmekesisemaid teenuseid. Viimase aasta jooksul on IPO kolinud Tokyost Tennesseesse Tennessee ülikooli ja Oak Ridge'i riikliku labori ning energeetikaosakonna (DOE) toel.  

Suzie: Kaks bürood teevad väga hästi koostööd ja toetus, mida saame liikmetele pakkuda, on veelgi suurem, kuna tegevusi koordineeritakse nii tihedalt. See annab meile suure potentsiaali tulevikuks. 

David: Umbes pooled teaduskomitee liikmeskonnast on samuti viimase aasta jooksul vahetunud. Oleme naasvate liikmetega liitumiseks lisanud mõned olulised uued isikud, kes kõik on seotud andmehoidlate maailmas. Viimase paari aasta jooksul oleme pannud WDS-i kindlale alusele, millelt saame käivitada programmilise tegevuse ja viia vastavusse ISC tegevuskavadega.

Püüame aru saada, kus hoidlad ja andmed praegu asuvad ning kuhu need järgmisel perioodil liiguvad. See hõlmab küsimuste esitamist andmete päritolu, nende haldamise ja turvalisuse kohta. Töötame koostöös CODATA-ga seotud tehniliste aspektidega, nagu FAIR-i andmeobjektid, ja selle kallal, kuidas teha koostööd nende standardite ja koostalitlusvõime ootuste saavutamiseks. 

Samuti seisame silmitsi väljakutsega, mida alati ei mainita: on usk ja ootus, et kui asjad on võrgus ja kättesaadavad, jäävad need tasuta püsima. See pole muidugi tõsi. Selleks et täita ootusi, et andmed on võimalikult suures ulatuses avatud ja juurdepääsetavad, peame ausalt rääkima, kust ressursid tulevad. See on meie liikmete probleem ja meie peamine prioriteet on see, kuidas määratleme hoidlate tohutut väärtust riiklikul ja rahvusvahelisel tasandil viisil, mis aitab hoidlatel suhelda rahastajatega, kes saavad toetada jätkusuutlikke plaane nende andmete kättesaadavaks tegemiseks.  

Teine oluline prioriteet on muuta meie liikmeskond globaalselt esinduslikumaks. WDS-i liikmeskond on valdavalt globaalsest põhjaosast ning meil on mõttekas teha koostööd ISC ja CODATA-ga, et teha kokkuvõte tegevustest Aafrikas, Ladina- ja Lõuna-Ameerikas ning Kagu-Aasias ning potentsiaalselt leida WDS-i uusi liikmeid. Teeme koostööd ka teiste rühmadega, kes pakuvad andmeteenuseid erineval viisil kui hoidla ülalpidamine.  

Meredith: Teine viis, kuidas me oma liikmeskonda esinduslikumaks muudame, on lisaks bioloogia- ja maateadustele tuvastada hoidlaid erinevatest ainevaldkondadest, et suurendada oma liikmete mitmekesisust. Sotsiaalteaduste ja digitaalsete humanitaarteaduste hoidlad on sama väärtuslikud kui loodusteadused. Suurendades oma liikmeskonna mitmekesisust, saame suurendada toetust igat tüüpi hoidlatele.  

Karen: Meil ​​on suur tõuge mõnele liitteenusele. Näiteks polaaruuringute jaoks on meil võimalus teha mõlema pooluse andmed teadlastele kättesaadavaks viisil, mis on täiesti joondatud, mis on tohutult põnev: see on midagi, mille nimel kogukond on pikka aega töötanud ja meil on hea meel, et osa sellest. 

Polaarandmete liitteenused jagunevad kaheks osaks: liitotsing, mis on traditsioonilise metaandmete kogumisega juba pikka aega kestnud, ja uus metaandmete kogumise protokollide ja protsesside komplekt, mis on rohkem veebile orienteeritud. See on vähem traditsiooniline teenuste kataloog, vaid pigem Google'i otsingu jaoks leitav. Meie loodud infrastruktuur võimaldab meil saata välja roomajad, kes indekseerivad nende andmehoidlate sihtlehti, mis on oma metaandmete sihtlehtedel rakendanud teatud tüüpi märgistuse. Anname teadlastele võimaluse otsida andmeid nii Arktikast kui ka Antarktikast ning teeme koostööd teadlaskogukondadega, et tagada, et ka nende poolt rakendatavad ontoloogiad (märgistus) oleksid kõik kooskõlas. 

Sellise töö jaoks rahastamise tagamine on tõesti keeruline. Tegemist on rahvusvahelise projektiga, nii et eri valdkondade rahastamise teemal on palju vestlusi. Siin Kanadas uurivad nad erinevaid rahastamismudeleid nii riiklike investeeringute jaoks kui ka selleks, et nad saaksid olla osa ülemaailmsest rahastajate ühistust. Näiteks üks mudelitest, mida nad läbi vaatavad, on ülemaailmne bioandmete koalitsioon, mille eesmärk on koordineerida bioteaduste peamiste ressursside ülemaailmset rahastamist. 

Meil on ka Research Data Alliance'i sees töörühm, kes uurib seda, mida me nimetame ülemaailmseks avatud uuringute ühistööks. Erinevad riiklikud, üleriigilised ja domeenispetsiifilised organisatsioonid püüavad korraldada juurdepääsu ja koostalitlusvõimet ressurssidele, nagu andmekogumid, tarkvara ja arvutusressursid. Riiklikul tasandil on mõistlik omada kõigi nende teadusinvesteeringute jaoks head juhtimisstruktuuri ja tegevuskava, nii et näete selliseid organisatsioone nagu Austraalia Research Data Commons või Jaapani infrastruktuur, mida koordineerib Riiklik Informaatika Instituut. Üleriigiliselt näete ambitsioonikaid projekte, nagu Euroopa avatud teaduspilv ja Aafrika avatud teaduse platvorm. Ja sellised valdkonnad nagu International Virtual Observatory Alliance, mis teenindab astronoome kogu maailmas, on kõik väga olulised nende vastavate teadusringkondade toetamiseks. RDA grupi eesmärk on luua tegevuskava selle kohta, kuidas need ühisvarad saaksid ressursse sujuvalt jagada, et teadlastel oleks lihtsam ülemaailmselt suurema hüvangu nimel koostööd teha. Me jätkame tööd, mis on kestnud juba pikka aega, kuid on tõesti tunne, et motivatsiooni need osad nüüd kokku viia on palju. 

Kas saate selgitada, mida liitotsing tähendab teadlastele, kes püüavad kõnealustele andmetele juurde pääseda, näiteks polaaruuringute jaoks? Mis muutub? 

Karen: Praegu peavad teadlased andmete leidmiseks minema erinevatesse kohtadesse. Kui olete need andmed leidnud, kulutate aega nende struktuuri ühtlustamiseks ja seejärel sisu üle kontrollimiseks, veendumaks, et saate aru, mis on andmetes sisalduvate mõõdetud muutujate semantiline tähendus. See on esimene katse muuta see protsess ühtsemaks ja masinaga kasutatavamaks. Minu teada on see ainus portaal, mis võimaldab kasutajatel otsida andmeid korraga mõlemalt pooluselt. Praegu oleme keskendunud andmekogumite otsimisele ja avastamisele ning rohkemate hoidlate viimisele registrisse. Eeldame, et infrastruktuur areneb, et toetada või toetada muid algatusi, nagu Kanada Arktika andmete koostalitlusvõime konsortsium (CCADI), mis loob täiustatud visualiseerimis- ja analüüsitööriistu. Tahame oma partnereid toetada, mitte jalgratast uuesti leiutada. 

Suzie: IPO on pühendunud sellele, et Karen teeb teatavaks kõikvõimalikud tööd ja tagaks, et seda levitataks hästi. Samuti töötame selle nimel, et kõik saaksid asjaga kursis olla, korraldades töötubasid või koolitusi ning luues inimestele võimalusi osaleda. ITO teeb koos kõigi nende erinevate rühmadega tipptasemel tööd. Ja IPO aitab tagada, et kõik saavad teada, mis toimub, kui jätkame nende suurepäraste hoidlate loomist.

Kus näete täna tööd hoidlate ja andmetega? Ja kuhu see läheb? Millised on uued väljakutsed või asjad, millele inimesed järgmise viie kuni kümne aasta jooksul mõtlema peavad? 

David: On konkreetseid asju, mis tuleb ära teha. Üks neist on tagada, et meie liikmehoidlad on turvalised. See on kriitiline tegur andmete terviklikkuse tagamisel, mis on kogu teaduse aluseks. Teine on see, et andmemahud on nii märkimisväärselt kasvanud, et vanad mudelid andmete teisaldamiseks sinna, kus te nendega suure jõudlusega andmetöötluskeskkonnas tegelikult töötaksite, hakatakse nüüd ümber pöörama. Nüüd on nii, et peame leidma viise, kuidas andmeid analüüsida kohapealne, tuues arvuti andmete juurde. Väljakutse on aidata WDS-i hoidlatel pilvepõhiseks saada.  

Teine osa sellest puudutab tööjõu suutlikkust ja pädevusi, nagu andmeteadlaste, tehniliste uurijate ja andmehaldurite mobiliseerimine. Need on teadusettevõttes arenevad rollid, mida tuleb hoolikalt jälgida, et tagada õigete pädevuste olemasolu ning meil on huvilistele pakkuda haridust ja koolitust. 

Karen: Paljud inimesed töötavad komponentide kallal, mis võimaldaksid teadlastel loobuda staatiliste paberite avaldamisest ajakirjades ja luua selle asemel reprodutseeritav paber, mis on saadaval veebis. Keegi võiks avaldada andmetüki või analüüsi teha, seejärel üles kirjutada ja avaldada lihtsa korduvkasutatava pakendina, mida keegi teine ​​saab kasutada samade tulemuste taasesitamiseks, mis on väidete esitamiseks oluline. kontrollitav või seda uuel viisil taaskasutada. Keegi võib võtta paketi, ühendada mõne muu andmeosa või muuta analüüsitarkvara parameetrit ja luua uue tulemuse, mille nad avaldavad. Seega muutub see andmete ja tarkvarakomponentide pihustamiseks, et saaksite võtta asju ja neid hõlpsalt avaldada. Reprodutseeritav paber aitab lahendada probleeme, mis on seotud tulemuste reprodutseeritavuse, andmete taaskasutamise ja uurimistöö võimaliku liiasusega. 

Näete seda suundumust tarkvaraarenduses, kus API-d (rakenduse programmeerimisliidesed) on taustal jaotatud, et saaksite kasutada nende osi. Andmehalduse kogukonnas on sarnane idee FAIR-i digitaalobjektide kohta – te ei soovi enam kogu seda allalaaditavat andmekogumit avaldada, soovite pakkuda andmeteenust iga vaatluse või mõõtmise jaoks ja soovite muuta need mõõtmised masinaga kasutatavaks, nii et et saate ilma suurema töötlemiseta valida ja valida, milliseid vaatlusi soovite kasutada – andmed tuleks esitada kõige kättesaadavamal kujul. 

Komponendid, nagu ka andmed, peavad olema liigendatud ja pihustatud ning nii inimestele kui ka masinatele juurdepääsetavad kõikjal maailmas. Teadlase ja tehnoloogi vaatenurgast toimub see kõik alt üles. Peaaegu liiga palju on selleks, et meelt ümber pöörata, nii et see puudutab seda, kuidas teete väikeseid edusamme, et muuta see mõttekaks. Eelkõige Ameerika Geofüüsika Liit (AGU) on teinud tõeliselt head tööd, keskendudes arvutuslikele sülearvutitele esimese sammuna, et näha, kuidas reprodutseeritav paber võiks juhtuda. See on tõesti suurepärane kasutusjuht palju keerulisemaks muutuvate infrastruktuuride jaoks. 

Seda on palju ette võtta ja mõnikord on raske täpselt teada, kuhu keskenduda. Kuid see on loodetavasti üks väärtuspakkumisi, millega WDS IPO ja ITO saavad meie liikmeskonda aidata. 

Kuidas saavad lugejad WDS-i kohta rohkem teada saada ja kuidas nad saavad teie tegevustes kaasa lüüa või liikmeks saada? 

David: Meredith on selle läbi mõelnud. Oleme tõhustanud perioodilist suhtlust oma liikmetega ja täiustame oma veebisaiti regulaarsete uuendustega, mis jätkuvad. Samuti toimub palju muid tegevusi, kui IPO saab täis töötajaid ja kui meie kaheaastane tegevuskava avaldatakse. 

Meredith: Lisaks sotsiaalmeedia taaskäivitamisele viimistleme ja testime praegu ümberkujundatud veebisaiti. Tulevased algatused hõlmavad meie WDS-i liikmehoidlatele, partneritele ja seotud organisatsioonidele suunatud teavitus- ja harivaid veebiseminare. Lisaks on meil iga kahe nädala tagant liikmetele mõeldud uudiskiri, liikmetele e-posti teel saadetavad ajatundlikud teated võimaluste kohta ja ootame organisatsiooni aastaaruande koostamist, mida pole juhtunud alates 2015.–2016. aastast. Samuti anname sel aastal samaaegselt välja WDS Data Stewardship auhinna ja ITO Data Prize'i, et anda karjääri alustavatele inseneridele ja teadlastele kaks võimalust näidata oma tipptaset andmetega.


Image by NASA Flickri kaudu.

Otse sisu juurde