Що очікує на горизонті служб наукових даних? Останні з World Data System

Світова система даних сприяє довгостроковому управлінню – та універсальному та рівноправному доступу до – наукових даних та послуг, продуктів та інформації з гарантованою якістю, продуктів та інформації в усіх дисциплінах.

Що очікує на горизонті служб наукових даних? Останні з World Data System

Останній рік став перехідним періодом для Світова система даних (WDS), афілійований орган ISC.

Міжнародний програмний офіс (IPO) переїхав до Ноксвілла, штат Теннессі, і Мередіт Гойнс була призначена його виконавчим директором. Було найнято ще трьох співробітників, і Науковий комітет програми також має кілька нових членів.  

Ми наздогнали Девіда Касла, голови наукового комітету WDS; Карен Пейн, директор Міжнародного технологічного офісу WDS; Сьюзі Аллард, директор Центру інформаційних та комунікаційних досліджень при Університеті Теннессі, де зараз базується WDS IPO, і Мередіт Гойнс, щоб дізнатися більше. 

Яким був вплив останніх змін на діяльність WDS? 

Девід: Це період консолідації та зосередженості. Чотири або п’ять років тому ми створили Міжнародний технологічний офіс WDS (ITO) в Університеті Вікторії в Ocean Networks Canada, який є великим дослідницьким центром і членом WDS. Ми найняли Карен на посаду заступника директора ITO, і це почало нас на шляху до можливості надавати більші обсяги та різноманітні послуги для наших членів. За останній рік IPO перемістилося з Токіо до Теннессі за підтримки Університету Теннессі та Національної лабораторії Ок-Рідж, а також Департаменту енергетики (DOE).  

Сьюзі: Два офіси дуже добре працюють разом, і підтримка, яку ми можемо надати членам, є ще більшою, оскільки діяльність координується дуже тісно. Це дає нам великий потенціал для майбутнього. 

Девід: Близько половини членів Наукового комітету також змінилося за останній рік. Ми додали кількох ключових нових людей, щоб приєднатися до членів, які повернулися, і всі вони знаходяться у світі сховищ даних. Протягом останніх кількох років ми поставили WDS на міцну основу, з якої ми зможемо розпочати програмну діяльність та привести у відповідність із Планами дій ISC.

Ми намагаємося зрозуміти, де зараз знаходяться сховища та дані і куди вони збираються рухатися в найближчий період. Це включає в себе питання про походження даних, способи їх керування та збереження. Ми працюємо над пов’язаними технічними аспектами, такими як об’єкти даних FAIR, у партнерстві з CODATA, і над тим, як працювати разом, щоб забезпечити стандарти та очікування щодо сумісності для них. 

Ми також стикаємося з проблемою, про яку не завжди згадують: існує віра та очікування, що після того, як речі будуть онлайн та доступні, вони залишаться безкоштовними. Це, звичайно, неправда. Щоб виправдати очікування, що дані будуть максимально відкритими і доступними, нам потрібно вести відверті розмови про те, звідки будуть братися ресурси. Це питання для наших членів, і основним пріоритетом для нас є те, як ми визначаємо величезну цінність, яку приносять репозитарії на національному та міжнародному рівні, щоб допомогти сховищам взаємодіяти з спонсорами, які можуть підтримати стійкі плани надання цих даних.  

Ще одним важливим пріоритетом є зробити наше членство більш представницьким у всьому світі. Членами WDS є переважно представники Глобальної Півночі, і нам має сенс співпрацювати з ISC та CODATA для аналізу діяльності в Африці, Латинській та Південній Америці та Південно-Східній Азії та потенційного визначення нових членів WDS. Ми також працюємо з іншими групами, які надають послуги даних у різних формах, ніж підтримка сховища.  

Мередіт: Інший спосіб зробити наше членство більш репрезентативним — це визначити сховища з різних предметних областей, на додаток до біологічних та наук про Землю, щоб збільшити різноманітність наших членів. Репозиторії соціальних і цифрових гуманітарних наук так само цінні, як і природничі науки. Збільшуючи різноманітність членства, ми можемо збільшити підтримку всіх типів репозиторіїв.  

Карен: Ми робимо великий поштовх до деяких федеративних послуг. Наприклад, для полярних досліджень у нас є можливість зробити дані з обох полюсів доступними для дослідників таким чином, щоб вони були повністю узгоджені, що надзвичайно цікаво: це те, над чим спільнота працювала протягом тривалого часу, і ми раді бути частина цього. 

Об’єднані служби для полярних даних поділяються на дві частини: об’єднаний пошук, який тривалий час із традиційним збором метаданих, і новий набір протоколів і процесів для збору метаданих, які більше орієнтовані на Інтернет. Це менш традиційний каталог послуг, а більше схожий на те, що ви знайдете в Пошуку Google. Створена нами інфраструктура дозволяє нам надсилати сканери для індексації цільових сторінок сховищ даних, які впровадили певний тип розмітки на своїх цільових сторінках метаданих. Ми надаємо можливість дослідникам шукати дані як з Арктики, так і з Антарктики, а також співпрацюємо з дослідницькими спільнотами, щоб переконатися, що всі онтології, які вони реалізують (розмітка), також узгоджені. 

Забезпечити фінансування для такої роботи справді складно. Це міжнародний проект, тому багато розмов про фінансування в різних сферах. Тут, у Канаді, вони розглядають різні моделі фінансування, як для національних інвестицій, так і для того, щоб вони могли бути частиною глобальної спільної групи фінансувальників. Наприклад, однією з моделей, які вони розглядають, є Глобальна коаліція з біоданих, яка покликана координувати глобальне фінансування ключових ресурсів у галузі наук про життя. 

У нас також є робоча група в рамках Research Data Alliance, яка розглядає те, що ми називаємо Global Open Research Commons. Існують різні національні, загальнонаціональні та специфічні для домену організації, які намагаються організувати доступ та взаємодію з такими ресурсами, як набори даних, програмне забезпечення та обчислювальні ресурси. На національному рівні має сенс мати хорошу структуру управління та дорожню карту для всіх їхніх інвестицій у дослідження, тож ви бачите такі організації, як Australian Research Data Commons або японська інфраструктура, координовані в Національному інституті інформатики. На загальнонаціональному рівні ви бачите амбітні проекти, як-от European Open Science Cloud та African Open Science Platform. І такі домени, як Міжнародний альянс віртуальних обсерваторій, який обслуговує астрономів у всьому світі, дуже важливі для підтримки їх відповідних дослідницьких спільнот. Мета групи RDA полягає в тому, щоб створити дорожню карту того, як ці спільні ресурси можуть безперешкодно розподіляти ресурси, щоб вченим було легше працювати разом у всьому світі для загального блага. Ми розробляємо роботу, яка триває вже довгий час, але здається, що зараз є багато мотивації об’єднати ці частини. 

Чи можете ви пояснити, що означатиме об’єднаний пошук для дослідників, які намагаються отримати доступ до даних, про які йдеться, наприклад, для полярних досліджень? Що зміниться? 

Карен: Зараз дослідникам доводиться їздити в різні місця, щоб знайти дані. А потім, знайшовши ці дані, ви витрачаєте час на гармонізацію їх структури, а потім двічі перевіряєте вміст, щоб переконатися, що ви розумієте семантичне значення виміряних змінних у даних. Це перша спроба зробити цей процес більш згуртованим і машинним. Наскільки мені відомо, це єдиний портал, який дозволяє користувачам шукати дані з обох полюсів одночасно. Зараз ми зосереджені на пошуку та виявленні наборів даних і внесенні в індекс більше сховищ. Ми очікуємо, що інфраструктура буде розвиватися, щоб підтримувати або використовуватимуть інші ініціативи, як-от Канадський консорціум із взаємодії з арктичними даними (CCADI), який створює покращені інструменти візуалізації та аналітики. Ми хочемо підтримувати наших партнерів, а не винаходити велосипед. 

Сьюзі: IPO прагне донести інформацію про всі види роботи, яку виконує Карен, і переконатися, що вона добре поширюється. Ми також працюємо над тим, щоб навчити всіх, проводячи семінари чи тренінги та створюючи можливості для участі. ITO проводить передову роботу разом з усіма цими різними групами. І IPO допомагає переконатися, що всі дізнаються, що відбувається, оскільки ми продовжуємо створювати ці чудові репозиторії.

Де ви бачите роботу над сховищами та даними сьогодні? І куди воно йде? Які нові виклики чи речі, про які людям доведеться думати в наступні п’ять-десять років? 

Девід: Є конкретні речі, які потрібно зробити. Одним із них є забезпечення безпеки наших сховищ учасників. Це важливий фактор для забезпечення цілісності даних, що лежить в основі всієї науки. Інший полягає в тому, що обсяги даних зросли настільки значно, що старі моделі переміщення даних туди, де ви могли б працювати з ними у високопродуктивному обчислювальному середовищі, тепер перевертаються. Тепер нам потрібно знайти способи аналізувати дані на місці, наближаючи комп'ютер до даних. Завдання полягає в тому, щоб допомогти репозиторіям WDS стати хмарними.  

Інша частина цього стосується потенціалу та компетенції робочої сили, наприклад, мобілізації науковців з даних, науковців із технічних досліджень та розпорядників даних. Це еволюційні ролі в науковому підприємстві, які необхідно ретельно контролювати, щоб забезпечити наявність відповідних компетенцій, а також щоб ми мали освіту та підготовку для зацікавлених людей. 

Карен: Багато людей працюють над компонентами, які дозволять дослідникам відмовитися від публікації статичних статей у журналах і натомість створювати відтворювану роботу, яка доступна в Інтернеті. Хтось може опублікувати частину даних або провести фрагмент аналізу, а потім записати це та опублікувати як тип легко повторно використовуваного пакета, який може бути використаний кимось іншим, щоб або відтворити ті самі результати, що важливо, щоб зробити твердження наукою, яку можна перевірити, або повторно використати її по-новому. Хтось може взяти пакет, підключити інший фрагмент даних або змінити параметр у частині програмного забезпечення для аналізу та створити новий результат, який він публікує. Таким чином, мова йде про атомізацію даних і програмних компонентів, щоб ви могли легко брати частини речей і публікувати їх. Відтворюваний документ допомагає вирішити проблеми з відтворюваністю результатів, повторним використанням даних і потенційною надмірністю досліджень. 

Ви бачите цю тенденцію в розробці програмного забезпечення, де є дезагрегація API (інтерфейсів програмного забезпечення) на серверній частині, щоб ви могли використовувати їх частини. У спільноті управління даними існує подібна ідея щодо цифрових об’єктів FAIR – ви більше не хочете публікувати весь цей набір даних, який можна завантажити, ви хочете надавати сервіс даних для кожного спостереження або вимірювання, і ви хочете, щоб ці вимірювальні машини були застосовними, тому що ви можете вибирати, які спостереження ви хочете використовувати, без додаткової обробки з вашого боку – дані мають бути представлені в найбільш доступній формі. 

Компоненти, як і дані, мають бути дезагреговані та розбиті та доступні як людям, так і машинам, де б вони не були поширені по всьому світу. З точки зору дослідника і технолога, все відбувається знизу вгору. Ваших розумів майже забагато, тому мова йде про те, як ви робите невеликі кроки, щоб зробити це значущим. Американський геофізичний союз (AGU), зокрема, зробив справді хорошу роботу, зосередившись на обчислювальних ноутбуках як перший крок, щоб побачити, як може статися відтворюваний папір. Це дійсно чудовий варіант використання того, що стане набагато складнішою інфраструктурою. 

Це дуже багато, і іноді важко зрозуміти, де саме зосередитися. Але, сподіваюся, це одна з цінних пропозицій, з якими IPO та ITO WDS можуть допомогти нашому членству. 

Як читачі можуть дізнатися більше про WDS і як вони можуть долучитися до вашої діяльності чи стати членами? 

Девід: Мередіт обдумувала це. Ми активізували наше періодичне спілкування з нашими учасниками та вдосконалюємо наш веб-сайт за допомогою більш регулярних оновлень, які триватимуть і надалі. Буде також цілий ряд інших заходів, коли IPO буде повністю укомплектовано персоналом, і після того, як буде опубліковано наш дворічний план дій. 

Мередіт: Окрім перезапуску наших соціальних мереж, ми зараз завершуємо та тестуємо оновлений веб-сайт. Майбутні ініціативи включають роз’яснювальні та освітні вебінари для наших сховищ членів WDS, партнерів та асоційованих організацій. Крім того, ми маємо інформаційний бюлетень для членів раз на два тижні, чутливі до часу повідомлення про можливості, надіслані членам електронною поштою, і ми з нетерпінням чекаємо створення щорічного звіту для організації, чого не було з 2015–2016 років. Цього року ми також одночасно запустимо премію WDS Data Stewardship та ITO Data Prize, щоб дати інженерам і вченим дві можливості показати свою досконалість із даними.


Зображення на NASA через Flickr.

ПЕРЕГЛЯНУТИ ВСІ ПОТУЖНІ ПУНКТИ

Перейти до вмісту