ユーザー登録

科学データサービスの展望は? 世界データシステムからの最新

世界データシステムは、すべての分野にわたる品質が保証された科学データとデータサービス、製品、および情報の長期的な管理と、普遍的かつ公平なアクセスを促進します。

昨年は、 世界データシステム(WDS)、ISC関連団体。

国際プログラムオフィス(IPO)はテネシー州ノックスビルに移転し、メレディスゴインズが常務理事に任命されました。 他にXNUMX人のスタッフが採用され、プログラムの科学委員会にも数人の新しいメンバーが加わりました。  

WDS科学委員会の委員長であるDavidCastleに追いつきました。 カレン・ペイン、WDS国際技術局長。 詳細については、WDSIPOが現在拠点を置いているテネシー大学の情報通信研究センターのディレクターであるSuzieAllardとMeredithGoinsがいます。 

WDS活動の最近の変更の影響はどのようなものでしたか? 

David:これは統合と集中の期間です。 XNUMX、XNUMX年前、私たちはビクトリア大学のオーシャンネットワークスカナダにWDSインターナショナルテクノロジーオフィス(ITO)を設立しました。これは、主要な研究施設であり、WDSのメンバーです。 私たちはカレンをITOのアソシエイトディレクターに採用しました。それにより、メンバーシップにより多くのボリュームと多様なサービスを提供できるようになりました。 昨年、IPOはテネシー大学とオークリッジ国立研究所、およびエネルギー省(DOE)の支援を受けて、東京からテネシーに移転しました。  

スージー:XNUMXつのオフィスは非常にうまく連携しており、活動が非常に緊密に調整されているため、メンバーに提供できるサポートはさらに大きくなります。 それは私たちに将来の大きな可能性を与えてくれます。 

David:昨年、科学委員会のメンバーの約半分も変更されました。 リピーターに参加するために、いくつかの重要な新しい個人を追加しました。これらのメンバーはすべて、データリポジトリの世界に閉じ込められています。 過去数年にわたって、私たちはWDSを確固たる基盤に置き、そこからプログラム活動を開始し、ISCアクションプランとの整合性を実現することができます。

私たちは、リポジトリとデータが現在どこにあり、今後の期間にどこに行くのかを理解しようとしています。 これには、データの出所、データの管理方法、およびデータの安全性に関する質問の提起が含まれます。 私たちは、CODATAと協力して、FAIRデータオブジェクトなどの関連する技術的側面に取り組んでおり、それらに標準と相互運用性の期待をもたらすために協力する方法を検討しています。 

また、常に言及されるとは限らない課題にも直面しています。物事がオンラインになり、利用可能になると、無料で存続するという信念と期待があります。 もちろん、これは真実ではありません。 データがオープンで可能な限りアクセス可能であるという期待に応えるには、リソースがどこから来るのかについて率直に話し合う必要があります。 これは私たちのメンバーにとっての問題であり、私たちの主要な優先事項は、リポジトリがそのデータを利用可能にするための持続可能な計画をサポートできる資金提供者と関わりを持つのに役立つ方法で、リポジトリが国内および国際的にもたらす途方もない価値をどのように定義するかです。  

もうXNUMXつの主要な優先事項は、メンバーシップをよりグローバルに代表するものにすることです。 WDSのメンバーシップは主に南北問題であり、ISCおよびCODATAと協力して、アフリカ、ラテンアメリカ、南アメリカ、東南アジアでの活動をストックし、WDSの新しいメンバーを特定することは理にかなっています。 また、リポジトリを維持するのとは異なるモダリティでデータサービスを提供している他のグループとも協力しています。  

メレディス:メンバーシップをより代表的なものにするもうXNUMXつの方法は、生物科学や地球科学に加えて、さまざまな分野のリポジトリを特定して、メンバーの多様性を高めることです。 社会科学とデジタルヒューマニティーズのリポジトリは、自然科学と同じくらい価値があります。 メンバーシップの多様性を高めることで、あらゆる種類のリポジトリのサポートを増やすことができます。  

カレン:私たちはいくつかの連合サービスを大いに推進しています。 たとえば、極地研究では、両方の極からのデータを完全に調整された方法で研究者が利用できるようにする機会があります。これは非常にエキサイティングです。これは、コミュニティが長い間取り組んできたものであり、私たちは喜んでいます。その一部です。 

極座標データのフェデレーションサービスは、従来のメタデータハーベスティングで長い間行われてきたフェデレーション検索と、よりWeb指向のメタデータをハーベスティングするための新しいプロトコルとプロセスのXNUMXつの部分に分かれています。 これは、従来のサービスのカタログではなく、Google検索で見つかるものに沿ったものです。 私たちが構築したインフラストラクチャにより、クローラーを送信して、メタデータランディングページに特定のタイプのマークアップを実装したデータリポジトリのランディングページにインデックスを付けることができます。 私たちは、研究者が北極と南極の両方からデータを検索する機能を提供し、研究コミュニティと協力して、彼らが実装するオントロジー(マークアップ)もすべて整合していることを確認します。 

その種の仕事のための資金を確保することは本当にトリッキーです。 これは国際的なプロジェクトであるため、さまざまな分野での資金調達について多くの議論があります。 ここカナダでは、国の投資と、グローバルな協同組合の資金提供者の一部となるために、さまざまな資金調達モデルを検討しています。 たとえば、彼らがレビューしているモデルのXNUMXつは、ライフサイエンスの主要なリソースに対するグローバルな資金調達を調整するように設計されたGlobalBiodataCoalitionです。 

また、リサーチデータアライアンス内に、グローバルオープンリサーチコモンズと呼ばれるものを検討するワーキンググループがあります。 データセット、ソフトウェア、計算リソースなどのリソースへのアクセスと相互運用性を調整しようとしているさまざまな国、汎国、およびドメイン固有の組織があります。 国家レベルでは、すべての研究投資に対して優れたガバナンス構造とロードマップを用意することは理にかなっています。そのため、オーストラリア国立情報学研究所で調整されたオーストラリア国立データコモンズや日本のインフラストラクチャなどの組織を見ることができます。 全国的には、European OpenScienceCloudやAfricanOpenSciencePlatformなどの野心的なプロジェクトが見られます。 そして、世界中の天文学者にサービスを提供する国際仮想天文台アライアンスのようなドメインはすべて、それぞれの研究コミュニティをサポートするために非常に重要です。 RDAグループの目標は、これらのコモンズがどのようにリソースをシームレスに共有できるかについてのロードマップを作成し、科学者がより大きな利益のためにグローバルに協力することを容易にすることです。 長い間取り組んできた作品をベースにしていますが、今はこれらをひとつにまとめるモチベーションが高い気がします。 

極地研究など、問題のデータにアクセスしようとしている研究者にとって、横断検索が何を意味するのか説明できますか? 何が変わりますか? 

カレン:今のところ、研究者はデータを見つけるためにさまざまな場所に行く必要があります。 そして、そのデータを見つけたら、その構造を調和させ、コンテンツを再確認して、データ内の測定された変数の意味が何であるかを理解していることを確認します。 これは、そのプロセスをよりまとまりのある、機械で実行可能なものにする最初の試みです。 私の知る限り、これはユーザーが両方の極から同時にデータを検索できる唯一のポータルです。 現在、データセットの検索と発見、およびより多くのリポジトリをインデックスに取り込むことに重点を置いています。 インフラストラクチャは、強化された視覚化および分析ツールを構築している北極圏データ相互運用性のためのカナダコンソーシアム(CCADI)などの他のイニシアチブをサポートまたはフィードするように進化すると予想されます。 私たちは、車輪の再発明ではなく、パートナーをサポートしたいと考えています。 

スージー:IPOは、カレンが行っているあらゆる種類の仕事について情報を発信し、それが十分に普及していることを確認することに取り組んでいます。 また、ワークショップやトレーニングを主催し、人々が参加する機会を作ることで、すべての人のスピードを上げるために取り組んでいます。 ITOは、これらすべての異なるグループと協力して最先端の作業を行っています。 そしてIPOは、私たちがこれらの優れたリポジトリを構築し続けている間、誰もが何が起こっているのかを確実に学ぶのを助けています。

今日、リポジトリとデータに関する作業はどこで見られますか? そして、それはどこに行くのですか? 今後XNUMX年からXNUMX年で人々が考える必要のある新しい課題や事柄は何ですか? 

David:やらなければならない具体的なことがあります。 それらのXNUMXつは、メンバーリポジトリの安全を確保することです。 これは、すべての科学を支えるデータの整合性を確保できるようにするための重要な要素です。 もうXNUMXつは、データの量が大幅に増加したため、高性能コンピューティング環境で実際にデータを操作する場所にデータを移動する古いモデルが反転していることです。 今では、データを分析できる方法を見つける必要があります 現場の、コンピュータをデータに移動します。 課題は、WDSリポジトリがクラウド対応になるのを支援することです。  

これの他の部分は、データサイエンティスト、技術研究サイエンティスト、データスチュワードの動員など、労働力の能力と能力に関するものです。 これらは科学企業内で進化している役割であり、適切な能力が整っていることを確認するために注意深く監視する必要があり、関心のある人々に提供するための教育とトレーニングがあります。 

カレン:多くの人々が、研究者がジャーナルでの静的な論文の出版から離れ、代わりにオンラインで利用できる再現可能な論文を作成できるようにするコンポーネントに取り組んでいます。 誰かがデータを公開したり、分析を行ったりして、それを書き留めて、他の誰かが同じ結果を再現するために利用できる、再利用しやすいパッケージの一種として公開することができます。これは、アサーションを作成するために重要です。科学の検証可能、または新しい方法でそれを再利用する。 誰かがパッケージを受け取ったり、別のデータをプラグインしたり、分析ソフトウェアのパラメーターを変更して、公開する新しい結果を作成したりする可能性があります。 つまり、データとソフトウェアコンポーネントを細分化して、簡単に公開できるようにすることです。 再現性のある論文は、結果の再現性、データの再利用、および研究の冗長性の可能性に関する問題の解決に役立ちます。 

ソフトウェア開発の傾向は、バックエンドでAPI(Application Programming Interfaces)が分解され、その一部を使用できるようになっていることがわかります。 データ管理コミュニティ内では、FAIRデジタルオブジェクトについても同様の考えがあります。このダウンロード可能なデータセット全体を公開する必要はなく、すべての観測または測定にデータサービスを提供し、それらの測定を実行可能にしたいので、自分の側で多くの処理を行うことなく、使用する観測を選択できます。データは最もアクセスしやすい形式で表示する必要があります。 

データのようなコンポーネントは、世界中に分散している場所ならどこでも、人間と機械の両方が分解して原子化し、アクセスできるようにする必要があります。 研究者と技術者の観点からは、それはすべてボトムアップで起こっています。 頭を悩ませるにはほとんど多すぎるので、それを意味のあるものにするために、どのように少し侵入するかが重要になります。 特に、アメリカ地球物理学連合(AGU)は、再現可能な紙がどのように発生するかを確認するための最初のステップとして、計算ノートブックに焦点を当てるという非常に優れた仕事をしました。 これは、はるかに複雑なインフラストラクチャになるものの非常に優れたユースケースです。 

取り組むことはたくさんあり、どこに焦点を合わせるかを正確に知るのは難しい場合があります。 しかし、それがWDSIPOとITOが私たちのメンバーシップを支援できる価値提案のXNUMXつであることを願っています。 

読者はどのようにしてWDSについてもっと知り、どのようにしてあなたの活動に参加したり、メンバーになったりすることができますか? 

David:メレディスはこれを考え抜いてきました。 メンバーとの定期的なコミュニケーションを強化し、より定期的な更新でWebサイトを改善しており、今後も継続していきます。 IPOが完全に人員を配置し、XNUMX年間の行動計画が発表されると、他にもさまざまな活動が行われます。 

メレディス:ソーシャルメディアのリニューアルに加えて、現在、再設計されたWebサイトを完成させてテストしています。 今後のイニシアチブには、WDSメンバーのリポジトリ、パートナー、および関連組織向けのアウトリーチおよび教育ウェビナーが含まれます。 さらに、メンバー向けの隔週のニュースレター、メンバーに電子メールで送信される機会についての時間に敏感なコミュニケーションがあり、2015年から2016年まで発生していない組織の年次報告書を作成することを楽しみにしています。 また、今年はWDSデータスチュワードシップ賞とITOデータ賞を同時に発表し、初期のキャリアエンジニアと科学者にデータの卓越性を示すXNUMXつの機会を提供します。


による画像 Flickr経由のNASA.

コンテンツにスキップ