ما الذي يلوح في الأفق لخدمات البيانات العلمية؟ الأحدث من نظام البيانات العالمي

يشجع نظام البيانات العالمي الإشراف طويل الأجل - والوصول الشامل والعادل إلى - خدمات البيانات والبيانات العلمية المضمونة الجودة والمنتجات والمعلومات في جميع التخصصات.

ما الذي يلوح في الأفق لخدمات البيانات العلمية؟ الأحدث من نظام البيانات العالمي

كان العام الماضي فترة انتقالية ل نظام البيانات العالمي (WDS)، هيئة تابعة لمركز الدراسات الدولي.

انتقل مكتب البرنامج الدولي (IPO) إلى نوكسفيل ، تينيسي ، وتم تعيين ميريديث جوينز كمدير تنفيذي له. تم تعيين ثلاثة موظفين آخرين ، كما تضم ​​اللجنة العلمية للبرنامج العديد من الأعضاء الجدد.  

التقينا ديفيد كاسل ، رئيس اللجنة العلمية لـ WDS ؛ كارين باين ، مديرة مكتب التكنولوجيا العالمي WDS ؛ سوزي ألارد ، مديرة مركز دراسات المعلومات والاتصالات في جامعة تينيسي ، حيث يقع مقر WDS IPO الآن ، وميريديث جوينز ، لمعرفة المزيد. 

ما هو تأثير التغييرات الأخيرة على أنشطة WDS؟ 

ديفيد: هذه فترة تماسك وتركيز. قبل أربع أو خمس سنوات ، أنشأنا مكتب WDS الدولي للتكنولوجيا (ITO) في جامعة فيكتوريا ، في Ocean Networks Canada ، وهو منشأة بحثية رئيسية وعضو في WDS. قمنا بتعيين كارين لتكون المدير المساعد لـ ITO ، وهذا بدأنا في السير على طريق القدرة على توفير المزيد من الخدمات المتنوعة والحجم لعضويتنا. في العام الماضي ، انتقل الاكتتاب العام الأولي من طوكيو إلى تينيسي بدعم من جامعة تينيسي ومختبر أوك ريدج الوطني ، وكذلك من وزارة الطاقة (DOE).  

سوزي: يعمل المكتبان بشكل جيد للغاية معًا ، والدعم الذي يمكننا تقديمه للأعضاء أكبر لأن الأنشطة يتم تنسيقها عن كثب. هذا يعطينا إمكانات كبيرة للمستقبل. 

ديفيد: حوالي نصف العضوية في اللجنة العلمية قد تغيرت أيضًا في العام الماضي. لقد أضفنا بعض الأفراد الرئيسيين الجدد للانضمام إلى الأعضاء العائدين ، وجميعهم موجودون في عالم مستودعات البيانات. على مدى السنوات القليلة الماضية ، وضعنا WDS على أساس متين يمكننا من خلاله إطلاق نشاط برمجي ، وتحقيق التوافق مع خطط عمل مركز الدراسات الدولي.

نحاول أن نفهم أين توجد المستودعات والبيانات الآن وأين ستذهب في الفترة القادمة. يتضمن ذلك طرح أسئلة حول مصدر البيانات ، وكيفية إدارتها ، وكيف يتم الحفاظ عليها آمنة. نحن نعمل على الجوانب الفنية ذات الصلة مثل كائنات بيانات FAIR ، بالشراكة مع CODATA ، وكيفية العمل معًا لتحقيق المعايير وتوقعات التشغيل البيني لتلك. 

نحن نواجه أيضًا تحديًا لا يتم ذكره دائمًا: هناك اعتقاد وتوقع أنه بمجرد أن تصبح الأشياء متاحة عبر الإنترنت ، فإنها ستستمر مجانًا. وهذا بالطبع ليس صحيحا. لتلبية التوقعات بأن البيانات ستكون مفتوحة ويمكن الوصول إليها إلى أقصى حد ممكن ، نحتاج إلى إجراء محادثات صريحة حول مصدر الموارد. هذه مشكلة لأعضائنا ، والأولوية الرئيسية بالنسبة لنا هي كيفية تحديد القيمة الهائلة التي تجلبها المستودعات على الصعيدين الوطني والدولي بطريقة تساعد المستودعات على التعامل مع الممولين الذين يمكنهم دعم الخطط المستدامة لإتاحة هذه البيانات.  

أولوية رئيسية أخرى هي جعل عضويتنا أكثر تمثيلا على الصعيد العالمي. تتكون عضوية WDS في الغالب من شمال العالم ، ومن المنطقي بالنسبة لنا التعاون مع مركز الدراسات الدولي و CODATA لتقييم الأنشطة في إفريقيا وأمريكا اللاتينية والجنوبية وجنوب شرق آسيا وربما تحديد أعضاء جدد لـ WDS. نحن نعمل أيضًا مع مجموعات أخرى تقدم خدمات البيانات بطرق مختلفة عن الحفاظ على المستودع.  

ميريديث: هناك طريقة أخرى نجعل بها عضويتنا تمثيلية وهي تحديد المستودعات من مجموعة متنوعة من المجالات ، بالإضافة إلى العلوم البيولوجية والأرضية ، لزيادة تنوع أعضائنا. تعتبر مستودعات العلوم الاجتماعية والإنسانيات الرقمية ذات قيمة مثل العلوم الطبيعية. من خلال زيادة تنوع عضويتنا ، يمكننا زيادة دعمنا لجميع أنواع المستودعات.  

كارين: لدينا دفعة كبيرة على بعض الخدمات الفيدرالية. على سبيل المثال ، بالنسبة للبحث القطبي ، لدينا فرصة لإتاحة البيانات من كلا القطبين للباحثين بطريقة متوافقة تمامًا ، وهو أمر مثير للغاية: إنه شيء يعمل المجتمع من أجله لفترة طويلة ويسعدنا أن نكون كذلك. جزءا منه. 

تأتي الخدمات الموحدة للبيانات القطبية في جزأين: البحث الموحد ، الذي استمر لفترة طويلة مع حصاد البيانات الوصفية التقليدي ، ومجموعة جديدة من البروتوكولات والعمليات الخاصة بحصاد البيانات الوصفية التي تكون أكثر توجهاً نحو الويب. إنها ليست كتالوج تقليدي للخدمات ، بل إنها تتماشى مع ما قد تجده لبحث Google. تسمح لنا البنية التحتية التي أنشأناها بإرسال برامج الزحف لفهرسة الصفحات المقصودة لمستودعات البيانات التي طبقت نوعًا معينًا من الترميز على صفحات البيانات الوصفية المقصودة. نحن نوفر القدرة للباحثين على البحث عن البيانات من كل من القطب الشمالي والقطب الجنوبي ، ونعمل مع مجتمعات البحث للتأكد من أن الأنطولوجيات التي ينفذونها (الترميز) متوافقة أيضًا. 

إن تأمين التمويل لهذا النوع من العمل أمر صعب حقًا. إنه مشروع دولي ، لذلك هناك الكثير من المحادثات حول التمويل في مجالات مختلفة. هنا في كندا ، يبحثون في نماذج تمويل مختلفة ، للاستثمارات الوطنية وأيضًا حتى يكونوا جزءًا من مجموعة تعاونية عالمية من الممولين. على سبيل المثال ، أحد النماذج التي يقومون بمراجعتها هو التحالف العالمي للبيانات الحيوية المصمم لتنسيق التمويل العالمي للموارد الرئيسية في علوم الحياة. 

لدينا أيضًا مجموعة عمل داخل Research Data Alliance تبحث في ما نسميه Global Open Research Commons. هناك العديد من المنظمات الوطنية وعبر الوطنية والمجالات المحددة التي تحاول تنظيم الوصول وإمكانية التشغيل البيني إلى الموارد مثل مجموعات البيانات والبرامج والموارد الحسابية. على المستوى الوطني ، من المنطقي أن يكون لديك هيكل حوكمة جيد وخارطة طريق لجميع استثماراتهم البحثية ، لذلك ترى منظمات مثل Australian Research Data Commons أو البنية التحتية اليابانية منسقة في المعهد الوطني للمعلوماتية. على الصعيد الوطني ، ترى مشاريع طموحة مثل سحابة العلوم الأوروبية المفتوحة ومنصة العلوم الأفريقية المفتوحة. والمجالات مثل تحالف المرصد الافتراضي الدولي الذي يخدم علماء الفلك على مستوى العالم كلها مهمة جدًا لدعم مجتمعات البحث الخاصة بهم. الهدف من مجموعة RDA هو إنشاء خارطة طريق لكيفية مشاركة هذه المشاعات في الموارد بسلاسة بحيث يسهل على العلماء العمل معًا عالميًا من أجل الصالح العام. نحن نبني على العمل الذي كان مستمرًا منذ فترة طويلة ، ولكن يبدو الأمر كما لو أن هناك الكثير من الدوافع لجمع هذه القطع معًا الآن. 

هل يمكنك شرح ما سيعنيه البحث الفيدرالي للباحثين الذين يحاولون الوصول إلى البيانات المعنية ، على سبيل المثال للبحث القطبي؟ ماذا سيتغير؟ 

كارين: يتعين على الباحثين الآن الذهاب إلى مواقع مختلفة للعثور على البيانات. وبعد ذلك بمجرد العثور على تلك البيانات ، فإنك تقضي وقتًا في تنسيق هيكلها ، ثم تحقق مرة أخرى من المحتوى للتأكد من أنك تفهم معنى المعنى الدلالي للمتغيرات المقاسة في البيانات. هذه هي المحاولة الأولى لجعل هذه العملية أكثر تماسكًا وقابلية للتنفيذ على الآلة. على حد علمي ، هذه هي البوابة الوحيدة التي تتيح للمستخدمين البحث عن البيانات من كلا القطبين في وقت واحد. في الوقت الحالي ، نركز على البحث عن مجموعات البيانات واكتشافها وجلب المزيد من المستودعات إلى الفهرس. نتوقع أن تتطور البنية التحتية لدعم أو تغذية المبادرات الأخرى ، مثل الاتحاد الكندي لقابلية التشغيل البيني لبيانات القطب الشمالي (CCADI) الذي يبني أدوات تحليلية وتصور محسّنة. نريد دعم شركائنا ، وليس إعادة اختراع العجلة. 

سوزي: يلتزم الاكتتاب العام بنشر الخبر حول جميع أنواع الأعمال التي تقوم بها كارين والتأكد من نشرها بشكل جيد. نحن نعمل أيضًا على جعل الجميع على اطلاع دائم من خلال استضافة ورش عمل أو دورات تدريبية وخلق فرص للأشخاص للمشاركة. يقوم ITO بعمل متطور مع كل هذه المجموعات المختلفة. ويساعد الاكتتاب العام في التأكد من أن الجميع يعلم ما يحدث بينما نواصل بناء هذه المستودعات العظيمة.

أين ترى العمل على المستودعات والبيانات اليوم؟ وإلى أين تتجه؟ ما هي التحديات أو الأشياء الجديدة التي سيحتاج الناس إلى التفكير فيها في السنوات الخمس إلى العشر القادمة؟ 

ديفيد: هناك أشياء ملموسة يجب القيام بها. أحدها هو التأكد من أن مستودعات أعضائنا آمنة. هذا عامل حاسم في القدرة على ضمان سلامة البيانات ، والتي تدعم كل العلوم. والشيء الآخر هو أن أحجام البيانات قد نمت بشكل كبير لدرجة أن النماذج القديمة لنقل البيانات إلى حيث ستعمل معها بالفعل في بيئة حوسبة عالية الأداء ، يتم قلبها الآن. إنها الحالة الآن التي نحتاج فيها إلى إيجاد طرق لنكون قادرين على تحليل البيانات فى الموقع، وجلب الكمبيوتر إلى البيانات. يتمثل التحدي في مساعدة مستودعات WDS على تمكين السحابة.  

يتعلق الجزء الآخر من هذا بقدرة القوى العاملة وكفاءاتهم ، مثل تعبئة علماء البيانات وعلماء البحوث التقنية ومسؤولي البيانات. هذه أدوار متطورة داخل المؤسسة العلمية تحتاج إلى مراقبتها بعناية للتأكد من وجود الكفاءات المناسبة ، وأن لدينا التعليم والتدريب الذي نوفره للأشخاص المهتمين. 

كارين: يعمل الكثير من الأشخاص على مكونات من شأنها أن تسمح للباحثين بالابتعاد عن نشر الأوراق البحثية الثابتة في المجلات ، وبدلاً من ذلك يقومون بإنشاء ورقة قابلة للاستنساخ ومتاحة عبر الإنترنت. يمكن لأي شخص نشر جزء من البيانات أو إجراء جزء من التحليل ، ثم كتابته ونشره كنوع من الحزم التي يمكن إعادة استخدامها بسهولة والتي يمكن أن يتخذها شخص آخر إما لإعادة إنتاج نفس النتائج ، وهو أمر مهم لعمل التأكيدات يمكن التحقق منه أو إعادة استخدامه بطريقة جديدة. يمكن لأي شخص أن يأخذ الحزمة ، أو يقوم بتوصيل جزء مختلف من البيانات ، أو تغيير معلمة في جزء من برنامج التحليل وإنشاء نتيجة جديدة ينشرها. لذلك يتعلق الأمر بتفتيت البيانات ومكونات البرامج ، بحيث يمكنك أخذ أجزاء صغيرة من الأشياء ونشرها بسهولة. تساعد الورقة القابلة للتكرار في حل المشكلات المتعلقة بإمكانية تكرار النتائج وإعادة استخدام البيانات واحتمالية التكرار في البحث. 

ترى هذا الاتجاه في تطوير البرامج ، حيث يوجد تفصيل لواجهات برمجة التطبيقات (واجهات برمجة التطبيقات) في النهاية الخلفية ، بحيث يمكنك استخدام أجزاء منها. داخل مجتمع إدارة البيانات ، توجد فكرة مماثلة حول الكائنات الرقمية FAIR - فأنت لا تريد نشر مجموعة البيانات الكاملة القابلة للتنزيل بعد الآن ، فأنت تريد تقديم خدمة بيانات لكل ملاحظة أو قياس وتريد جعل هذه القياسات قابلة للتنفيذ ، لذلك أنه يمكنك انتقاء واختيار الملاحظات التي تريد استخدامها دون الكثير من المعالجة من جانبك - يجب تقديم البيانات في شكل يسهل الوصول إليه. 

المكونات ، مثل البيانات ، تحتاج إلى أن تكون مصنفة ومجزأة ويمكن الوصول إليها من قبل كل من البشر والآلات أينما تم توزيعها في جميع أنحاء العالم. من وجهة نظر الباحث والتقني ، كل هذا يحدث من الأسفل إلى الأعلى. يكاد يكون هناك الكثير لتفكيرك ، لذا يصبح الأمر متعلقًا بكيفية إحراز القليل من الاختراقات لجعلها ذات مغزى. قام الاتحاد الجيوفيزيائي الأمريكي (AGU) ، على وجه الخصوص ، بعمل جيد حقًا في التركيز على الدفاتر الحسابية كخطوة أولى لمعرفة كيف يمكن أن تحدث ورقة قابلة للاستنساخ. إنها حقًا حالة استخدام رائعة لما سيصبح بنى تحتية أكثر تعقيدًا. 

إنها مهمة كثيرة ، وفي بعض الأحيان يكون من الصعب أن تعرف بالضبط أين تضع تركيزك. ولكن نأمل أن يكون هذا أحد عروض القيمة التي يمكن أن تساعد فيها WDS IPO و ITO عضويتنا. 

كيف يمكن للقراء معرفة المزيد عن WDS وكيف يمكنهم المشاركة في أنشطتك أو أن يصبحوا أعضاء؟ 

ديفيد: لقد كانت ميريديث تفكر في ذلك من خلال. لقد عززنا اتصالاتنا الدورية مع أعضائنا ونعمل على تحسين موقعنا الإلكتروني بمزيد من التحديثات المنتظمة ، والتي ستستمر. سيكون هناك أيضًا مجموعة كاملة من الأنشطة الأخرى حيث يتم تزويد الاكتتاب العام بالموظفين بالكامل ، وبمجرد نشر خطة العمل التي تبلغ عامين. 

ميريديث: بالإضافة إلى إعادة إطلاق وسائل التواصل الاجتماعي الخاصة بنا ، نقوم حاليًا بوضع اللمسات الأخيرة واختبار موقع إلكتروني معاد تصميمه. تشمل المبادرات المستقبلية التوعية والندوات التعليمية عبر الإنترنت لمستودعات أعضاء WDS والشركاء والمنظمات المرتبطة بها. بالإضافة إلى ذلك ، لدينا نشرة إخبارية نصف شهرية للأعضاء ، والاتصالات الحساسة للوقت حول الفرص المرسلة عبر البريد الإلكتروني إلى الأعضاء ، ونتطلع إلى إنشاء تقرير سنوي للمؤسسة ، وهو أمر لم يحدث منذ 2015-2016. سنشارك أيضًا في إطلاق جائزة WDS Data Stewardship وجائزة ITO Data Prize في نفس الوقت من هذا العام لمنح المهندسين والعلماء في بداية حياتهم المهنية فرصتين لإظهار تفوقهم في استخدام البيانات.


الصورة عن طريق ناسا عبر فليكر.

عرض كل العناصر ذات الصلة

انتقل إلى المحتوى