تنفيذ مبادئ بيانات FAIR - ما وراء الاختصار؟

تحدثنا إلى Simon Hodson ، المدير التنفيذي للجنة البيانات ISC (CODATA) لمعرفة المزيد.

تنفيذ مبادئ بيانات FAIR - ما وراء الاختصار؟

البيانات التي يقوم عليها البحث العلمي هي التي تغذي التقدم في الفهم العلمي. تحتوي مجموعات البيانات هذه على أدلة حيوية للعديد من الأسئلة الأكثر إلحاحًا التي تواجه العلماء اليوم ، ويمكن أن تلقي ضوءًا جديدًا على النتائج السابقة - إما التحقق من صحة السجل العلمي الحالي أو إبطاله ، وفتح إمكانيات للبحث الجديد والفهم الجديد. ومع ذلك ، غالبًا ما يختفي هذا النوع من المعلومات أثناء عملية نشر النتائج العلمية ، إما بسبب عدم مشاركة البيانات ، أو عدم إتاحتها بتنسيق يسهل الوصول إليه والاستفسار عنه.

في العلم ، يتم نشر الكثير من الأعمال الرائعة كمستندات PDF. تعد القدرة على طباعة وقراءة مقالة أمرًا رائعًا للبشر ، ولكن الكثير من المعلومات التي تم إدخالها في إنشاء ما تم الإبلاغ عنه في ملف PDF ينتهي بها الأمر مخفيًا بعيدًا. إذا أردنا الحصول على عرض كبير للصورة ، وإلقاء نظرة على جميع التجارب التي تم إجراؤها والتي تم الإبلاغ عنها في الأدبيات المتعلقة بعملية أو رد فعل معين ، فمن الصعب جدًا بالنسبة لنا استخراج كل هذه المعلومات من جميع ملفات PDF هذه. ، يشرح سيمون هودسون ، المدير التنفيذي لـ ISC-CODATA.

على حد تعبير الكيميائي Peter Murray-Rust ، فإن الحصول على معلومات مفيدة من ملفات PDF يمكن أن يكون مثل "إعادة بناء بقرة من برجر لحم بقري".

مرر دونك عبر فليكر.

هناك ثروة من البيانات العلمية التي تم إنتاجها على مدار سنوات عديدة من البحث ، ولكن في كثير من الحالات ، هذا غير ممكن - وبالتأكيد ليس بالأمر السهل - للعثور على تلك البيانات والاستعلام عنها لمقارنتها بالنتائج الأخرى أو العمل الجاري. في مواجهة هذا اللغز ، وتماشيًا مع ضرورة العلم المفتوح ، يعمل الباحثون حاليًا على زيادة تمكين العلم المستند إلى البيانات من خلال أطر عمل تدعم إمكانية الوصول إلى البيانات وقابلية التشغيل البيني لها.

واحدة من أحدث وأبرز الطرق للقيام بذلك هي FAIR ، والتي تلخص البيانات التي يجب أن تكون حتى تكون قابلة للاستخدام وقيمة قدر الإمكان: بيانات FAIR هي البيانات التي Fغير قابل للإصلاح. Aسيسيل. Interoperable و Rصالح للاستخدام الإلكتروني.

"يمكن العثور عليه" يعني أن البيانات العلمية التي يتم نشرها كجزء من الأدلة الداعمة للنتائج العلمية ، أو التي تم إنتاجها كنتيجة لبحوث ممولة من القطاع العام ، يجب أن تكون متاحة للآخرين للعثور عليها واستخدامها. يجب أن تحتوي البيانات على معرف دائم لا لبس فيه ، بالإضافة إلى بيانات وصفية غنية بما يكفي لتمكين الاكتشاف.

يقول سايمون هودسون: "هناك أسباب وجيهة لحماية بعض البيانات ، ولكن في حالة عدم تطبيق هذه الاعتبارات ، فإن مبادئ FAIR تعني أنه يجب أن تكون قادرًا على الوصول إلى البيانات عبر الويب ، ربما بإذن إذا كانت هناك مشكلات أمنية . بشكل حاسم ، تؤكد مبادئ FAIR أن العلماء يجب أن يكونوا قادرين على الوصول إلى بيانات البحث برمجيًا ، أي من خلال أجهزتهم أيضًا. لا يقتصر الأمر على مجرد الحصول على البيانات وتنزيلها: يجب أن تكون قادرًا بشكل مثالي على الاستعلام عنها باستخدام رمز الكمبيوتر ".

يشير i في FAIR إلى "قابلية التشغيل البيني" - مما يعني أنه يمكنك دمج البيانات من مصادر مختلفة: وهذا يعتمد إلى حد كبير على وجود معايير للبيانات الوصفية والمصطلحات أو المفردات المتفق عليها. على سبيل المثال ، البيانات الوصفية لمسح اجتماعي من بلد معين تشرح بوضوح الفئات العمرية أو الفئات الاجتماعية والاقتصادية التي تم استخدامها ، وأين تكمن حدود الفئة ، بحيث يمكن مقارنة البيانات بسهولة مع البيانات من المسح الاجتماعي في دولة مختلفة.

R تعني قابلية إعادة الاستخدام: وهذا يشمل الحصول على ترخيص يسمح للأشخاص بإعادة استخدام البيانات ويوضح بوضوح الشروط على أي إعادة استخدام. وهذا يعني أيضًا الحصول على معلومات حول مصدر البيانات (على سبيل المثال ، كيف تم جمعها ، وما التعديلات أو المعايرة التي تم استخدامها ، وما هي المعالجة الإضافية والتنظيف التي خضعت لها البيانات وما إلى ذلك) حتى يتمكن الباحثون من فهم النقاط القوية المحتملة وقيود البيانات واستخدامها بثقة.

بيانات FAIR هي أيضًا "جاهزة تمامًا للذكاء الاصطناعي". من أجل استخدام التعلم الآلي لتحديد الأنماط والبدء في توقع النتائج عبر مجموعات البيانات المختلفة ، من الضروري أن يكون لديك تعريفات للمتغيرات المختلفة في مجموعة البيانات ، ويجب أن تكون التعريفات سهلة الوصول.

"عندما تكون البيانات والخدمات ذات الصلة عادلة ، يتم وصف كل شيء بحيث يعرف الكمبيوتر - وأي شخص يستخدم الكود - التعريف الذي تم استخدامه للمفهوم والمتغير ذي الصلة ، والطريقة التي تم بها الحصول على القياسات ، و قيم نفسها. ثم يمكننا التفاعل مع كود البيانات ، وربما تفكيكه ، وأخذ مجموعة فرعية ، ودمجها مع البيانات الأخرى. يقول سايمون هودسون: "إذا كانت البيانات عادلة ، فيمكن القيام بذلك بكفاءة أكبر بكثير ، كما أن التحليل والبحث بحد ذاته يفيد".

إن فكرة وجود مفردات موحدة للتعبير عن المفاهيم الأساسية في مختلف مجالات العلم ليست جديدة بأي حال من الأحوال. ال الاتحاد الدولي للكيمياء البحتة والتطبيقية (IUPAC)، وهي عضو في مركز الدراسات الدولي ، تستجيب للحاجة إلى توحيد المعايير الدولية في الكيمياء منذ تأسيسها في عام 1919. واليوم ، من الضروري تكييف المفردات القياسية مع العصر الرقمي وتصنيعها هي نفسها FAIR. نتيجة لورشة عمل نظمت بمبادرة توثيق البيانات ، نشرت مجموعة بقيادة سيمون كوكس (عضو سابق في اللجنة التنفيذية لكوداتا وخبير في استخدام المصطلحات) 'عشر قواعد بسيطة لعمل عادلة للمفردات'.

باتباع هذه الإرشادات ، تعمل CODATA حاليًا على مفردات FAIR لـ ملفات تعريف معلومات المخاطر تم نشره بواسطة مركز الدراسات الدولي في أكتوبر 2021. سيؤدي هذا إلى إنشاء مصطلحات على شبكة الإنترنت لجميع المخاطر الموضحة ، والتي سيتم توفيرها على GitHub وعبر خدمة Research Vocabularies Australia ، ليستخدمها أي شخص. وهذا يعني أن الحكومات التي تطور استراتيجياتها وإجراءاتها بشأن الحد من المخاطر وإدارتها ستكون قادرة على مقارنة البيانات بسرعة بإحصاءاتها الخاصة بشأن خسائر الكوارث أو أطر إعداد التقارير ، على سبيل المثال.

تعمل CODATA أيضًا على مفردات FAIR مع العديد من أعضاء ISC المختلفين ، مثل الاتحاد الدولي للدراسات العلمية للسكان (IUSSP). الديموغرافيا مجال غني بالبيانات ، وهو وثيق الصلة بفهم التنمية البشرية المستدامة. من خلال جعل المصطلحات الرئيسية في FAIR لعلوم السكان ، ستساهم IUSSP في جعل البيانات الديموغرافية أكثر فائدة للوكالات الإحصائية وعلماء الاجتماع ، وكذلك أولئك الذين يستخدمون هذه البيانات في العديد من مجالات الدراسة التي تستخدم بيانات السكان ، بما في ذلك معظم المجالات المتعلقة بالمستدامة أهداف التنمية (SDGs).

سوف تقوم CODATA أيضًا بعمل مماثل مع IUPAC كجزء من مشروع جديد مدته سنتان 'معرض دولي: التعاون العالمي بشأن سياسة وممارسات بيانات FAIR'، بتمويل من المفوضية الأوروبية من خلال برنامج Horizon Europe Framework. منسقة بواسطة كوداتا، مع بحوث البيانات التحالف بصفتها شريكًا رئيسيًا ، سيعمل مشروع WorldFAIR مع مجموعة من أحد عشر مجالًا ودراسات حالة عبر المجالات لتعزيز تنفيذ مبادئ بيانات FAIR ، ولا سيما تلك الخاصة بقابلية التشغيل البيني ، ووضع مجموعة من التوصيات وإطار عمل لـ FAIR التقييم في مجموعة من التخصصات ، أو مجالات البحث متعددة التخصصات. ستشكل WorldFAIR جوهر مساهمة CODATA في مشروع ISC جعل البيانات تعمل لمواجهة التحديات الكبرى عبر المجالات.

يقود IUPAC دراسة حالة الكيمياء ، حيث يبحث في كيفية جعل أصول المعلومات والمصطلحات التي يرعاها IUPAC مناسبة لعصر الرقمنة وبيانات FAIR. ستشارك IUPAC أيضًا مع دراسات حالة WorldFAIR الأخرى حول المواد النانوية والكيمياء الجيولوجية.

شريك آخر لـ WorldFAIR هو جامعة Drexel ، الولايات المتحدة الأمريكية ، التي قادت مشروع Salud Urbana en América Latina ("الصحة الحضرية في أمريكا اللاتينية") (SALURBAL). طور SALURBAL أ مجموعة بيانات متعددة البلدان حول مجالات مثل الخصائص الديموغرافية ومعدلات الوفيات والسلوكيات والمخاطر الصحية والبيئة الاجتماعية والبيئة المبنية، مما يسمح بإجراء مقارنات بين المدن والأحياء داخل المدن عبر أمريكا اللاتينية. سيمكن هذا المورد المذهل إجراء البحوث ذات الصلة بالسياسات حول العوامل المحركة للتفاوتات الصحية والصحية في مدن المنطقة. قامت SALURBAL بالفعل بعمل مكثف في تنسيق البيانات. سوف تساعد WorldFAIR في إلقاء المزيد من الضوء على هذا العمل وستقدم توصيات لمصطلحات FAIR في الصحة الحضرية.

انك قد تكون مهتمة ايضا في

CAG-CEPT و CODATA و UHWB Podcast Series حول 'Data-Knowledge-Action for Urban Systems

تستكشف سلسلة بودكاست البيانات والمعرفة والعمل للأنظمة الحضرية الأنظمة المستخدمة لبناء أنظمة حضرية ذكية. تعكس السلسلة التغييرات المنهجية المطلوبة للمدن لتصبح قادرة على التكيف وذكية للتعامل مع الرفاهية الحضرية. يستضيفه مركز الجيوماتكس التطبيقي ، وكوداتا ، وبرنامج الصحة الحضرية والرفاهية (UHWB).


في 15 و 16 فبراير قدم Simon Hodson عرضًا موجزًا ​​عن عمل CODATA كجزء من جلسة تبادل المعرفة لأعضاء مركز الدراسات الدولي حول تقارب العلم والتكنولوجيا في العصر الرقمي.

يمكنك معرفة المزيد عن مشروع WorldFAIR ، وعن عمل CODATA على مفردات FAIR وعن المبادرات في مختلف التخصصات البحثية لإنشاء أصول البيانات والمعلومات FAIR في أسبوع البيانات الدولي 2022، 20-23 يونيو.


الصورة عن طريق مدرسة الفنون التطبيقية - جيه باراندي عبر فليكر.

عرض كل العناصر ذات الصلة

انتقل إلى المحتوى