Zarządzanie danymi badawczymi

Dane badawcze i otwarte dane badawcze

Research Data - Open Research Data

Dane badawcze to wszelkie informacje, które zostały zebrane lub wygenerowane w procesie badawczym. Ich udostępnianie pozwala weryfikować przedstawione wyniki badań oraz umożliwia ponowne wykorzystanie w kolejnych badaniach. Dane badawcze zazwyczaj mają formę cyfrową, ale obejmują także formaty niecyfrowe, takie jak zeszyty laboratoryjne i dzienniki, które mogą zostać zdigitalizowane. Danymi badawczymi są zarówno dane surowe (nieprzeanalizowane, zbierane w procesie badawczym), jak i dane poddane obróbce. Gromadząc dane niecyfrowe, należy ocenić ich długoterminową przydatność i zaplanować, w jaki sposób zagwarantować ich trwałość. W trosce o powszechną dostępność danych, powinno się korzystać z formatów niewymagających komercyjnego oprogramowania do ich odczytu.

Formy danych badawczych:

  • dzienniki, pamiętniki,
  • zeszyty laboratoryjne i terenowe, notatki z eksperymentów,
  • protokoły laboratoryjne, opisy metodologiczne,
  • dokumenty tekstowe i arkusze kalkulacyjne,
  • kwestionariusze ankiet i wywiadu,
  • odpowiedzi testowe,
  • fotografie i slajdy,
  • prezentacje,
  • nagrania audio i video,
  • artefakty, okazy, próbki.
  • pliki danych,
  • standardowe procedury i protokoły operacyjne,
  • modele matematyczne, algorytmy,
  • oprogramowanie,
  • wyniki symulacji komputerowych.

Otwarte Dane Badawcze to dane badawcze udostępnione zgodnie z ideą Otwartego Dostępu - każdy użytkownik może je analizować, ponownie wykorzystywać, modyfikować i redystrybuować. Aby dane badawcze były otwarte, muszą być zdeponowane w otwartych repozytoriach krajowych lub międzynarodowych i upublicznione zgodnie z otwartymi licencjami np. Creative Commons.

Linki:





Zasady FAIR

Zasady FAIR to zbiór wytycznych określających najważniejsze zasady dobrego zarządzania danymi badawczymi.

W 2016 r. w czasopiśmie Scientific Data, w artykule „The FAIR Guiding Principles for scientific data management and stewardship”, zwrócono uwagę na potrzebę ulepszania infrastruktury umożliwiającej ponowne wykorzystanie danych oraz określono cztery zasady warunkujące wielokrotne ich użycie. Od tego czasu organizacje finansujące badania, uniwersytety i ośrodki badawcze wspierają wdrażanie dobrych praktyk w zakresie udostępniania i zarządzania danymi, w celu wspierania edukacji i innowacji.

FAIR to akronim utworzony od pierwszych liter angielskich słów: Findable, Accessible, Interoperable oraz Reusable.

Findable - łatwe do znalezienia

Dane badawcze, w myśl zasad FAIR, powinny być opisane za pomocą bogatych metadanych i mieć unikalny i trwały identyfikator (np. DOI). Powinny również być przechowywane i indeksowane w przeszukiwalnym zasobie (np. repozytorium).

Accessible - szeroko dostępne

Zaleca się, aby uzyskanie dostępu i odczytanie danych, było możliwe za pośrednictwem otwartych, darmowych i uniwersalnych kanałów komunikacyjnych. Dane powinny być „tak otwarte, jak to możliwe – tak zamknięte, jak to niezbędne”. Jeśli dostęp do danych jest ograniczony (np. dane wrażliwe, postępowania patentowe, embargo czasowe), należy uzasadnić przyczynę lub określić warunki, w jakich mogą one zostać udostępnione. W przypadku, gdy udostępnienie danych jest niemożliwe, należy udostępnić opis utworzonego zasobu, w formie metadanych.

Interoperable - interoperacyjne, łatwe do odczytu i przetwarzania zarówno przez ludzi, jak i komputery

Zasady FAIR zakładają, że przedstawiane dane wykorzystują formalny, dostępny i szeroko stosowany język do reprezentacji wiedzy oraz umożliwiają połączenie ich z innymi zbiorami danych.

Reusable - wielokrotnego użytku

W celu umożliwienia ponownego wykorzystania danych i ich właściwej interpretacji, dane powinny być właściwe udokumentowane, poprzez podanie informacji o celach projektu, jednostkach zaangażowanych w zbieranie danych oraz wyjaśnienie w jaki sposób dane zostały utworzone.

Ponadto dane badawcze powinny mieć wyraźnie określoną licencję, regulującą warunki ich ponownego wykorzystania, np. powszechnie używane licencje Creative Commons.

Zasady FAIR są nieustannie rozwijane, ponieważ coraz więcej organizacji i instytucji jest zainteresowanych wprowadzaniem dobrych praktyk w zakresie zarządzania danymi badawczymi.

Więcej publikacji i materiałów informacyjnych można znaleźć na stronach:

Plan Zarządzania Danymi (PZD) / Data Management Plan (DMP)

Plan Zarządzania Danymi (PZD) / Data Management Plan (DMP) to dokument określający, w jaki sposób dane badawcze będą zarządzane podczas projektu badawczego, jak również po jego zakończeniu. Sporządzania takiego planu wymagają między innymi polskie Narodowe Centrum Nauki, Komisja Europejska (w programach Horyzont 2020 i Horyzont Europa), Europejska Rada ds. Badań Naukowych, National Science Foundation ze Stanów Zjednoczonych czy też brytyjskie Research Councils.

Nie istnieje uniwersalny wzorzec Planu Zarządzania Danymi, jego zawartość jest uzależniona od wytycznych instytucji finansującej dany projekt badawczy. Udostępnione powinny zostać dane konieczne do weryfikacji wyników badań. Plan może się zmieniać wraz z postępem prac nad projektem.

Narodowe Centrum Nauki wyznaczyło sześć obszarów tematycznych, które muszą zostać uwzględnione w planie zarządzania danymi:

  1. Opis danych oraz pozyskiwanie lub ponowne wykorzystanie dostępnych danych
  2. Dokumentacja i jakość danych
  3. Przechowywanie i tworzenie kopii zapasowych podczas badań
  4. Wymogi prawne, kodeksy postępowania
  5. Udostępnianie i długotrwałe przechowywanie danych
  6. Zadania związane z zarządzaniem danymi oraz zasoby

Szczegółowe informacje wraz z pytaniami pomocniczymi można znaleźć w dokumencie Wytyczne dla wnioskodawców do uzupełnienia PLANU ZARZĄDZANIA DANYMI w projekcie badawczym.

W tym samym źródle znajduje się następujący komunikat: „NCN dopuszcza, że w ramach niektórych projektów nie będą wytwarzane, na nowo wykorzystywane, ani poddawane analizie żadne dane badawcze ani inne podobne materiały. W takich wypadkach wymagane jest jednak krótkie uzasadnienie.”

NCN udostępnił także odpowiedzi na najczęściej zadawane pytania dotyczące planu zarządzania danymi.

Inne przydatne źródła:

Opracowania Science Europe: