Plan zarządzania danymi (Data Management Plan, DMP)

Na stronie znajdziecie Państwo informacje dotyczące tematyki związanej z gromadzeniem danych badawczych, ich przechowywaniem, upowszechnianiem w modelu Open Access zgodnie z wytycznymi Unii Europejskiej, programu Horyzont 2020, a także grantów Narodowego Centrum Nauki.

Co to są dane badawcze

Dane badawcze (research data) to zarejestrowane materiały o charakterze faktograficznym (dane liczbowe, dokumenty tekstowe, notatki, kwestionariusze, nagrania audio i wideo, fotografie, modele matematyczne, algorytmy, oprogramowanie, wyniki symulacji komputerowych, protokoły laboratoryjne, opisy metodologiczne itp.), powszechnie uznawane przez społeczność naukową za niezbędne do oceny wyników badań naukowych. Dzielą się one na:

  • surowe dane (uzyskane bezpośrednio w wyniku zastosowania narzędzia badawczego),
  • oraz dane, które poddano obróbce.

Otwarte dane badawcze (open research data) to dane, do których każdy ma dostęp. Mogą one zostać ponownie wykorzystane, modyfikowane i redystrybuowane.

Plan zarządzania danymi (Data Management Plan, DMP) określa, w jaki sposób dane badawcze powstałe w trakcie realizacji projektu badawczego mają być zarządzane, zarówno w czasie jego trwania, jak i po zakończeniu.

Granty Narodowego Centrum Nauki (NCN)

W 2019 r. NCN wprowadził do wniosku o dofinansowanie projektów badawczych załącznik - plan zarządzania danymi badawczymi. NCN udostępnia wytyczne odnośnie przygotowania DMP.

Przydatny może być również praktyczny przewodnik dotyczący ujednoliconych europejskich praktyk związanych z zarządzaniem danymi naukowymi (Science Europe)

1. Opis danych oraz pozyskiwanie lub ponowne wykorzystanie dostępnych danych
Sposób pozyskiwania i opracowywania nowych danych i/lub ponownego wykorzystania dostępnych danych Opisać, jaka metodologia lub oprogramowanie będzie użyte do zebrania nowych danych oraz czy zostało rozważone lub też odrzucone ponowne wykorzystanie istniejących danych.
Pozyskiwane lub opracowywane dane (np. rodzaj, format, ilość) Opisać rodzaj danych badawczych (tekst, obrazy, zdjęcie, pomiary, statystyki, kody) oraz jak będą one kontrolowane (walidacja wprowadzanych danych, standardy zapisywania/nagrywania i utrwalania danych, specjalistyczne recenzje, itd.). Format plików może być dowolny, najważniejsze, by wybierać taki format, który zapewnia powszechny dostęp i otwartość. Najlepiej jest wykorzystywać otwarte oprogramowanie do odczytu danych. Uzasadnić, dlaczego wybieramy konkretny format, np. ze względu na standardy stosowane w repozytorium, wśród naukowców.
2. Dokumentacja i jakość danych
Metadane i dokumenty (np. metodologia lub pozyskiwanie danych oraz sposób porządkowania danych) towarzyszące danym Opisać metodologię prowadzonych badań, ich kontekst i źródło, a także sposób organizacji danych w czasie trwania projektu (struktura folderów, wersji). Dane muszą być udostępniane z metadanymi, do których zaliczają się: autor wraz z identyfikatorem ORCID, tytuł, data powstania, licencja, dyscyplina naukowa. Można tutaj zastosować standardy DDI, EAD. Standardy metadanych dla poszczególnych dziedzin nauki, w tym nauk społecznych można znaleźć na stronie Digital curation standards.
Stosowane środki kontroli jakości danych Opisać, jak dane będą zabezpieczone przed nieuprawnioną modyfikacją. Na którym etapie zostanie wdrożona ocena jakości oraz czy dane będą wymagać oczyszczenia lub innej ingerencji, np. kalibracji, walidacji.
3. Przechowywanie i tworzenie kopii zapasowych podczas badań
Przechowywanie i tworzenie kopii zapasowych danych i metadanych podczas badań Przeanalizować przechowywanie (np. w chmurze UEK, zabezpieczanie poprzez login i hasło, połączenie szyfrowane za pomocą protokołu HTTPS) i tworzenie kopii zapasowych (odpowiedzialny dział IT, kopie wykonywane automatycznie raz dziennie i przechowywane na macierzach dyskowych) dla całego procesu gromadzenia i przetwarzania danych badawczych. Nie jest rekomendowane przechowywanie danych na dyskach zewnętrznych, czy USB.
Sposób zapewnienia bezpieczeństwa danych oraz ochrony danych wrażliwych podczas badań Przy konieczności usługi zewnętrznej w tym względzie, musi ona być zgodna z polityką każdego zaangażowanego w projekt podmiotu. Jeżeli wykorzystywane są dane poufne, to jak zostanie zorganizowany do nich dostęp i jakie wykorzystamy zabezpieczenie. Podać informację o polityce ochrony danych w UEK - Polityka prywatności i RODO, załącznik Procedura zarządzania incydentami bezpieczeństwa informacji.
4. Wymogi prawne, kodeksy postępowania
Sposób zapewnienia zgodności z przepisami dotyczącymi danych osobowych i bezpieczeństwa danych w przypadku przetwarzania danych osobowych Opisać zasady przestrzegania RODO. Jeżeli badania zakładają gromadzenie i/lub przetwarzanie danych wrażliwych, konieczne jest zapewnienie właściwej ochrony. Opisać, czy dane będą anonimizowane, pseudonimizowane (proces odwracalny), szyfrowane.
Sposób zarządzania innymi kwestiami prawnymi, np. prawami własności intelektualnej lub własnością. Obowiązujące przepisy Wskazać właściciela praw autorskich i praw własności intelektualnej do wszystkich danych (pozyskanych, wytworzonych), a także odpowiedniej licencji, np. Creative Commons. Opisać wszystkie ograniczenia dotyczące ponownego wykorzystania danych pochodzących od osób trzecich (ochrona prawna bazy danych, dyrektywy).
5. Udostępnianie i długotrwałe przechowywanie danych
Sposób i termin udostępnienia danych. Ewentualne ograniczenia w udostępnianiu danych lub przyczyny embarga Opisać i określić, kiedy dane badawcze zostaną udostępnione, czy będzie to dostęp pełny, czy może ograniczony np. ze względów prawnych oraz czy będzie możliwe ich ponowne użycie.
Sposób wyboru danych przeznaczonych do przechowania oraz miejsce długotrwałego przechowywania danych (np. repozytorium lub archiwum danych) Podać, jakie dane będą przechowywane po zakończeniu projektu oraz jak długo będą one archiwizowane. Dane surowe i przetworzone powinny być przechowywane przez okres odpowiedni dla danej dyscypliny i zastosowanej metodologii. W rozumieniu NCN uzasadniony okres przechowywania to minimum 10 lat. Deponowanie ich w repozytoriach daje pewność, że będą one zarządzane w sposób zgodny z dobrymi praktykami archiwizacji cyfrowej (więcej w części Repozytoria).
Metody lub narzędzia programowe umożliwiające dostęp do danych i korzystanie z danych Udostępnianie danych zależne będzie od rodzaju, rozmiaru, złożoności i wrażliwości danych. Podać, czy do uzyskania dostępu do danych będą potrzebne dodatkowe narzędzia.
Sposób zapewniający stosowanie unikalnego i trwałego identyfikatora (np. cyfrowego identyfikatora obiektu, DOI) dla każdego zestawu danych Podać, jaki zostanie zastosowany identyfikator, który pozwoli na trafną lokalizację danych, np. DOI, URI.
5. Udostępnianie i długotrwałe przechowywanie danych
Osoba (np. funkcja, stanowisko i instytucja) odpowiedzialna za zarządzanie danymi (np. data steward) Nakreślić role i obowiązki związane z zarządzaniem/opieką nad danymi, np. ich przechwytywaniem, przygotowywaniem metadanych, jakością, przechowywaniem i tworzeniem kopii zapasowych, a także archiwizacją i udostępnianiem danych. W miarę możliwości powinno się wymienić odpowiedzialną osobę (osoby) oraz kto odpowiada za wdrożenie planu zarządzania, a także jego weryfikację i korektę. W przypadku projektów opartych na współpracy, należy wyjaśnić sposób koordynacji działań w zakresie zarządzania danymi między poszczególnymi partnerami.
Środki (np. finansowe i czasowe) przeznaczone do zarządzania danymi i zapewnienia możliwości odnalezienia, dostępu, interoperacyjności i ponownego wykorzystania danych Jak będą oszacowane koszty przygotowania danych do ich udostępnienia, czy będą potrzebne dodatkowe zasoby do przechowywania i archiwizacji. Jeżeli tak, jakie będą to koszty oraz w jaki sposób zostaną opłacone.

Jak zrobić plan zarządzania danymi dla nauk społecznych?

Repozytoria, z których należy korzystać udostępniając dane badawcze powinny przestrzegać zasad FAIR Data, tzn. dane powinny być:

  1. Findable – możliwe do odnalezienia – dane opatrzone są metadanymi, zbiór posiada unikalny identyfikator (np. DOI), jest indeksowany w ogólnodostępnych bazach
  2. Accessible – dostępne
  3. Interoperable – interoperacyjne – łatwe do odczytu i przetwarzania zarówno przez ludzi, jak i komputery
  4. Reusable – możliwe do ponownego użycia
Rekomendowane repozytoria otwartych danych badawczych i wyszukiwarki spełniające te warunki:
  • RepOD
  • Zenodo
  • re3data.org – katalog repozytoriów danych badawczych, można je przeszukiwać według dziedziny, kraju czy typu deponowanych danych

Strony do tworzenia Data Management Plan

  • DMP Tool - narzędzie przygotowujące szablony DMP dostosowane do wymagań amerykańskich grantodawców
  • DMP online - narzędzie bardzo podobne do DMPtool zawierające jednak bazę instytucji finansującej naukę z Wielkiej Brytanii
  • The Data Curation Center – na stronie można znaleźć gotowe plany zarządzania danymi, szablony, przewodniki, wytyczne, a także informacje na temat formatów zamieszczanych danych, metadanych, w zależności od dyscypliny oraz lista kontrolna (Checklist for a Data Management Plan) dotycząca zawartości DMP

Poradniki

Regulamin zarządzania dobrami własności intelektualnej i przemysłowej UEK

Polski