Výzkumná data ****************************************************************************************** * ****************************************************************************************** Definice pojmů Data • Jakékoli informace, které byly shromážděny, pozorovány, vygenerovány nebo vytvořeny za ú reprodukování výsledků výzkumu • dokumenty • tabulky • audio/vizuální nahrávky • obrázky • fotografie • dotazníky • přepisy rozhovorů • software • laboratorní deníky • terénní poznámky • vzorky • uplatňují se standardní formáty pro texty (xml, pdf/a, html, json, txt, rtf), obrázky (j png), video (MPEG, AVI, MKV) nebo audio (WAVE, MP3, FLAC) • strukturovaná kolekce výzkumných dat se označuje spojením datová sada Metadata • Data o datech čili informace popisující atributy datové sady, které umožňují identifikac správu dat v budoucnu • data o respondentech • čas a místo sběru dat • vysvětlivky • číselníky • vzor informovaného souhlasu • licenční podmínky • uplatňují se různé formáty, od volného textu po strukturovaný strojově čitelný obsah (ně datová uložiště mohou mít specifické požadavky) Data Steward • Osoba, která poskytuje podporu v otázkách správy výzkumných dat, a to buď na úrovni faku výzkumného týmu • Fakultní Data Steward • zodpovídá za to, aby byla fakultní správa výzkumných dat v souladu s univerzitními i mez standardy, a to skrze přemosťující kontakt s datovou komunitou na straně jedné, s fakult a širší podporou na straně druhé • asistence při tvorbě data management plánů, výběru (meta)datových formátů, vyhledávání v a repozitářů nebo identifikace překážek pro zveřejnění výzkumných dat • neplní roli datového analytika, neprovádí oborový rozbor výzkumných dat • Projektový Data Steward • zodpovídá za vypracování data management plánu, ukládání, zabezpečení, zálohování a sdíl dat, vytvoření metadat a finální uložení dat do repozitáře • pro úvazek projektového data stewarda se doporučuje vyčlenit úvazek 0,1 nebo 0,2 FTE • pozice je vypsána pouze u některých projektů (GA ČR, OP JAK) Management výzkumných dat Datová sada výzkumných projektů má svůj specifický životní cyklus. • Vznik dat: sběr dat a jejich uložení, generování části metadat • Zpracování dat: digitalizace, validace, anonymizace a uložení dat, generování dalších me • Analýza dat: interpretace a analýza dat, příprava publikace • Ochrana dat: zálohování, migrace formátů, dokumentace • Sdílení dat: řízení přístupu, copyright a licence • Opakované využití dat: nový výzkum, partnerství, výuka a vzdělávání Základní tipy při organizaci dat: • při pojmenování souborů neopomeňte datum (YYYYMMDD), vyhněte se speciálním znakům (! @ # uveďte iniciály účastníků výzkumu, u anonymních respondentů unikátní kód • u tabulkových dat popisujte sloupce na jednom řádku (počínaje A1), pojmenujte a popište naopak nepoužívejte barvy pro přenos informace a nespojujte buňky Data se liší podle kategorie a zvolené přístupnosti: • veřejná data: zpřístupněna komukoliv bez omezení • interní data: určena pouze pro vnitřní potřebu volně vymezené skupiny osob (korespondenc jednání, vnitřní regulace a předpisy) • diskrétní data: určena výhradně pro vnitřní potřebu přesně vymezené skupiny osob, vyžadu ochranu, a to ze zákona (GDPR) nebo na základě smlouvy/licence (ekonomické a personální povahy, čísla identifikačních průkazů, rodná čísla) • citlivá data: určena striktně pro vnitřní potřebu přesně vymezené skupiny osob, vyžadují nebo obzvláštní ochranu, a to ze zákona či na základě smlouvy/licence (zdravotní data, o odhalující rasový či etnický původ, politické názory, náboženské nebo filozofické přesvě biometrické údaje zpracovávané za účelem identifikace člověka) • otevřená data: přístup bývá zpravidla realizován prostřednictvím elektronických datových data musí být zpřístupněna ve formě, která umožní další využití z hlediska technického i přístup, využití, reprodukce a šíření dat musí být bezplatné • přístup s embargem: správce dat uvede v repozitáři datum, od kdy se datová sada zpřístup • přístup s omezením: správce dat určuje podmínky, za kterých udělí přístup k datovým sadá správce dat si za udělení přístupu nesmí účtovat poplatky • uzavřený přístup: z důvodu obchodního tajemství nebo ochrany duševního vlastnictví; uzav být uložena v repozitáři, aniž by do něj byl přístup Doporučuje se zejména, aby přístup k datům naplňoval takzvané principy FAIR: • nalezitelnost (to be findable): zajištění strojově čitelných metadat s identifikátorem ( • dostupnost (to be accessible): zajištění otevřeného přístupu, ideálně skrze repozitář • interoperabilita (to be interoperable): uplatnit standardizované výrazy k popisu dat • opětovná využitelnost (to be reusable): zajistit vhodnou licenci výzkumných dat Žádný z principů FAIR nevynucuje, aby byla data otevřená nebo zdarma, požaduje stanovení j transparentních podmínek možného přístupu a opětovného využití dat. FAIR data tedy nemusí musí pouze mít přidělenou licenci. Principy, aplikované na oborové standardy, následují zásadu: As open as possible, as close Data Management Plan (DMP) Dokument, který shrnuje jednotlivé fáze správy výzkumných dat během projektu i po jeho sko • Co obsahuje DMP? • Administrativní údaje (název, výzkumný tým, poskytovatel, abstrakt) • Sběr dat (metody, formáty, objemy, software) • Organizace dat (kontrola kvality, dokumentace, identifikátory) • Ukládání dat (zabezpečení, přístupy, zálohování) • Zveřejnění dat (metadata, licence, embargo) • Etické a právní otázky výzkumných dat • Náklady na správu výzkumných dat (APC poplatky, projektový Data Steward, věcné náklady) • Jak vytvořit DMP? • dokument lze vytvářet v klasickém textovém editoru, dokonce i napsat ručně na papír • doporučuje se nicméně uplatnit online nástroje, které navigují pomocí předpřipravených o zkracují celé úsilí • FAIR Wizard CUNI [ URL "https://cuni.fair-wizard.com/admin/"] : nástroj usnadňující tvor zprostředkovávaný pro zaměstnance a studenty Univerzity Karlovy • nástroj prochází jednotlivé okruhy správy výzkumných dat pomocí stromových dotazníků • univerzitní Centrum pro podporu Open Science zpracovalo rozsáhlý a krokový návod [ URL " openscience.cuni.cz/OSCI-256.html"] pro seznámení s nástrojem, fakultní podpora pak přip vzor konkrétního DMP • Proč vytvořit DMP? • vyžadují jej v určité (nikoli jednotné) formě mnozí interní i externí poskytovatelé fina GA ČR [ URL "https://gacr.cz/ga-cr-a-otevrena-veda/"] , TA ČR [ URL "https://tacr.gov.cz management-plan-ta-cr-1"] , Horizon 2020 [ URL "https://openscience.cuni.cz/OSCI-55.html Europe [ URL "https://openscience.cuni.cz/OSCI-141.html"] , PRIMUS [ URL "https://cuni.c version1-or_6_2024.pdf"] , OP JAK [ URL "https://openscience.cuni.cz/OSCI-181.html"] , p [ URL "https://openscience.cuni.cz/OSCI-177.html"] • DMP může mít i praktický užitek: pomáhá předvídat potenciální problémy, snižuje riziko z usnadňuje jejich sdílení, a tím i kontinuitu dlouhodobého výzkumu • na obecné úrovni má datová politika tvořit standardy „dobré vědecké praxe [ URL "https:/ openscience.cuni.cz/OSCI-61.html"] “, krom jiného posílit replikovatelnost nebo integrit Datové repozitáře Online platforma pro ukládání, zveřejňování a uchovávání dat, souvisejících metadat a doku • obecné repozitáře zveřejňují data z jakéhokoli vědecké oblasti • oborové repozitáře jsou preferované • institucionální repozitář se na úrovni Univerzity Karlovy aktuálně připravuje Volba vhodného repozitáře záleží na typu dat. Důvěryhodné repozitáře se poznají podle toho otevřený přístup, přiřazují trvalé identifikátory, používají standardizovaná a strojová me sadám umožňují přidělovat licence a mají certifikaci. • Zenodo: obecný repozítář, vytvořený platformou OpenAIRE a společností CERN, umožňuje vkl velikosti 50 GB (maximálně 100 souborů) • Národní datový repozitář: obecný repozitář, provozovaný sdružením CESNET, pilotní režim • Harvard Dataverse: obecný repozitář, provozovaný Harvardovou univerzitou, umožňuje vklád velikosti 1 TB • Český sociálněvědní datový archiv: oborový repozitář, provozovaný Sociologickým ústavem stanovenou maximální velikost souborů • LINDAT/CLARIAH-CZ: oborový repozitář pro lingvistická data a nástroje, zpravovaný Ústave aplikované lingvistiky MFF UK, nemá stanovenou maximální velikost souborů • Re3data.org: registr nabízí přehled existujících mezinárodních datových repozitářů • OpenDOAR: databáze otevřených repozitářů Právní aspekty výzkumných dat Zákon č. 130/2002 Sb., o podpoře výzkumu a vývoje z veřejných prostředků [ URL "https://ww sb/2002/130?zalozka=text"] definuje výzkumná data v § 2 odst. 2 písm. o: „informace, s výjimkou vědeckých publikací, v elektronické podobě, které jsou shromažďován v průběhu výzkumu nebo vývoje a jsou používány jako důkazy v procesu výzkumu nebo vývoje n obecně akceptovány výzkumnou obcí jako nezbytné k validaci zjištění a výsledků výzkumu neb Pro účely poskytování finanční podpory dle předmětného zákona se tedy výzkumnými daty rozu digitální podobě. Univerzitní Centrum pro podporu Open Science v obecné rovině vnímá výzku tedy včetně těch nedigitálních. Zákon č. 130/2002 Sb. byl v roce 2022 novelizován (č. 241/2022 Sb. [ URL "https://www.e-sb sb/2022/241/2022-08-31?zalozka=text"] ) v úsilí implementovat do českého práva Směrnici Ev parlamentu a Rady (EU) 2019/1024, Otevřená data a opakované použití informací veřejného se "https://eur-lex.europa.eu/legal-content/CS/ALL/?uri=CELEX%3A32019L1024"] . Novela stanoví povinnost, a to u projektů podpořených z veřejných prostředků, zveřejnit in správy výzkumných dat. Dále ukládá: • dle § 9 odst. 1 písm. l: „vedení záznamů o výzkumných datech, známé rovněž jako ´data ma je základním předpokladem pro efektivní nakládání s výzkumnými daty v průběhu vědeckého • ustanovení ukládá obecnou povinnost zahrnout do smlouvy o poskytnutí podpory část, v níž způsob správy výzkumných dat příjemcem • dle § 9 odst. 1 písm. m: „informace o dostupnosti a způsobu šíření výsledků výzkumu a vý (…) v souladu se zásadou, že výsledky výzkumu a výzkumná data nejsou zveřejňovány pouze případech“ • odůvodněné případy mohou zahrnovat například data třetích stran, citlivé údaje o účastní lidskými subjekty nebo obchodní tajemství • dle § 12 odst. 1: „Podporu lze poskytnout pouze za podmínky zveřejnění pravdivých a včas příjemcem i poskytovatelem o prováděném výzkumu, vývoji a inovacích a o jejich výsledcíc datech prostřednictvím informačního systému výzkumu, vývoje a inovací“ • podle stanoviska Univerzitního Centra pro podporu Open Science odstavec zakládá povinnos v IS VaVaI informace o výzkumných datech, „jejich metadata, nikoli data samotná [ URL "h openscience.cuni.cz/OSCI-230.html"] “ • dle § 12 odst. 3: „Příjemce nezveřejní informace o výzkumných datech, jejichž zveřejnění nepřiměřenému zásahu do práva na ochranu duševního vlastnictví, obchodního tajemství, be nebo oprávněných obchodních zájmů příjemce nebo třetí osoby“ • příjemce má v těchto případech povinnost nejméně jednou za rok po dobu pěti let od ukonč podpory přezkoumat, zda důvody pro nezveřejnění trvají • dle nově vloženého § 12a odst. 1 má příjemce povinnost bezplatně poskytnout výzkumná dat žádosti, která „nejsou chráněna podle zákonů upravujících ochranu výsledků autorské, vyn obdobné tvůrčí činnosti” • § 12a odst. 2: „Příjemce může odmítnout poskytnutí výzkumných dat v případech, kdy by jí k nepřiměřenému zásahu do práva na ochranu soukromí a osobních údajů, práva na ochranu o tajemství, bezpečnosti státu nebo jiných oprávněných zájmů příjemce“ • datové povinnosti dle § 12a se nevztahují na projekty vyhlášené či podpořené před 1. 9. Pro výzkumná data neexistuje jednotný systém právní ochrany. Jejich detailnější přehled po pro podporu Open Science [ URL "https://openscience.cuni.cz/OSCI-1.html"] . Etické aspekty výzkumných dat Ochrana dat propojuje několik oblastí, u kterých se předpokládá vzájemný dialog. Základem je vyhodnocení několika otázek: • Bude potřeba informovaný souhlas subjektů? • Existují bariéry pro zpřístupnění dat jiným výzkumníkům? • Jak bude nakládáno s diskrétními a citlivými data, aby se zajistilo, že jsou bezpečně ul • Kdo bude data ukládat a kdo k nim bude mít v průběhu projektu přístup? • Jak dlouho po skončení projektu budou data uchovávána? Právní konzultace poskytují příslušné kontakty v rámci Centra pro podporu Open Science [ U openscience.cuni.cz/OSCI-1.html"] , případně Centra pro přenos poznatků a technologií [ UR cppt.cuni.cz/CPPTN-1.html"] . Etické posouzení má v gesci fakultní Komise pro etiku ve výz "https://veda.fhs.cuni.cz/FHSVEDA-28.html"] . Oddělení informačních technologií [ URL "htt oit.fhs.cuni.cz/FHSLVT-1.html"] zajišťuje řešení vhodných síťových a cloudových uložišť. Komise pro etiku ve výzkumu byla na FHS UK zřízení Opatřením děkana č. 10/2018, Statut Kom výzkumu Fakulty humanitních studií Univerzity Karlovy [ URL "https://fhs.cuni.cz/FHS-3727. návaznosti na celouniverzitní Opatření rektora č. 74/2017, Statut Komise pro etiku ve výzk Karlovy [ URL "https://cuni.cz/UK-8713-version1-or_2017_74.pdf"] . Postup pro fakultní při etické posouzení upravuje Čl. 5 příslušného Opatření děkana. Fakultní Komise dále poskytuje v součinnosti s Hlavní spisovnou FHS UK [ URL "https://fhs. fhs-561.html"] možnost uložit citlivé údaje, originály podepsaných informovaných souhlasů na jejich zajištěném pracovišti. Mezi další (méně doporučené) typy uložišť patří například: • přenosná média (flash disky, paměťové karty, CD) • lokální disky (počítače, notebooky) • síťová uložiště provozovaná na infrastruktuře UK (OneDrive) • cloudová úložiště provozovaná externími subjekty mimo infrastrukturu UK (Sharepoint) Varianty fakultních uložišť a jejich vhodné užití naznačuje tabulka níže: Fyzické uložiště Síťové disky (interní) Cloudové služby (sm Kategorie dat veřejná, interní, diskrétveřejná, interní, diskrétnveřejná, interní citlivá citlivá Kapacita uložiště není stanovena do 100 GB na uživatele do 5 TB na uživatel Zálohování Hlavní spisovna FHS UK OIT ÚVT Fakultní a univerzitní kontakty V případě jakýchkoli dotazů lze kontaktovat fakultní i univerzitní podporu. FHS UK • Martin Mišúr: Data Steward, datasteward(zavinac)fhs.cuni.cz [ MAIL "datasteward(zavinac) • Miriam Vojtíšková: fakultní koordinátorka Open Science, miriam.vojtiskova(zavinac)fhs.cu "miriam.vojtiskova(zavinac)fhs.cuni.cz"] • Tomáš Renner: tajemník Komise pro etiku ve výzkumu, tomas.renner(zavinac)fhs.cuni.cz [ M "tomas.renner(zavinac)fhs.cuni.cz"] • Roman Sukdolák: správce Hlavní spisovny FHS UK, roman.sukdolak(zavinac)fhs.cuni.cz [ MAI "roman.sukdolak(zavinac)fhs.cuni.cz"] • Alena Matuszková: ředitelka fakultní knihovny, alena.matuszkova(zavinac)fhs.cuni.cz [ MA "alena.matuszkova(zavinac)fhs.cuni.cz"] UK • konzultace v souvislosti s autorskoprávní problematikou, openlaw(zavinac)cuni.cz [ MAIL "openlaw(zavinac)cuni.cz"] • pověřenkyně pro ochranu osobních údajů, gdpr(zavinac)cuni.cz [ MAIL "gdpr(zavinac)cuni.c • komercializace a duševní vlastnictví, research.data(zavinac)cuip.cz [ MAIL "research.data(zavinac)cuip.cz"] • technická (ICT) podpora, openict(zavinac)cuni.cz [ MAIL "openict(zavinac)cuni.cz"] • Ústav výpočetní techniky, office(zavinac)uvt.cuni.cz [ MAIL "office(zavinac)uvt.cuni.cz" • Centrum pro podporu Open Science, researchdata(zavinac)cuni.cz [ MAIL "researchdata(zavi Důležité dokumenty Zákon č. 130/2002 Sb., o podpoře výzkumu a vývoje z veřejných prostředků [ URL "https://ww sb/2002/130?zalozka=text"] Zákon č. 241/2022 Sb., Zákon, kterým se mění zákon č. 106/1999 Sb., o svobodném přístupu k ve znění pozdějších předpisů, zákon č. 123/1998 Sb., o právu na informace o životním prost pozdějších předpisů, a zákon č. 130/2002 Sb., o podpoře výzkumu, experimentálního vývoje a veřejných prostředků a o změně některých souvisejících zákonů (zákon o podpoře výzkumu, ex vývoje a inovací), ve znění pozdějších předpisů [ URL "https://www.e-sbirka.cz/sb/2022/241 Směrnice Evropského parlamentu a Rady (EU) 2019/1024, Otevřená data a opakované použití in sektoru [ URL "https://eur-lex.europa.eu/legal-content/CS/ALL/?uri=CELEX%3A32019L1024"] Opatření děkana č. 10/2018, Statut Komise pro etiku ve výzkumu Fakulty humanitních studií Karlovy [ URL "https://fhs.cuni.cz/FHS-3727.html"] Opatření rektora č. 74/2017, Statut Komise pro etiku ve výzkumu Univerzity Karlovy [ URL " UK-8713-version1-or_2017_74.pdf"] Užitečné odkazy Centrum pro podporu Open Science [ URL "https://openscience.cuni.cz/OSCI-1.html"] FAIR Wizard CUNI [ URL "https://cuni.fair-wizard.com/admin/"] How to make your data FAIR [ URL "https://www.openaire.eu/how-to-make-your-data-fair"] GA ČR a otevřená věda [ URL "https://gacr.cz/ga-cr-a-otevrena-veda/"] Jak bezpečně nakládat s daty [ URL "https://publications.cuni.cz/bitstream/handle/20.500.1 RDM_Potuznik_doporuceni_vyber%20datoveho%20uloziste.pdf?sequence=1&isAllowed=y"]