Systém pro správu experimentálních dat a metadat
Petr Císař, Antonín Bárta 2014
Ústav komplexních systémů, FROV, JU
BioWes • Systém pro správu experimentálních dat a metadata • Hlavní cíl • Vytvoření systému usnadňujícího rutinní operace s experimentálními daty a metadaty od návrhu experimentu až po sdílení • Podpora • TAČR – 2011 – 2015 • Aquaexcel -2011- 2014 • Aquaexcel2020 – 2015-2020
www.biowes.org
Motivace • Experimentální práce otevírá tyto otázky • • • •
• •
Popisuji dostatečně mé experimenty? Používáme správnou terminologii? Vyznáme se ve velkém množství experimentů? Jak jsme schopni sdílet experimentální data a metadata? Pamatujeme si jak co všechno jsme s daty provedli? Máme kontrolu nad experimenty našich podřízených (studentů)
• Průzkum 2011 + dosavadní zkušenosti • • • •
18 institucí z Evropy Popis experimentu - kvalitní Správa dat – primitivní Sdílení dat - zastaralé
• Cena pořízení dat je mnohem vyšší než cena sdílení • Tlak na redukování opakování experimentů • Snižování počtů zvířat nutných pro provádění experimentů
www.biowes.org
Existující řešení • ELIXIR • SEEK • EMBRC • •
Systémy zaměřené na shromažďování experimentálních dat a jejich zpracování Řešení začíná a když jsou data pořízena
• BioWes – podpora experimentátora od návrhu protokolu • „Biological metadata are gold. Data result from carefully designed experiments and their structure reflect the experimental design. Metadata that describe the biological content of research data and their structure are a gold mine of information that is usually only available as narrative descriptions in the text of an article.“ - Tools of discovery, Thomas Lemberger, Mol. Sys. Biol. 10: 715 (2014)
www.biowes.org
BioWes - přehled • BioWes – vytvoření systému pro management experimentálních dat a metadat • Tři základní prvky • Manažer protokolů • Vytvoření elektronického protokolu • Provázání experimentálních dat a metadat • Podpora standardizací • Načítání informací z přístrojů • Plug-ini pro zpracování dat
• Lokální databáze • • • • • • •
Správa protokolů Vyhledávání Sdílení Přístup k datům Sledování vývoje protokolů Sledování zpracování dat Přístupová práva
• Centrální databáze • Sdílení metadat z centrální databáze • Vyhledávání • Zprostředkování dat od poskytovatele
www.biowes.org
Data a metadata • Metadata – reprodukovatelnost • Data o experimentálních datech, která obsahují všechny informace nutné pro reprodukovatelnost experimentu • Experimentální podmínky • Nastavení přístrojů • Použité metody
MG63 37°C
• Experimentální data (černá skříňka) • Surová experimentální data • Systém podporuje jakýkoliv typ dat • Pouze metadata jsou využívána pro vyhledávání
www.biowes.org
Schéma Local machine server Group (institute) • Celkvé schéma systému, na němserver vysvětlit jednotlivéPublic částiweb a jak mají
zhruba fungovat
Software
experiment
Experiment
description
Control
Protocol generator
Web interface
Meta data
Local web interface Local database Raw data
Selected Meta data
Central database
Tools for knowledge extraction
Information system
Experiment
Raw data transfer
Controled access
Biological experiment knowledge exploring
Free access
www.biowes.org
Měření Local machine server Group (institute) • Celkvé schéma systému, na němserver vysvětlit jednotlivéPublic částiweb a jak mají
zhruba fungovat
Software
experiment
Experiment
description
Control
Protocol generator
Web interface
Meta data
Local web interface Local database Raw data
Selected Meta data
Central database
Tools for knowledge extraction
Information system
Experiment
Raw data transfer
Controled access
Biological experiment knowledge exploring
Free access
www.biowes.org
Návrh protokolu a měření • Manažer protokolů • • • • • •
Vytvoření vzoru protokolu (grafický návrh) Znovu použitelnost protokolů Využití vzoru pro reálné měření Provázání protokolu a experimentálních dat Připojení doprovodných dat Uložení do lokální databáze
• Plug-ini • Načítání informací z měřících přístrojů • Zpracování dat • LC-MS • Popisovač obrazu • Detekce a sledování objektů
Plug-in 1
Protocol kamera
Plug-in 1 Plug-in 1
Plug-in 1
www.biowes.org
Standardizace • Sdílení data – nutná standardizace • Nutná znalost standardizace • Využití standardů při vytváření protokolu • Načtení existujících standardů • Nabízení terminologie při návrhu protokolu • Nabízení popisu metod pro měření
• • •
• •
EOL ontology (http://www.atolontology.com/index.php/en/) Open Biology Ontology (http://www.bioontology.org/) Minimum Information for Biological and Biomedical Investigations Biomedical ontology http://mibbi.sourceforge.net/portal.shtml) BioSharing (http://BioSharing.org) BioPortal (http://bioportal.bioontology.org/)
Standard
Nabízená terminologie
www.biowes.org
Lokální databáze Local machine server Group (institute) • Celkvé schéma systému, na němserver vysvětlit jednotlivéPublic částiweb a jak mají
zhruba fungovat
Software
experiment
Experiment
description
Control
Protocol generator
Web interface
Meta data
Local web interface Local database Raw data
Selected Meta data
Central database
Tools for knowledge extraction
Information system
Experiment
Raw data transfer
Controled access
Biological experiment knowledge exploring
Free access
www.biowes.org
Lokální databáze • Zabezpečené úložiště data (server, cloud) • Webové rozhraní pro přístup k protokolům • Správa protokolů – získávání experimentálních dat • Sdílení • Několik úrovní přístupových práv • Read only (data X metadata) • Read and write (data X metadata) • Vyhledávání – full text • Sdílení do centrální databáze – pouze metadata a vzory protokolů
• Vizualizace dat a metadat • Sledování vývoje protokolů • Sledování řetězu zpracování dat
www.biowes.org
Centrální databáze Local machine server Group (institute) • Celkvé schéma systému, na němserver vysvětlit jednotlivéPublic částiweb a jak mají
zhruba fungovat
Software
experiment
Experiment
description
Control
Protocol generator
Web interface
Meta data
Local web interface Local database Raw data
Selected Meta data
Central database
Tools for knowledge extraction
Information system
Experiment
Raw data transfer
Controled access
Biological experiment knowledge exploring
Free access
www.biowes.org
Central database • Volný přístup • Přehled experimentů • Instituce • Projekt • Konsorcium
• Vyhledávání metadat o experimentech • Zprostředkování kontaktu na poskytovatele dat • Plug-ini pro zpracování dat • Plug-ini pro načítání informací
www.biowes.org
BioWes - big data age • Podpora od návrhu až po sdílení. • Využitelnost od jednotlivého výzkumníka po konsorcium. • Redukce nákladů. Znovu použití experimentálních dat a protokolů redukuje náklady na jejich pořízení. Minimalizace počtu zvýřat nutných pro experimenty. • Standardizace experimentů. Používání standardů zvyšuje možnost výměny a správné interpretace dat. • Sledování řetězu zpracování dat. Přehled jednotlivých krocích zpracování dat vedoucích k finální publikaci (výsledku). • Vývoj protokolů. A systematic storage of experimental data obtained by trainees and students makes easier the use of the data after their departure from the workplace. • Publikování přehledu experimentální práce. Hodnotitelé projektů, členové konsorcia či veřejnost má přehled o výsledcích projektu www.biowes.org
BioWes – aktuální stav • Projekt ve 4 roce řešení • Reálné testování • Konsorcium Aquaexcel – 17 partnerů • JU – FROV • Mikrobiologický ústav akademie věd ČR
• Jsme otevřeni dalším testovacím místům
www.biowes.org
Chcete se dozvědět více?
www.biowes.org 30-31.10.2014 – Nové hrady
Workstation - Technical Requirements Software • Operating system: Microsoft Windows 7 or 8 • Browsers: Google Chrome, Internet Explorer, Mozilla Firefox, Opera or Safari • Software platform: .NET Framework 4.5 or higher Minimum specification • 64bit dual-core processor, 1 GHz • 4 GB RAM • 16GB free HDD space
www.biowes.org
Server – Technical Requirements Software • Operating system: Microsoft Windows Server 2008 or higher • Database server: Microsoft SQL Server 2012 or Oracle Database 11g • Web server: Microsoft IIS 7.0 or higher Minimum specification • 64bit quad-core processor, 2.5 GHz • 16 GB RAM • 1TB free HDD space
www.biowes.org
Project time line • • • • •
2011 – survey about experimental data management 2012 – electronic protocol – tool for protocol management 2013 – local and central database 2014 – data processing plug-ins 2015 – testing
www.biowes.org
Expected License Policy after Testing Phase • Personal database (protocol manager) – per device licensing • Local database – per processor core licensing + client-access licensing • Central database – per processor core licensing + clientaccess licensing. „Client“ means the Local database connected to the Central database here. • Other components – only the owner of data stored in the Central database will be allowed to provide the data to other users of the system. Small transaction cost will be charged to the recipient.
www.biowes.org