Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene...

37
Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity Network: Leveraging DNA and Tissue collections globally Gabi Dröge, Katharine Barker, Walter G. Berendsohn Botanic Garden and Botanical Museum Berlin-Dahlem

Transcript of Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene...

Page 1: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeiten

The Global Genome Biodiversity Network: Leveraging DNA and Tissue

collections globally

Gabi Dröge, Katharine Barker, Walter G. Berendsohn

Botanic Garden and Botanical Museum Berlin-Dahlem

Page 2: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenGlobal Genome Biodiversity Network

• Network for non-human biobanks (e.g. DNA, tissue)

• Founded in 2011• Precursor project DNA Bank

Network founded in 2007 providing virtual infrastructure

• General secretariat: Smithsonian Institution

• Technical secretariat: Botanic Garden and Botanical Museum Berlin-Dahlem

• http://www.ggbn.org

Page 3: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenGoals

• Data standard for sharing tissue and DNA information

• Portal to make biobank sample data available

• Institutional directory• Knowledge platform

Page 4: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenGoals

• Best practices related to management and stewardship of genomic samples

• Recruit partners with different regional and taxonomic focus

• Identify gaps in GGBN collections

Page 5: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenAudiences

• Biorepositories (contributors)• Organizations with living or

preserved specimens (contributors)

• Researchers (users)

Page 6: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenToday: 37 GGBN members worldwide

6

Page 7: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenDeveloping Best Practices

• Recommendation for Biodiversity Biorepositories– Collaboration with ISBER*– April 2013, Submitted to ISBER – To be included into next version

of ISBER Best Practices• GGBN Document Library– Collaboration with ESBB**– May 2016, beta-release for

member use– Knowledge platform for non-

human biobanking

* International Society for Biological and Environmental Repositories** European, Middle Eastern and African Society for Biopreservation and Biobanking

Page 8: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenDeveloping Best Practices

• Access and Benefit Sharing (ABS) compliance – July 2015, Documentation

available for member use• Material Transfer

Agreements• Code of Conduct• Statement of Use of

Genomic Material – Collaboration with

CETAF*– Provide trusted and

transparent access to genomic samples for users and contributors through an ABS framework

* Consortium of European Taxonomic Facilities

Page 9: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenBusiness Model

• Will come into force 01/2016• Core and Associate members made a

commitment to become financial or in-kind contributors

• Current funding by:– German Research Foundation (DFG)– SYNTHESYS (EC)– In-kind contributions

Page 10: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenBusiness Model: Pre-order samples in the Portal

• Order DNA or tissue samples through GGBN portal

• Download of sample information• Request forwarded to GGBN member

holding the sample(s)– Institution responsible for all further

steps• Checking availability and loaning conditions• Provide price offer to scientist• Request signing of Material Transfer

Agreement• Shipping samples

• Citation guidelines for samples coming soon (available at ggbn.org)

Page 11: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeiten

The GGBN Data Portal

Page 12: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenGoal (December 2015): New Data Portal

• Expanded functionality

• Corporate Design• Based on feedback,

review and requirements of the GGBN community

• Public beta-release July 2015

http://data.ggbn.org/ggbn_new

• Final release December 2015

Page 13: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenData Portal Architecture: Primary goal

Do not re-invent the wheel!

Page 14: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeiten

Source material / specimens Molecular analysis data

DNA & Tissue

Data Portal Architecture

Page 15: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenPortal: Basic Architecture

Harvester(B-HIT)*

Data Cleaning

Index(MySQL

)

Store raw and cleaned data

Create SOLR index

Get full access toorginal record

Provider

IPT

Login, User settings

Query

*Berlin Harvesting and Indexing Toolkit

Provider

GBIF checklist

bank, CITES

External sources

GGBN web service

Page 16: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenPortal: Taxonomic Backbone

Goals:• Query expansion: get synonyms and

accepted names• Keep names used by providersSources:• Certain datasets from GBIF checklist

bank web service– GBIF backbone, CoL, NCBI

• Prokaryotic Nomenclature up-to-date (PNU) web service

• EOL web service (under consideration)

• The Plant list web service (under consideration)

Page 17: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenPortal: Aggregate data from multiple sources

Page 18: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenPortal: Aggregate data from multiple sourcesExplore

Chenopodium ficifolium1908

specimens

42 nucleotide sequences

taxon page

3 DNA samples4 tissue samples

Getting live counts from other biodiversity portals for each record via web services

Page 19: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenCITES @ GGBN

Warning and request for CITES registration number when ordering

the sample both for curator and user.

Page 20: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenPortal: Statistics

Example: Samples from CaryophyllalesAbove: all records (DNA, tissue, specimens)Right: DNA / tissue samples

Page 21: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenWhite Paper on Data Portal published

Droege et al. 2014

Page 22: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenGGBN Data Standard

• http://terms.tdwg.org/wiki/GGBN_Data_Standard

• Based on ABCDDNA• Is meant to be used with ABCD or

DwC -> all occurrence terms are excluded (geography, scientificname etc.)

• Include elements of other standards (e.g. MIxS, SPREC)

• Collaboration with GBIF, Genomics Standards Consortium, GenBank, EMBL, ESBB, TDWG, and others

Page 23: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeiten

GGBN Data Standards

Page 24: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenGGBN Data Standard

http://terms.tdwg.org/wiki/GGBN_Data_Standard

Vocabulary for - sample and

sequencing data- ABS- loan information

Page 25: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenGGBN Data Standard

• Implementation for ABCD and Darwin Core-Archive available

• Supported by IPT (v2.2) and BioCASe (v3.5.3)– Tests performed by BGBM, NMNH,

CSIRO, ZFMK, DSMZ• Submission to TDWG as a standard in

12/2015• Submission to GSC* as a project in

08/2015

• Support provided by BGBM• White paper submitted

* Genomic Standards Consortium

Page 26: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenUse Case: Environmental Samples and DNA• Environmental Samples already at

GGBN (bird fecal samples)–Works well with DwC-A and ABCD

• Environmental DNA at GGBN currently work in progress

Challenges:– Identification based on sequences– Hundreds of taxa– Proper search results and displaygenomic DNA (bird, plant) vs. environmental DNA (what bird has eaten) Users should find what they are looking for

Page 27: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenUse Case: Environmental Samples and DNA

• Solution for ABCD: ABCDGGBN-Enviro• http://

data.ggbn.org/schemas/ggbn/Enviro/ABCDGGBN_Enviro.html

• GGBN extension @ Identification Sequences on identification level instead on unit level

Page 28: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenUse Case: Environmental Samples and DNA

• Solution for DwC-A: work in progress• Current star schema structure does

not allow 1:n:n relations• Collabortion with GBIF and GSC/MIxS

to find a solution

Page 29: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeiten

Join GGBN!

Page 30: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenVouchers, traceability, deposition

Source: Droege et al. 2014

Every biodiversity biorepository is welcome to join GGBN.Researchers: deposit your samples and data in a GGBN collection if you don‘t have a DNA or tissue bank.GGBN provides a virtual and physical infrastructure to make your research traceable for the future.

Page 31: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeiten

go to http://data.ggbn.org to find available DNA from this specimen

Tracing back information

Page 32: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenTracing back information

Page 33: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenTracing back information

Page 34: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenPortal: Number of Samples Online by Year

2009 2010 2011 2012 2013 2014 20150

20000

40000

60000

80000

100000

120000

140000

Samples Online

Page 35: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenPortal: Number of Species Online by Year

2009 2010 2011 2012 2013 2014 20150

5000

10000

15000

20000

25000

Species Online

Page 36: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenSecond GGBN International Conference21.-24. June

2016 Berlin

Page 37: Textmasterformat bearbeiten –Zweite Ebene Dritte Ebene –Vierte Ebene »Fünfte Ebene Titelmasterformat durch Klicken bearbeiten The Global Genome Biodiversity.

• Textmasterformat bearbeiten– Zweite Ebene• Dritte Ebene

– Vierte Ebene» Fünfte Ebene

Titelmasterformat durch Klicken bearbeitenThank you

GGBN Interim Executive Committee

GGBN Members

GGBN Collaborators

GGBN Task Forces

DFG

SYNTHESYS

http://www.ggbn.org

[email protected]