MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben Datenbanken und Informationssysteme...

12
MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben Datenbanken und Informationssysteme 23.04.2012

Transcript of MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben Datenbanken und Informationssysteme...

Page 1: MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben Datenbanken und Informationssysteme 23.04.2012.

MOL.504Analyse von DNA- und

Proteinsequenzen

Übungsaufgaben Datenbanken und Informationssysteme

23.04.2012

Page 2: MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben Datenbanken und Informationssysteme 23.04.2012.

MO

L.50

4 –

Übu

ngsa

ufga

ben

IÜ1 – Tutorial für NCBI

NCBI – Nucleotide: Suche nach ‚cellobiose dehydrogenase fungi‘

Page 3: MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben Datenbanken und Informationssysteme 23.04.2012.

MO

L.50

4 –

Übu

ngsa

ufga

ben

IÜ1 – Tutorial für NCBI

NCBI – Nucleotide: Suche nach ‚cellobiose dehydrogenase fungi‘

• Welche ‚Taxonomic Groups‘ (bzw. Untergruppen) werden gefunden? Siehe Liste oder Tree rechts im Fenster – für Überblick

Wieviele Einträge gibt es zu jeder Gruppe?

Wähle die cellobiose dehydrogenase aus Myriococcum thermophilum (ein Basidiomycete)

Page 4: MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben Datenbanken und Informationssysteme 23.04.2012.

MO

L.50

4 –

Übu

ngsa

ufga

ben

IÜ1 – Tutorial für NCBI

• Wähle die cellobiose dehydrogenase aus Myriococcum thermophilum und suche dazu Informationen zur:

Molekül- und Sequenztyp, Proteinsequenz und –ID/Accession Taxonomy Literatur (Pubmed) Related Sequences

Page 5: MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben Datenbanken und Informationssysteme 23.04.2012.

MO

L.50

4 –

Übu

ngsa

ufga

ben

IÜ1 – Tutorial für NCBI

• Wähle die cellobiose dehydrogenase aus Myriococcum thermophilum und suche dazu Informationen zur:

• Starte auch eine Blastn-Suche dazu (gegen nr/nt) und finde

Highly similar sequences

More dissimilar sequences

Somewhat similar sequences

Page 6: MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben Datenbanken und Informationssysteme 23.04.2012.

MO

L.50

4 –

Übu

ngsa

ufga

ben

IÜ2 – NCBI-Nucleotide

Suche nach ‚soluble epoxide hydrolase plants‘

• Welche ‚Taxonomic Groups‘ (bzw. Untergruppen) werden gefunden? Siehe Liste oder Tree rechts im Fenster – für Überblick

Wieviele Einträge gibt es zu jeder Gruppe?

• Wähle die soluble epoxide hydrolase aus Arabidopsis thaliana (Tipp: eudicots) und suche dazu Informationen zur:

Molekül- und Sequenztyp, Proteinsequenz und –ID/Accession Taxonomy Literatur (Pubmed) Related Sequences

Anmerkung: In der Ergebnis-Liste keine kompletten Chromosomen und keine „putative“-Einträge wählen

• Starte auch eine Blastn-Suche dazu (gegen nr/nt) und finde Highly similar sequences More dissimilar sequences Somewhat similar sequences

Acker-Schmalwand Arabidopsis thaliana(Bild: Wikipedia)

z.B.: Arabidopsis thaliana soluble epoxide hydrolase (SEH) mRNA, complete cdsNCBI Reference Sequence: NM_128231.2

Page 7: MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben Datenbanken und Informationssysteme 23.04.2012.

MO

L.50

4 –

Übu

ngsa

ufga

ben

IÜ3 – NCBI-Nucleotide/Protein Suche nach der Nukleotidsequenz mit der Accession-Nummer

‚NC_000964‘ : Um welche Sequenz handelt es sich?

Organismus, Molekül- und Sequenztyp, PubMed-ID ?

Suche in der Genomsequenz (mit Strg+F) nach einem Sub-Eintrag „yqjM“

• Sichere die CDS dieser Gensequenz als .txt-Datei im FASTA-Format

Auf CDS klicken

Page 8: MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben Datenbanken und Informationssysteme 23.04.2012.

MO

L.50

4 –

Übu

ngsa

ufga

ben

IÜ3 – NCBI-Nucleotide/Protein

Suche in der Genomsequenz (mit Strg+F) nach einem Sub-Eintrag „yqjM“

• Sichere die CDS dieser Gensequenz als .txt-Datei im FASTA-Format Auf CDS klicken

• Gib Informationen zu diesem Gen-Eintrag an: Sequenzstart und -ende im Genom Name des Translationsprodukts der CDS

• Gib die Accession-Nr. des korrespondierenden Proteins an und gehe mit Hilfe der Protein-ID zum Protein-Eintrag(NCBI Reference Sequence: NP_390263.1)

• Verwende die Optionen rechts auf der Seite („All links from this record“): Welches ist die nächste, verwandte Sequenzen die nicht aus Bacillus subtilis stammt?

(BLink)

Suche konservierte Domänen (Conserved Domains)

Page 9: MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben Datenbanken und Informationssysteme 23.04.2012.

MO

L.50

4 –

Übu

ngsa

ufga

ben

IÜ4 – ExPASy/ProSite

Suche in ExPASy (UniProt KB) nach:

• Prunus dulcis hydroxynitrile lyase

• Myriococcum thermophilum cellobiose dehydrogenase

• Arabidopsis thaliana soluble epoxide hydrolase

• Notiere die 3 UniProt KB Accession-Nummern

http://expasy.org/http://uniprot.org

• Gehe auf der jeweiligen Seite des Eintrags zum Abschnitt „Sequences“ und verwende das Tool „Compute pI/MW“

- Isoelektrischer Punkt ?

Molekulargewicht ?

• Gehe über das ExPASy-Menu (oder direkt: http://prosite.expasy.org/scanprosite/) zum „Scan ProSite“-Eingabeformular und gebe die jeweilige UniProt KB Accession-Nummer ein: Anmerkung: Checkbox „Exclude motifs“ deaktivieren!

– Welche Glykosilierungs-Stellen werden vorgeschlagen? Wie sieht das ‚consensus pattern‘ aus?

Page 10: MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben Datenbanken und Informationssysteme 23.04.2012.

MO

L.50

4 –

Übu

ngsa

ufga

ben

IÜ4 – ExPASy/ProSite

Suche in ExPASy (expasy.org (DB: UniProt KB) oder uniprot.org nach:

• Prunus dulcis hydroxynitrile lyase

• Myriococcum thermophilum cellobiose dehydrogenase

• Arabidopsis thaliana soluble epoxide hydrolase

• Notiere die 3 UniProt KB Accession-Nummern

• Gehe „Scan ProSite“-Eingabeformular (http://prosite.expasy.org/scanprosite/) und gebe die jeweilige UniProt KB Accession-Nummer ein:

– Welche Glykosilierungs-Stellen werden vorgeschlagen?

Anmerkung: Checkbox „Exclude motifs“ deaktivieren!

Wenn Server nicht funktionert:

Alternative: http://www.cbs.dtu.dk/services/NetNGlyc/

check correct patterns http://www.expasy.org/prosite/PDOC00001

Page 11: MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben Datenbanken und Informationssysteme 23.04.2012.

MO

L.50

4 –

Übu

ngsa

ufga

ben

IÜ4 – ExPASy/ProSite

• Prunus dulcis hydroxynitrile lyase - Glykosilierungsstellen

check correct patterns http://www.expasy.org/prosite/PDOC00001

Page 12: MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben Datenbanken und Informationssysteme 23.04.2012.

MO

L.50

4 –

Übu

ngsa

ugab

en I

Ü5 – BRENDA

Suche in der BRENDA-DB nach „Aldose Reductase“

• welche E.C.-Nummer hat dieses Enzym?

• welche Reaktion(en) wird/werden katalysiert? (Geben Sie die erste in der Liste an).

• welcher Kofaktor wird benötigt?

• aus welchen Organismen sind Aldose-Reduktasen bekannt (nennen Sie 5)?

Reduzieren Sie den Eintrag auf den Organismus Homo sapiens

• gibt es Aminosäure-Sequenzen und Strukturen (linkes Menü)?

– welche Sequenzlänge hat die menschliche Aldose-Reduktase?

• wo wurde die höchste Turnover Number, wo die höchste spezifische Aktivität beschrieben (linkes Menü)?

– Angabe der Werte

– Angabe der vollständigen Referenz