Protein-Ligand-Komplexe und Proteine dreidimensional

3
Chemie und Computer Protein-Ligand-Komplexe und Proteine dreidimensional Oliver Koch Die Datenbank Relibase bietet Such- und Analysefunktionen. Strukturen aus der öffentlich zugänglichen Proteindatenbank sind integriert, eigene Strukturdaten lassen sich hinzufügen. Das Datenbanksystem Relibase+ (Receptor Ligand Database) vom Cambridge Crystallographic Data Centre CCDC speichert dreidimen- sionale Strukturinformationen über Proteine und Protein-Ligand-Kom- plexe. 1) Damit sind beispielsweise Protein-Ligand-Interaktionen inner- halb einer Proteinbindetasche ana- lysierbar. Die integrierten, öffentlich zugänglichen Daten aus der Protein- datenbank (PDB) 2) lassen sich um eigene Strukturdaten ergänzen und damit gemeinsam untersuchen. Relibase+ ist ein Server-Client- basiertes System. Alle Funktionen sind entweder über eine Webschnitt- stelle und einen Browser oder eine auf der Skriptsprache Python beru- henden Kommandozeilenschnitt- stelle (Reliscript) ausführbar. Die aktuelle Programmversion 3.0 basiert auf einer frei wählbaren SQL-Datenbank und lässt sich so in eine bestehende IT-Infrastruktur einbauen. Daten finden und verbinden Auf der Startseite des Programms stehen im Webbrowser Menüpunk- te, über die man zur Text-, Sequenz- oder SMILES-Suche gelangt. Der Mo- lekülzeichner Sketcher nimmt strukturbasierte Suchkriterien auf. Die Textsuche nach Autoren, Ligandennamen oder Stichwörtern liefert Daten, die zusätzlich zu den Atomkoordinaten zu jedem Protein- eintrag gespeichert sind. Über eine Vier-Zeichen-Kennung (im All- gemeinen die PDB-Kennung) greift der Nutzer direkt auf den passenden Eintrag zu. Die Sequenzsuche ermittelt Pro- teine mit ähnlicher Sequenz. Die SMILES-Substruktursuche er- möglicht eine strukturbasierte Suche nach Liganden oder Teilen davon. Die Suche lässt sich mit SMILES- oder SMART-Codes definieren und liefert sowohl exakte als auch ähnliche Übereinstimmungen innerhalb der gespeicherten Liganden. Die Codes SMILES und SMART beschreiben die 2D-Ligandenstruktur eindimensional in Form einer ASCII-Zeichenkette. Mit Sketcher lassen sich struktur- basierte Suchkriterien definieren, die zudem Protein-Ligand-Inter- aktionen enthalten können. Für die Abb. 1. Der Molekülzeichner für die 2D/3D-Substruktursuche. Grüne Linien und Punkte definieren hier die Distanz zwischen den Zentren der aromatischen Ringe eines Liganden und Phenylalanin sowie einen Torsionswinkel zur geometrischen Beschreibung der Phenyl- alanin-Konfigurtion. Nachrichten aus der Chemie | 57 | Dezember 2009 | www.gdch.de/nachrichten 1211

Transcript of Protein-Ligand-Komplexe und Proteine dreidimensional

�Chemie und Computer�

Protein-Ligand-Komplexe und Proteine dreidimensional

Oliver Koch

Die Datenbank Relibase bietet Such- und Analysefunktionen. Strukturen aus der öffentlich zugänglichen

Proteindatenbank sind integriert, eigene Strukturdaten lassen sich hinzufügen.

� Das Datenbanksystem Relibase+ (Receptor Ligand Database) vom Cambridge Crystallographic Data Centre CCDC speichert dreidimen-sionale Strukturinformationen über Proteine und Protein-Ligand-Kom-plexe.1) Damit sind beispielsweise Protein-Ligand-Interaktionen inner-halb einer Proteinbindetasche ana-lysierbar. Die integrierten, öffentlich zugänglichen Daten aus der Protein-datenbank (PDB)2) lassen sich um eigene Strukturdaten ergänzen und damit gemeinsam untersuchen.

Relibase+ ist ein Server-Client-basiertes System. Alle Funktionen sind entweder über eine Webschnitt-stelle und einen Browser oder eine auf der Skriptsprache Python beru-henden Kommandozeilenschnitt-stelle (Reliscript) ausführbar.

Die aktuelle Programmversion 3.0 basiert auf einer frei wählbaren SQL-Datenbank und lässt sich so in eine bestehende IT-Infrastruktur einbauen.

Daten finden und verbinden

� Auf der Startseite des Programms stehen im Webbrowser Menüpunk-te, über die man zur Text-, Sequenz- oder SMILES-Suche gelangt. Der Mo-lekülzeichner Sketcher nimmt strukturbasierte Suchkriterien auf.

Die Textsuche nach Autoren, Ligandennamen oder Stichwörtern liefert Daten, die zusätzlich zu den Atomkoordinaten zu jedem Protein-

eintrag gespeichert sind. Über eine Vier-Zeichen-Kennung (im All-gemeinen die PDB-Kennung) greift der Nutzer direkt auf den passenden Eintrag zu.

Die Sequenzsuche ermittelt Pro-teine mit ähnlicher Sequenz.

Die SMILES-Substruktursuche er-möglicht eine strukturbasierte Suche nach Liganden oder Teilen davon. Die Suche lässt sich mit SMILES- oder

SMART-Codes definieren und liefert sowohl exakte als auch ähnliche Übereinstimmungen innerhalb der gespeicherten Liganden. Die Codes SMILES und SMART beschreiben die 2D-Ligandenstruktur eindimensional in Form einer ASCII-Zeichenkette.

Mit Sketcher lassen sich struktur-basierte Suchkriterien definieren, die zudem Protein-Ligand-Inter-aktionen enthalten können. Für die

Abb. 1. Der Molekülzeichner für die 2D/3D-Substruktursuche. Grüne Linien und Punkte

definieren hier die Distanz zwischen den Zentren der aromatischen Ringe eines Liganden

und Phenylalanin sowie einen Torsionswinkel zur geometrischen Beschreibung der Phenyl -

alanin-Konfigurtion.

Nachrichten aus der Chemie | 57 | Dezember 2009 | www.gdch.de/nachrichten

1211

Abb. 2. Ergebnisseite einer Stichwortsuche nach „serine protease“.

zwei- und dreidimensionale Sub-struktursuche zeichnet der Nutzer zunächst mit Sketcher Molekül-strukturen. Zusätzlich sind geo-metrische Beschreibungen, Protein-Ligand-Wechselwirkungen und Se-kundärstrukturinformationen defi-nierbar (Abbildung 1). Dadurch lässt sich zum Beispiel eine gesuchte Wasserstoffbrücke zwischen einem Liganden und einem Protein mit ei-ner maximalen Distanz zwischen

den Ligand- und Protein-Atomen definieren.

Die Suchergebnisse sind entwe-der als einzelne Suchresultate oder in Trefferlisten speicherbar. Diese sind bei Bedarf neue Startpunkte für verfeinerte Suchen.

Zeigen und verzweigen

� Nach erfolgreicher Suche zeigt ei-ne Ergebnisseite die Resultate (Ab-bildung 2): Der rechte Teil des Fens-ters enthält vertiefende Informatio-nen zu einzelnen Einträgen. Die Er-gebnisseite bietet allgemeine Pro-tein- und Ligandeninformationen und einem eingebauten 3D-Visuali-sierer (Astexviewer).3) Zudem ver-weist die Ergebnisseite auf Sekun-därstrukturinformationen (Modul Secbase), auf die Anzeige und Suche nach Proteintaschen (Modul Cavba-se) sowie auf die Ansicht von Was-serstrukturen innerhalb eines Pro-teins (Modul Waterbase).

Die Module enthalten aus den Proteinstrukturen abgeleitete Infor-

mationen, die über die in den Origi-nal-PDB-Dateien enthaltenen Daten hinausgehen. Zudem lassen sich beim manuellen Hinzufügen von Strukturdaten eigene Verweise ein-fügen, die ebenfalls in dieser Über-sicht erscheinen und beispielsweise zu internen Projektdaten führen.

Secbase enthält neben Original-PDB-Zuweisungen eine neue, ein-heitliche Zuweisung von Sekundär-strukturen wie Turns und Helices. PDB-Dateien berücksichtigen Turns nur rudimentär und uneinheitlich, obwohl sie in der Ligandenbindung und in Prozessen der molekularen Er-kennung zwischen Proteinen oder Proteinen und einem Peptidsubstrat wichtig sein können. Die Turn-Zu-weisung in Relibase+ basiert auf einer Clustermethode und führt zur Klassi-fikation aller Turn-Familien. Zusätz-lich zeigt die darauf aufbauende He-lix-Zuweisung im Bereich des Helix-C-Terminus eine einheitlichere Klas-sifizierung als die der PDB-Dateien.

Die Funktionen des Astexviewers sind in der neuesten Version erwei-tert, damit Nutzer die Sekundär-strukturinformationen im Einzelnen betrachten können (Abbildung 3).

Das Programm Hermes schließ-lich visualisiert Proteine und Pro-tein-Ligand-Komplexe außerhalb des Browsers.

In der Praxis

� Relibase+ bietet im Ausliefe-rungszustand einen umfangreichen Datenbestand, der besonders im ra-tionalen Wirkstoffdesign nützlich ist. Ein Beispiel ist die 2D-/3D-Sub-struktursuche, die den Nutzer von den vorhandenen Protein-Ligand-Komplexen zu spezifischen Inter-aktionen führt. Die Überlagerung von Bindetaschen ähnlicher Proteine ermöglicht die Analyse von Ligand-induzierter Proteinflexibilität und von konservierten Wassermolekü-len. Ausgehend von einem Protein-Ligand-Komplex werden dazu die Bindetaschen von allen Proteinen mit einer definierten Sequenzidenti-tät überlagert. Selbst wenn keine oder nur eine geringe Sequenziden-tität zwischen den zu vergleichen-

� Auf einen Blick

Relibase+ ist ein Server-Client-basiertes Datenbank-

system. Die Client-Software steht für Linux und

Windows zur Verfügung, der Server ist nur unter

Linux installierbar. Auf die Daten und die zugehö -

rigen Such- und Analysefunktionen lässt sich über

eine Webschnittstelle oder ein Python-basiertes

Kommandozeileninterface zugreifen.

Die Software wird auf einer USB-Festplatte geliefert.

Akademische Nutzer können kostenlos auf die Web-

version von Relibase zugreifen.

www.ccdc.cam.ac.uk/free_services/relibase_free

�Blickpunkt� Chemie und Computer 1212

Nachrichten aus der Chemie | 57 | Dezember 2009 | www.gdch.de/nachrichten

den Proteinen existiert, ist eine Überlagerung der entsprechenden Kavitäten möglich. Speziell dafür gibt es das Modul Cavbase. Bei der Überlagerung nutzt das Modul die Struktur der Oberfläche und die Ei-genschaften der Aminosäuren als vergleichbare Kennzeichen. So las-sen sich zum Beispiel Ähnlichkeiten zwischen Proteinbindetaschen ent-decken, die für unerwartete Ligan-denbindung verantwortlich sein können. Zudem sind damit Ideen für neue Leitstrukturen generierbar.

Hauseigene Kristallstrukturdaten in Relibase+ zu hinterlegen, kann gerade für die Industrie sinnvoll sein. Der Zugriff mit dem Web-browser macht es dabei einfach, auf diese Daten von verschiedenen Stel-len aus zuzugreifen. Mit den um-fangreichen Such- und Analysefunk-tionen lassen sich die hauseigenen Daten zusammen mit den öffentlich zugänglichen Daten aus der PDB analysieren.

Die auf Java basierende Derby-Datenbank ist im System vorbereitet,

zudem ist die Datenbasis vorhanden, um den Server mit Datenbanksyste-men wie Oracle oder MySQL zu nut-zen. Vorherige Versionen bauten da-gegen auf einem eigenen Daten-banksystem auf.

Der Anwender, der vor Python nicht zurückschreckt, kann mit Re-liscript umfangreiche und komplexe Analysen durchführen, die nicht auf die vorhandenen Funktionalitäten beschränkt sind.

Oliver Koch arbeitet seit dem Jahr 2008 in der

Arzneistoffentwicklung und Biocheminforma-

tik in einer Kooperation zwischen dem Tier-

gesundheitsunternehmen Intervet Innovati-

on, Schwabenheim, und dem Lifescience- und

Chemieunternehmen Molisa, Magdeburg. Er

studierte Pharmazie in Marburg, promovierte

dort in Wirkstoffdesign und war Postdokto-

rand am Cambridge Crystallographic Data

Centre in Cambridge, Großbritannien.

[email protected]

Internet

1) www.ccdc.cam.ac.uk

2) www.pdb.org

3) www.astex-therapeutics.com/

AstexViewer

Abb. 3. Astexviewer mit einer Erweiterung, um innerhalb der Sekundärstrukturinformatio-

nen zu navigieren.

Kurz notiert

Nachfolger für Crossfire

� Seit Juli ist die Testphase des Datenbanksystems Reaxys beendet, dem Nachfolger von Crossfire zur Recherche in Beilstein, Gmelin und Patent Chemistry. Elsevier bietet nun mit dem webbasierten, ein-fachen Interface von Reaxys die ge-meinsame Suche und Analyse. Da-mit ist die chemische Literatur ab dem Jahr 1771 mit etwa 18 Mio. Verbindungen und mehr als 25 Mio. (einstufigen und mehrstufigen) chemischen Reaktionen und Syn-thesen inklusive der physikalisch-chemischen Daten mit einen Hand-schlag zugänglich.

Die Arbeitsplattform enthält ei-nen Syntheseplaner, erweiterte Suchfunktionen, Filter für Sucher-gebnisse, Ähnlichkeitssuchen und Transformationsanalysen. Synthe-sechemiker greifen mit dem Werk-zeug auf validierte, experimentelle Informationen zu.

Systemvoraussetzung für Reaxys sind die Browser IE, Firefox oder Sa-fari mit Java Runtime Environment. Als Struktureingabemöglichkeiten werden Marvin Sketch, ISIS- und Symyx-Draw oder der hauseigene Crossfire-Struktureditor unterstützt. www.reaxys.com

Thomas Engel, LMU München

FIZ Karlsruhe macht Chemical Abstracts

� Ab Januar indexieren Wissen-schaftler beim Fachinformations-zentrum (FIZ) Karlsruhe Literatur für die Datenbank Chemical Ab -stracts (CA). Sie ergänzen damit die Arbeit von Wissenschaftlern in den Vereinigten Staaten, Indien, China und Japan, die den Hauptbeitrag für den CA Service leisten. Darüber hi-naus übernimmt das FIZ im deutschsprachigen Raum den Kun-denservice des Online-Dienstes für Patent- und Forschungsinformatio-nen (The Scientific and Technical In-formation Network, STN). www.fiz-karlsruhe.de

Chemie und Computer �Blickpunkt� 1213

Nachrichten aus der Chemie | 57 | Dezember 2009 | www.gdch.de/nachrichten