Die dreidimensionale Welt der Moleküle

3
Chemie und Computer Die dreidimensionale Welt der Moleküle Oliver Koch Die Cambridge Strukturdatenbank ist in ein System von Programmen eingebettet, um Molekülgeometrien und -interaktionen innerhalb von Molekülkristallstrukturen zu analysieren. Die Datenbank Cambridge Structural Database (CSD) des Cam- bridge Crystallographic Data Centre (CCDC) enthält nach eigenen Aus- sagen die Gesamtheit der weltweit öffentlich verfügbaren Kristallstruk- turen von kleinen organischen Mo- lekülen und metallorganischen Ver- bindungen. 1) Die CSD basiert auf Veröffentlichungen in der Primär- literatur und ist die offizielle Daten- bank für die Hinterlegung der Infor- mationen über Kristallstrukturen von über 80 Journalen. Die aktuelle Version enthält 456 637 Strukturen: dreidimensionale Atomkoordinaten sowie bibliographische und che- mische Informationen. Mit dem CSD-System lassen sich innerhalb der Datenbank Struktu- ren und Strukturmuster suchen (Conquest, WebCSD), Strukturen darstellen (Mercury), Daten aus- werten (Vista) und eigene Daten- banken erzeugen (Prequest). Die Programme Mogul (Molekülgeome- trien), Isostar (intermolekulare In- teraktionen) und Superstar (Pro- teinbindetaschen-Interaktionsmus- ter) liefern aus der CSD abgeleitete Daten. Conquest Der Startpunkt für Analysen ist meistens das Suchprogramm Con- quest (Abbildung 1). Die wichtigste seiner Suchfunktionen, die Sub- struktursuche, sucht innerhalb der CSD nach Strukturelementen und Interaktionsmustern. Die abgelegten bibliographischen Informationen wie Autor oder Name und die che- mischen Informationen wie Sum- menformeln sind ebenfalls durch- suchbar. Die Daten der gefundenen Einträ- ge inklusive der dreidimensionalen Struktur lassen sich innerhalb von Conquest betrachten. Für detaillier- te Analysen sind die Resultate in die Programme Mercury oder Vista übertragbar. Seit Neuestem lässt sich mit WebCSD, das ähnliche Suchfunktio- nen wie Conquest enthält, über ei- nen Browser auf die CSD zugreifen. Dafür stellt das kristallographische Zentrum CCDC einen öffentlichen Server bereit. Nutzer werden zudem eigene Server aufsetzen können. Mercury Das Programm Mercury zeigt nach Eingabe des sechsstelligen Re- ferenzcodes einer Struktur die Koor- Abb. 1. Das Programm Conquest mit Startpunkten für eine Suche in der kristallographischen Datenbank: a) Substrukturmuster, b) Distanz zwischen N und O=C. Nachrichten aus der Chemie | 57 | September 2009 | www.gdch.de/nachrichten 894

Transcript of Die dreidimensionale Welt der Moleküle

�Chemie und Computer�

Die dreidimensionale Welt der Moleküle

Oliver Koch

Die Cambridge Strukturdatenbank ist in ein System von Programmen eingebettet, um

Molekülgeometrien und -interaktionen innerhalb von Molekülkristallstrukturen zu analysieren.

� Die Datenbank Cambridge Structural Database (CSD) des Cam-bridge Crystallographic Data Centre (CCDC) enthält nach eigenen Aus-sagen die Gesamtheit der weltweit öffentlich verfügbaren Kristallstruk-turen von kleinen organischen Mo-lekülen und metallorganischen Ver-bindungen.1) Die CSD basiert auf Veröffentlichungen in der Primär-literatur und ist die offizielle Daten-bank für die Hinterlegung der Infor-mationen über Kristallstrukturen von über 80 Journalen. Die aktuelle

Version enthält 456 637 Strukturen: dreidimensionale Atomkoordinaten sowie bibliographische und che-mische Informationen.

Mit dem CSD-System lassen sich innerhalb der Datenbank Struktu-ren und Strukturmuster suchen (Conquest, WebCSD), Strukturen darstellen (Mercury), Daten aus-werten (Vista) und eigene Daten-banken erzeugen (Prequest). Die Programme Mogul (Molekülgeome-trien), Isostar (intermolekulare In-teraktionen) und Superstar (Pro-

teinbindetaschen-Interaktionsmus-ter) liefern aus der CSD abgeleitete Daten.

Conquest

� Der Startpunkt für Analysen ist meistens das Suchprogramm Con-quest (Abbildung 1). Die wichtigste seiner Suchfunktionen, die Sub-struktursuche, sucht innerhalb der CSD nach Strukturelementen und Interaktionsmustern. Die abgelegten bibliographischen Informationen wie Autor oder Name und die che-mischen Informationen wie Sum-menformeln sind ebenfalls durch-suchbar.

Die Daten der gefundenen Einträ-ge inklusive der dreidimensionalen Struktur lassen sich innerhalb von Conquest betrachten. Für detaillier-te Analysen sind die Resultate in die Programme Mercury oder Vista übertragbar.

Seit Neuestem lässt sich mit WebCSD, das ähnliche Suchfunktio-nen wie Conquest enthält, über ei-nen Browser auf die CSD zugreifen. Dafür stellt das kristallographische Zentrum CCDC einen öffentlichen Server bereit. Nutzer werden zudem eigene Server aufsetzen können.

Mercury

� Das Programm Mercury zeigt nach Eingabe des sechsstelligen Re-ferenzcodes einer Struktur die Koor-

Abb. 1. Das Programm Conquest mit Startpunkten für eine Suche in der kristallographischen Datenbank:

a) Substrukturmuster, b) Distanz zwischen N und O=C.

Nachrichten aus der Chemie | 57 | September 2009 | www.gdch.de/nachrichten

894

dinaten direkt an. Ansonsten ver-arbeitet das Programm die Trefferlis-te aus einer Conquest-Suche.

Die frei verfügbare Version von Mecury enthält grundsätzliche Funktionen eines Visualisierers, kombiniert mit Analysen von bei-spielsweise Wasserstoffbrücken oder Molekülgeometrien innerhalb der Kristallstrukturen (Abbildung 2).

Die lizenzierte Version gestattet unter anderem, die Moleküle zu be-arbeiten, und sie visualisiert zudem Daten aus den Programmen Mogul und Isostar. Mit dem zusätzlichen Modul Materials lassen sich Kristall-packungseffekte und -interaktionen besser untersuchen.

Vista und Mogul

� Wurden in der Conquest-Suche Geometrien wie Torsionswinkel oder Abstände definiert, lassen sich diese mit dem Programm Vista ana-lysieren. Es stellt die Daten zum Beispiel in Histogrammen dar und untersucht sie statistisch mit linea-rer Regression oder Hauptkom-ponentenanalyse. Das besondere an den Vista-Analysen ist, dass die Datenpunkte mit den Ausgangs-strukturen verlinkt sind. Dies er-laubt eine genauere Analyse von Datenpunkten in den Original-Kris-tallstrukturen.

Das Programm Mogul enthält eine Bibliothek von bevorzugten Molekülgeometrien, die aus der CSD abgeleitet wurden. So sind Molekül-konformationen überprüfbar, indem das Programm beispielsweise Torsi-onswinkel innerhalb des Moleküls mit denen in den Kristallstrukturen vergleicht.

Isostar und Superstar

� Das Programm Isostar informiert über intermolekulare Interaktionen in Form von Scatterplots, welche die bevorzugte Verteilung von In-teraktionsgruppen um eine zentrale Gruppe zeigen. Zusätzlich zu den Daten aus der CSD liegen Protein-Ligand-Interaktionen aus der Pro-teindatenbank (Protein Data Bank, www.pdb.org) vor.

Die optionale Komponente Su-perstar nutzt die Information aus Isostar, um bevorzugte Interakti-onspunkte in einer Proteinbindeta-sche zu untersuchen und anzuzei-gen.

Das System

� Es sind überwiegend akademi-sche Einrichtungen, die Kristall-strukturen zur CSD beitragen. Sie stellen die Strukturdaten frei zur Verfügung, Datenbanknutzer müs-sen Zugriffe aber bezahlen. Dies stört viele Kritiker, die aber beden-ken sollten, dass das CCDC die Da-ten übernehmen und pflegen muss und zudem die Software weiter ent-wickelt.

Die Strukturen, die als zusätzli-che Daten für eine Veröffent-lichung zur Verfügung stehen, sind frei verfügbar. Sie lassen sich über ein Web-Frontend anfordern (www.ccdc.cam.ac.uk/products/csd/ request).

Das CSD-System ermöglicht ei-ne Analyse von Interaktionen und Molekülgeometrien anhand von ge-messenen Daten und kann sich im industriellen Umfeld somit als Hilfsmittel für strukturbasiertes

Design und medizinische Chemie erweisen.2)

Auch die Analyse unterschiedli-cher Kristallformen und der dafür zugrunde liegenden Kristall-packungsinteraktionen gewinnt an Bedeutung. Unterschiedliche Kris-tallformen können unterschiedli-che Eigenschaften zeigen und die reproduzierbare Herstellung be-stimmter Kristallformen ist bei-spielsweise in der Arzneimittelpro-duktion wichtig.

An manchen Stellen wirkt die Nutzeroberfläche der Programme nicht ganz zeitgemäß (Vista), dies beeinflusst deren Funktionalität aber nicht.

In der Lehre

� Ein spezielles Handbuch der Dokumentation beschreibt die in der Lehre nutzbaren Daten über Kristallstrukturen mit Beispielen. Mit der freien Version des Visuali-sierers Mercury lässt sich ein frei ver-fügbarer Datensatz mit 500 Struktu-ren analysieren, der speziell auf Lehrtätigkeiten ausgerichtet ist (www.ccdc.cam.ac.uk/free_services /teaching). Damit erfahren Studie-rende aus gemessenen Daten zum

Abb. 2. Der Visualisierer Mercury mit einem Ergebnis der Substruktursuche aus Abb 1a:

Kristallpackung und Interaktionsmuster zwischen den Säurefunktionen.

Nachrichten aus der Chemie | 57 | September 2009 | www.gdch.de/nachrichten

Strukturchemie|Chemie und Computer �Blickpunkt� 895

Beispiel etwas über die Konforma-tionen von Ringsystemen oder über Stereoisomere im dreidimensiona-len Raum.

Inhaber einer Conquest-Lizenz können außerdem unbegrenzt Classroom-Conquest-Kopien in-stallieren. Diese Version ist voll funktionsfähig, es lässt sich aber nur eine Teilmenge der CSD durch-suchen. Um ausführlichere Ana-lysen mit Studenten durchführen zu können, sind alle Programme in-nerhalb des CSD-Systems notwen-dig. Akademische Einrichtungen erhalten entsprechende Lizenzen zu einem reduzierten Preis.

Oliver Koch arbeitet seit dem Jahr 2008 in der

Arzneistoffentwicklung und Biocheminforma-

tik in einer Kooperation zwischen dem Tier-

gesundheitsunternehmen Intervet Innovati-

on, Schwabenheim, und dem Lifescience- und

Chemieunternehmen Molisa, Magdeburg. Er

studierte Pharmazie in Marburg, promovierte

dort in Wirkstoffdesign und war Postdokto-

rand am Cambridge Crystallographic Data

Centre in Cambridge, Großbritannien.

[email protected]

Information und Literatur

1) www.ccdc.cam.ac.uk

2) K. A. Brameld, B. Kuhn, D. C. Reuter,

M. Stahl, J. Chem. Inf. Model. 2008, 48, 1.

� Auf einen Blick

Das Softwaresystem liefert eine

Datenbank über dreidimensio-

nale Kristallstrukturdaten von

organischen und metallorgani-

schen Verbindungen sowie eine

Programmsammlung zu deren

Analyse.

Drei DVDs enthalten die Instal-

lations- und Datenbank-Datei-

en für Windows, Linux und Mac

OS X. Der Isostar-Server steht

allerdings nur für Linux zur Ver-

fügung.

Es gibt eine Installationsdoku-

mentation und ein Handbuch

mit Tutorien, insbesondere für

die Lehre. Dokumentationen

sind als PDF- oder HTML-Ver-

sion verfügbar.

www.ccdc.cam.ac.uk/products/csd

Kurz notiert

den und weltweit zugestellt. Sollte der Autor meinen, einen Bestseller verfasst zu haben, kann er den Kun-denpreis erhöhen und sich den Pro-fit mit Lulu teilen. Seit kurzem sind alle bei Lulu erscheinenden Bücher über amazon.com zu bestellen, was Vorteile bei der Verwendung von Firmenkonten etc. haben kann. www.lulu.com

W. D. Ihlenfeldt, [email protected]

Office-Dokumente komprimieren

� Balesio bietet mit dem Filemini-mizer eine Software, die Dateien im MS-Office-Format (Version 97 bis 2007) komprimiert ohne den Datei-typ wie Word, Excel oder Power-point zu verändern. So ist kein sepa-rates Programm zum Entpacken not-wendig, die Datei lässt sich mit der Office-Anwendung öffnen. Es sind Komprimierungsraten von bis zu 98 Prozent erreichbar. Eine Kompakt-version des Programms ist von CD-ROM oder USB-Stick verwendbar. Es gibt zudem eine Servervariante, die automatisch komprimiert. Weitere Informationen und eine kostenlose Testversion gibt es bei Balesio. www.balesio.com

Anselm Horn, Erlangen-Nürnberg

Fachdokumente in Kleinauflagen

� Dokumentationen zu Projekten und Produkten sowie Publikationen elektronisch als PDF-Dateien aus-zutauschen hat einerseits Vorteile, et-wa das einfache Nachschlagen von Details direkt am Arbeitsplatz. Ande-rerseits nimmt mancher lieber ein ge-drucktes Exemplar zur Hand. Aller-dings ist es oft nicht wirtschaftlich, umfangreiche Werke in Kleinauflage drucken und binden zu lassen. Gleichzeitig ist es eine Zumutung für den Leser, Hunderte von Seiten auf dem Bürodrucker zu drucken.

On-demand-Publisher haben die-ses Problem als Geschäftsfeld ent-deckt. Einer der Pioniere und Markt-führer ist das Unternehmen Lulu mit der Website lulu.com. Dort lassen sich ohne Einstandskosten PDF-Do-kumente hochladen, zu Büchern zu-sammenfassen und mit einen Einband editor grafisch gestalten. Das Format und die Seitenzahl be-stimmen einen Basispreis, zu dem ein Buch sofort nach dem Up load bei Lulu zu bestellen ist. Dieser Preis ist niedriger als die beim Selbstaus -drucken anfallenden Kosten.

Ist das Buch bestellt, wird doppel-seitig gedruckt, professionell gebun-

Die Website lulu.com bietet eine neue Vertriebsform für gedruckte Kleinauflagen.

�Blickpunkt� Chemie und Computer|Strukturchemie 896

Nachrichten aus der Chemie | 57 | September 2009 | www.gdch.de/nachrichten