 |
ChEBI Downloads
Die ChEBI-Daten liegen in vier verschiedenen Formaten auf
dem ChEBI EBI FTP
Server zum Herunterladen bereit.
Download Formaten
ChEBI can be downloaded in the following formats.
- Flat-File Table-Dumps
Die ChEBI-Daten werden in einer relationalen Datenbank gespeichert und in
der Form von Flat-Files zum Herunterladen bereit gestellt wobei als
Delimiter das Tabulator-Zeichen verwendet wird. Die Dateien lassen
sich mit einem beliebigen Tabellenkalkulationsprogramm bearbeiten oder in
eine Datenbank importieren (entweder direkt oder über ein
Zusatzprogramm). Die Verzeichnisstruktur entspricht dabei den
einzelnen Tabellen oder, in anderen Worten, jedem Flat-File entspricht
eine Tabelle in der Datenbank.
- Binäre Table-Dumps (Oracle)
ChEBI stellt seine Daten auch als binäre Table-Dumps zur Verfügung.
Diese können mithilfe des "imp"-Befehls in eine Oracle-Datenbank importiert
werden wobei zu beachten gilt, dass sich die Parameterdatei
import.par bei dessen Ausführung zusammen mit den Table-Dumps im
Import-Verzeichnis befinden sollte. Der vollständige Befehl lautet wie folgt:
imp database_name/database_password@Instance_name PARFILE=import.par
- Generische SQL (Structured Query Language) Table-Dumps
Dies ist ein generischer, d.h. auf allen mit dem SQL-Standard
kompatiblen Datenbanken ausführbarer, SQL-Dump bestehend aus
Insert-Befehlsfolgen der SQL-Sprache. Das komprimierte Dateiarchiv generic_dump.zip
besteht aus 12 Dateien in denen die Daten jeweils einer
Datenbankentabelle in der Form von Insert-Befehlen vorliegen. Zu beachten ist,
dass das Skript compounds.sql vor allen anderen ausgeführt werden
sollte, da es andernfalls zu Problemen mit
den Integritätsbedingungen (constraints) kommen kann. Im selben
Dateiarchiv befinden sich zudem Tabellenerstellungsskripte für
MySQL und PostgreSQL,
welche aufgrund der generischen Eigenschaften der SQL-Sprache für alle damit
kompatiblen Datenbanken verwendet werden können.
- Ontologie Format (OBO)
ChEBI stellt die ChEBI Ontologie im OBO-Format in der Version 1.2 bereit. Weitere
Informationen über das OBO-Format finden sich auf der OBO-Webseite oder
der Gene
Ontology-Webseite. Ein zweckmässiges Programm zur Einsicht der
OBO-Datei ist z.B.
OBO-edit.
- SDF-Datei
ChEBI stellt seine chemischen Strukturen und die zusätzlichen Daten im
SDF-Format zur Verfügung. Es stehen zwei Varianten zur Verfügung:
- Die Datei Chebi_lite.sdf enthält nur die chemische Struktur, die ChEBI-Id und den ChEBI-Namen.
- Die Datei Chebi_complete.sdf enthält alle chemischen Strukturen und die dazugehörigen
Informationen. Beachten Sie, dass hier keine Ontologie-Informationen
enthalten sind, da diese keine Strukturen enthalten und deshalb nicht
dargestellt werden können.
Mehr Informationen über das SDF-Format, das in ChEBI genutzt wird, enthält das Entwicklerhandbuch.
Weiter Informationen zu verschiedenen Formaten sind in der Datei README.txt und Entwicklerhandbuch enthalten.
|