Bioinformatik-Harvester
Der Bioinformatik-Harvester (englisch harvester, ?die Erntemaschine, -arbeiterin?) ist eine Bioinformatik-Meta-Suchmaschine über Gene und Proteine von Mensch, Maus und Ratte. Der Harvester vereint oder verlinkt den Inhalt von ca. 16 häufig verwendeten Bioinformatik-Ressourcen. Ein spezielles "ranking"-Verfahren (ähnlich dem Google-Pagerank) sortiert vorab die Informationen und präsentiert dem Benutzer die relevantesten Suchergebnisse in sehr kurzer Zeit.Funktionsweise
Der Harvester sammelt Informationen von Protein-/Gen-Datenbanken und sogenannten Vorhersage- oder "prediction"-Servern. Dazu simuliert der Harvester einen menschlichen Benutzer, ruft die entsprechende externe Datenbankseite auf und speichert diese auf lokalen Festplatten ab. Als Basis zum Sammeln der Informationen dienten die Uniprot-Protein-Datenbank des Uniprot-Konsortiums und die IPI Datenbank (international protein index). Die Harvester-Sammlung umfasst derzeit:
thumb|_Ein_screenshot_des_[http://harvester.fzk.de/_Harvester_]_
* Mensch: ~ 72.000 Seiten
* Maus: ~ 54.000 Seiten
* Ratte: ~ 41.000 Seiten
* Zebrafish: ~ 45.000 Seiten
* Arabidopsis: ~ 34.000 Seiten
Harvester vereint folgende bioinformatische Informationen
Textbasierte Informationen
...von den folgenden Datenbanken
Uniprot, weltweit größte Protein-Datenbank
SOURCE, übersichtliche Darstellung von Geninformationen
Simple Modular Architecture Research Tool (SMART),
SOSUI, untersucht Transmembrandomänen
PSORT, Vorhersage für Protein-Lokalisierung
Homologene, vergleicht Proteine verschiedener Spezies
gfp-cdna, Protein-Lokalisierung mit Hilfe von Fluoreszenzmikroskopie
International Protein Index (IPI).
OMIM, Umfangreiche Datenbank über Genveränderungen im Menschen
Datenbanken reich an graphischen Elementen
werden nicht "gesammelt", sondern in sogenannten iframes verlinkt. Iframes sind eine Art durchsichtiges Fenster auf einer HTML-Seite. Durch dieses Fenster kann man in Echtzeit auf entsprechende externe Datenbanken "hindurchsehen". Mehrere solcher iframe-Fenster werden auf einer Harvester-Protein-Seite kombiniert. Diese Methode erlaubt es, alle Informationen der verschiedenen Datenbanken auf einen Blick zu betrachten und zu vergleichen.
Derzeit werden folgende Server mittels iframes auf Harvester-Seiten vereint:
NCBI-BLAST, findet lokale Sequenzübereinstimmungen
Conserved Domain Database findet Proteindomänen bekannter Funktion
Ensembl, Automatische Genannotation. Ein Projekt von EMBL-EBI und Sanger-Institut
RZPD, Deutsches Ressourcenzentrum für Genomforschung in Berlin/Heidelberg
STRING, Server für die Darstellung von interagierenden Genen und Proteinen am EMBL
iHOP, verlinkt Literatur (pubmed) mit Hilfe von Gen- und Protein-Synonymen
Zfin, Zebrafisch spezifische Datenbank
"Linkouts"
"Linkouts" verlinken zu externen Suchmaschinen oder bioinformatischen Serviceeinrichtungen.
Genome-Browser, übersichtliche Darstellung aktueller Genome von der UCSC
Mitocheck, Fluoreszenz-movies von siRNA Experimenten in Zellkulturen
NCBI-Entrez, Meta-Suchmaschine des National Center for Biotechnology
PolyMeta, Metasuchemaschine über PubMed, Scirus und andere Quellen Wissenschaftlicher Publikationen
Google_Scholar, Google´s Literatursuche
Literatur
* Liebel,U., & Kindler,B.,Pepperkok,R. (2004) 'Harvester': a fast meta search engine of human protein resources. Bioinformatics. 2004 Aug 12;20(12):1962-3. Epub 2004 Feb 26.[http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=pubmed&dopt=Abstract&list_uids=14988114&query_hl=5&itool=pubmed_docsum]
* Liebel,U., & Kindler,B.,Pepperkok,R. (2005) Bioinformatic "Harvester": a search engine for genome-wide human, mouse, and rat protein resources. Methods Enzymol. 2005;404:19-26[http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=pubmed&dopt=Abstract&list_uids=16413254&query_hl=3&itool=pubmed_docsum]
Weblinks
• Harvester III search engine at KIT Karlsruhe Institute of Technology

