Skip to main content

Biologische Datenbanken

  • Chapter
  • First Online:
Angewandte Bioinformatik

Zusammenfassung

Die wichtigste Grundlage der angewandten Bioinformatik ist die Sammlung von Sequenzdaten und damit verbundenen biologischen Informationen. Täglich fallen weltweit solche Daten beispielsweise im Rahmen von Genomsequenzierungsprojekten in sehr großen Mengen an. Um diese Daten sinnvoll nutzen zu können, ist einerseits eine strukturierte Ablage der Daten absolut notwendig, andererseits sollten die Daten von allen interessierten Wissenschaftlern weltweit eingesehen werden können. Die Zeitschrift Nucleic Acids Research widmet einmal jährlich eine Ausgabe den verfügbaren biologischen Datenbanken. Im Database‐Issue, der ersten Ausgabe im Januar, sind alle relevanten Datenbanken tabellarisch mit den zugehörigen URL verzeichnet. Darüber hinaus sind für eine Reihe von Datenbanken Originalbeiträge enthalten, in denen die Datenbanken und ihre Funktion beschrieben werden. Das Database‐Issue, das auch im Internet komplett eingesehen werden kann, stellt einen sehr guten Startpunkt für die Beschäftigung mit biologischen Datenbanken dar. Man unterscheidet bei den biologischen Datenbanken verschiedene Kategorien, entsprechend der Art der Daten. Primäre Datenbanken enthalten Sequenzinformationen (Nukleotid‐ oder Proteinsequenzen) und zugehörige Annotationen wie Funktionsinformationen, Bibliografien, Kreuzreferenzen zu weiteren Datenbanken usw. Sekundäre biologische Datenbanken hingegen fassen Ergebnisse aus Analysen primärer Proteinsequenzdatenbanken zusammen. Dabei ist das Ziel der Analysen, für Klassen von Sequenzen gemeinsame Merkmale abzuleiten, die wiederum zur Klassifizierung unbekannter Sequenzen benutzt werden können (Annotation). Darüber hinaus werden häufig alle weiteren Datenbanken, die biologische oder medizinische Information speichern, wie beispielsweise Literaturdatenbanken, unter dem Begriff der sekundären Datenbanken eingeordnet.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Institutional subscriptions

Literatur

  • Andreeva A, Howorth D, Chothia C, Kulesha E, Murzin AG (2014) SCOP2 prototype: a new approach to protein structure mining. Nucl Acids Res 42:D310–D314

    Article  CAS  PubMed  Google Scholar 

  • Attwood TK, Bradley P, Flower DR, Gaulton A et al (2003) PRINTS and its automatic supplement, prePRINTS. Nucl Acids Res 31:400–402

    Article  CAS  PubMed  PubMed Central  Google Scholar 

  • Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN, Weissig H, Shindyalov IN, Bourne PE (2000) The protein data bank. Nucl Acids Res 28:235–242

    Article  CAS  PubMed  PubMed Central  Google Scholar 

  • Falquet L, Pagni M, Bucher P, Hulo N, Sigrist CJA, Hofmann K, Bairoch A (2002) The PROSITE database, its status in 2002. Nucl Acids Res 30:235–238

    Article  CAS  PubMed  PubMed Central  Google Scholar 

  • Finn RD, Coggill P, Eberhardt RY, Eddy SR et al (2016) The Pfam protein families database: towards a more sustainable future. Nucleic Acids Res 44:D279–D285

    Article  CAS  PubMed  Google Scholar 

  • Kahraman A, Avramov A, Nashev LG, Popov D, Ternes R, Pohlenz HD, Weiss B (2005) PhenomicDB: a multi-species genotype/phenotype database for comparative phenomics. Bioinf 21:418–420

    Google Scholar 

  • Mulder NJ, Apweiler R, Attwood TK, Bairoch A (2003) The InterPro Database, 2003 brings increased coverage and new features. Nucl Acids Res 31:315–318

    Article  CAS  PubMed  PubMed Central  Google Scholar 

  • Murzin AG, Brenner SE, Hubbard T, Chothia C (1995) SCOP: a structural classification of proteins database for the investigation of sequences and structures. J Mol Biol 247:536–540

    CAS  PubMed  Google Scholar 

  • Pearl FMG, Bennett CF, Bray JE, Harrison AP et al (2003) The CATH database: an extended protein family resource for structural and functional genomics. Nucl Acids Res 31:452–455

    Article  CAS  PubMed  PubMed Central  Google Scholar 

  • Wheeler DL, Barrett T, Benson DA, Bryant SH (2006) Database resources of the National Center for Biotechnology Information. Nucl Acids Res 34:D173–D180

    Article  CAS  PubMed  Google Scholar 

  • Wu CH, Apweiler R, Bairoch A, Natale DA et al (2006) The Universal Protein Resource (UniProt): an expanding universe of protein information. Nucl Acid Res 37:D187–D191

    Article  Google Scholar 

Internetquellen

Download references

Author information

Authors and Affiliations

Authors

Rights and permissions

Reprints and permissions

Copyright information

© 2018 Springer-Verlag GmbH Deutschland

About this chapter

Check for updates. Verify currency and authenticity via CrossMark

Cite this chapter

Selzer, P.M., Marhöfer, R.J., Koch, O. (2018). Biologische Datenbanken. In: Angewandte Bioinformatik. Springer Spektrum, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-54135-7_2

Download citation

Publish with us

Policies and ethics