Computergestützte Biologie entwickelt sich mit dem Aufkommen neuer Technologien rasch weiter, insbesondere was die Art und Weise betrifft, wie wir Daten sammeln, analysieren und visualisieren. Dr. Ragothaman Yennmalli, ein Kolabtree Freiberufler und Wissenschaftler, untersucht vier vielversprechende Fortschritte.
Anknüpfend an die vorheriger Einführungsbeitrag, here I will highlight some of the recent trends or recent advances in the biological sciences that are transforming computational biology. These advances rely heavily on computational tools and methods — big Datenanalyse, multiscale modelling, etc. Some of them are listed below.
1. Große Daten
This is a well known term in computer science and has been picked by biologists only recently. Thanks to the next generation sequencing techniques, the sequence of a genome can be obtained in relatively shorter time. For example, the relevance of generating data quickly is magnified when working with metagenomic data or a microbiome. How can one manage the data? What about storage for long term? What are the tools for analyzing such massive data? These questions arise and they do have answers. As mentioned this is a recent trend in biology but not in computer science or experimental Physikin denen der Umgang mit und die Analyse von Big Data zur Routinearbeit gehören.
One particular instance where Forschung is happening is in the file formats of biological big data. In the case of protein structure file format, the current standard is the .pdb format, a column dependent format that is parseable and both human and machine readable. However, this format fails when describing mega structures, such as the ribosome or full viral capsids. Hence, a new format has been proposed called the .pdbx format that overcomes the previous format’s limitations. There is also another format called MMTF format that spees up the loading time for structures with more then 20 million atoms within seconds.
Weitere Lektüre zu Big Data in der Datenverarbeitung Strukturbiologie:
http://science.sciencemag.org/content/355/6322/248
2. Kryo-EM und XFEL-Techniken
Diese beiden Methoden sind an sich nicht neu. Die aktuelle Technologie und die Fortschritte, die in diesen beiden Bereichen erzielt werden, verschieben jedoch die Grenzen der Analyse biomolekularer Strukturen. Kryo-EM ist eine Technik zur Erfassung der dreidimensionalen Struktur eines Biomoleküls mit Hilfe des Elektronenmikroskops mit hoher Auflösung. In einem der Pionierlabors des NIH wurde eine 2,5Å-Struktur gelöst. Diese Auflösung wird in der Regel mit der Kristallstruktur von Proteinen erreicht, was routinemäßig mindestens 1-2 Monate Zeit in Anspruch nimmt, um den optimalen Kristall zu standardisieren, der unter dem Röntgenstrahl aufgenommen werden soll.
In contrast, a recent technique that is revolutionizing Strukturbiologie ist XFEL Methode, bei der Röntgenstrahlen mit hoher Intensität auf Mikrokristalle von Proteinen geschossen werden. Aufgrund der hohen Strahlung werden die Mikrokristalle buchstäblich verbrannt, um die Daten zu erhalten. Zehntausende von Mikrokristallen sind erforderlich, um Daten mit angemessener Abdeckung zu erhalten. Jedes von einem Mikrokristall aufgenommene Bild muss mit den anderen analysiert werden, um die 3D-Struktur des Biomoleküls zu erhalten.
Such techniques depend heavily on automated software that use image processing algorithms and to some extent maschinelles Lernen approaches to identify the signal from the surrounding noise. This ist Big Data, denn die Vielfalt und Geschwindigkeit, mit der Informationen erfasst werden, ist astronomisch.
3. Multiskalenmodellierung
Im Gegensatz zur Modellierung einer einzelnen biomolekularen Struktur und der Extrapolation auf ein komplexeres System umfasst die Multiskalenmodellierung mehr als 200 000 Atome, und die erhaltene Dynamik offenbart Wechselwirkungen über lange Zeiträume und ein komplexes Verhalten der verschiedenen (homogenen oder heterogenen) Komponenten. Die aus solchen Experimenten gewonnenen Daten sind aufgrund der Anzahl der gewonnenen Datenpunkte sehr umfangreich, auch weil mehrere Durchläufe erforderlich sind, um eine statistische Signifikanz zu erhalten.
Ein Beispiel für den Einsatz der Multiskalenmodellierung ist das Verständnis der Dynamik von Cellulosomen, einer komplexen bakteriellen Struktur aus heterogenen Proteinen und Enzymen, die sich an Zellulose anlagern. Cellulosome sind von industrieller Bedeutung im Bereich der Biokraftstoffe, insbesondere der Bioethanolproduktion.
Lesen Sie weiter: http://www.ks.uiuc.edu/Research/biofuels/
4. Sequenzierung einzelner Zellen
Statt mehrere Zellen zu untersuchen, besteht die neueste Technik darin, jede einzelne Zelle zu isolieren, die RNA zu extrahieren und sie zu sequenzieren. Diese neue Technik wird als Einzelzell-RNA-Sequenzierung oder scRNA-seq. In diesem Nature-Artikel, der die Methode und ihre Vorteile beschreibt, wird erwähnt, dass
Es ist viel schwieriger, einzelne Zellen zu manipulieren als große Populationen, und da jede Zelle nur eine winzige Menge an RNA liefert, gibt es keinen Spielraum für Fehler. Ein weiteres Problem ist die Analyse der enormen Datenmengen, die dabei anfallen - nicht zuletzt, weil die verwendeten Werkzeuge nicht intuitiv sind.
Ein hervorragender Überblick über den Arbeitsablauf und die Werkzeuge für scRNA-seq wird hier gegeben: https://doi.org/10.3389/fgene.2016.00163
Benötigen Sie Hilfe bei der Beratung von Computer-Biologe? Mieten Sie einen Freiberufliche Computational Biology Experte auf Kolabtree. Es ist kostenlos, Ihr Projekt einzustellen und Angebote einzuholen.
Möchten Sie Dr. Yennamalli zu einem Projekt befragen? Setzen Sie sich mit ihm auf Kolabtree in Verbindung hier.
Verwandte Experten:
Einstellung eines Bioinformatikers Einen Molekularbiologen einstellen Einstellen eines Biostatistikers