Biologia computazionale è in rapida evoluzione con l'avvento delle nuove tecnologie, soprattutto nel modo in cui raccogliamo, analizziamo e visualizziamo i dati. Il Dr. Ragothaman Yennmalli, un Kolabtree libero professionista e scienziato, esamina quattro progressi promettenti.
Seguendo il precedente post introduttivo, here I will highlight some of the recent trends or recent advances in the biological sciences that are transforming computational biology. These advances rely heavily on computational tools and methods — big analisi dei dati, multiscale modelling, etc. Some of them are listed below.
1. Grandi dati
This is a well known term in computer science and has been picked by biologists only recently. Thanks to the next generation sequencing techniques, the sequence of a genome can be obtained in relatively shorter time. For example, the relevance of generating data quickly is magnified when working with metagenomic data or a microbiome. How can one manage the data? What about storage for long term? What are the tools for analyzing such massive data? These questions arise and they do have answers. As mentioned this is a recent trend in biology but not in computer science or experimental fisicadove la gestione e l'analisi dei big data è un lavoro di routine.
One particular instance where ricerca is happening is in the file formats of biological big data. In the case of protein structure file format, the current standard is the .pdb format, a column dependent format that is parseable and both human and machine readable. However, this format fails when describing mega structures, such as the ribosome or full viral capsids. Hence, a new format has been proposed called the .pdbx format that overcomes the previous format’s limitations. There is also another format called MMTF format that spees up the loading time for structures with more then 20 million atoms within seconds.
Ulteriori letture sui grandi dati in ambito computazionale biologia strutturale:
http://science.sciencemag.org/content/355/6322/248
2. Tecniche Cryo-EM e XFEL
Questi due metodi non sono nuovi, in quanto tali. Tuttavia, la tecnologia attuale e i progressi che avvengono in questi due campi stanno spingendo i limiti dell'analisi della struttura biomolecolare. Cryo-EM è una tecnica per catturare la struttura tridimensionale della biomolecola usando il microscopio elettronico ad alta risoluzione. In uno dei laboratori pionieri del NIH, è stata risolta una struttura di 2,5Å. Questa risoluzione è di solito ottenuta con la struttura cristallina delle proteine, che di routine comporta almeno 1-2 mesi di tempo per standardizzare il cristallo ottimale da sparare sotto il fascio di raggi X.
In contrast, a recent technique that is revolutionizing biologia strutturale è XFEL che consiste nel sparare fasci di raggi X ad alta intensità su microcristalli di proteine. A causa dell'alta radiazione i microcristalli vengono letteralmente bruciati per ottenere i dati. Decine di migliaia di microcristalli sono necessari per ottenere dati di copertura decente. Ogni immagine catturata da un microcristallo deve essere analizzata con il resto per ottenere la struttura 3D della biomolecola.
Such techniques depend heavily on automated software that use image processing algorithms and to some extent apprendimento automatico approaches to identify the signal from the surrounding noise. This è big data, poiché la diversità e la velocità di acquisizione delle informazioni è astronomica.
3. Modellazione multiscala
A differenza della modellazione della struttura biomolecolare singola e dell'estrapolazione a un sistema più complesso, la modellazione multiscala coinvolge più di 200.000 atomi e le dinamiche ottenute rivelano interazioni a lungo termine e comportamenti complessi dei componenti multipli (sia omogenei che eterogenei). I dati generati da tali esperimenti sono massicci a causa del numero di punti dati ottenuti, anche a causa di corse multiple per ottenere una significatività statistica.
Un esempio in cui la modellazione multiscala è stata usata è nella comprensione della dinamica del cellulosoma, una struttura complessa batterica fatta di proteine eterogenee ed enzimi che si attaccano alla cellulosa. I cellulosomi sono industrialmente importanti nell'area dei biocarburanti, in particolare nella produzione di bioetanolo.
Ulteriori letture: http://www.ks.uiuc.edu/Research/biofuels/
4. Sequenziamento di una singola cellula
Invece di guardare più cellule, l'ultima tecnica è quella di isolare ogni singola cellula, estrarre l'RNA e sequenziarlo. Questa tecnica recente è chiamata sequenziamento dell'RNA di una singola cellula o scRNA-seq. In questo articolo di Nature, discutendo il metodo e i suoi vantaggi, si dice che
È molto più difficile manipolare singole cellule che grandi popolazioni, e poiché ogni cellula produce solo una piccola quantità di RNA, non c'è spazio per gli errori. Un altro problema è l'analisi delle enormi quantità di dati che ne risultano - anche perché gli strumenti utilizzati possono essere poco intuitivi.
Un'eccellente revisione del flusso di lavoro e degli strumenti per lo scRNA-seq è data qui: https://doi.org/10.3389/fgene.2016.00163
Hai bisogno di aiuto con la consulenza di Biologo computazionale? Assumere un Biologia computazionale freelance esperto su Kolabtree. È gratuito pubblicare il tuo progetto e ottenere preventivi.
Vuoi consultare il Dr. Yennamalli per un progetto? Mettiti in contatto con lui su Kolabtree qui.
Esperti correlati:
Assumere un bioinformatico Assumere un biologo molecolare Assumere un biostatistico