Descubren más de cien mil virus desconocidos mediante una nueva herramienta informática
Investigadores del CSIC participan en un equipo internacional que utiliza un programa de computación en la nube para analizar millones de experimentos y muestras biológicas de todo el planeta
Investigadores del CSIC participan en un equipo internacional que utiliza un programa de computación en la nube para analizar millones de experimentos y muestras biológicas de todo el planeta
Los virus son el conjunto de agentes biológicos más numeroso que se conoce. Ahora, un equipo internacional de científicos donde participa el CSIC ha dado un importante paso para conocer su diversidad. Este equipo ha descubierto más de 130.000 nuevos virus de ARN (como es el coronavirus SARS-CoV-2 que provoca la actual pandemia de covid-19) a través de una nueva herramienta informática con la que se analizaron 5,7 millones de muestras biológicas recogidas a lo largo del planeta durante los últimos 15 años. Este hallazgo, que se publica en la revista Nature, supone un incremento de hasta 10 veces el número de especies virales de ARN descritas hasta la fecha.
Para este análisis, el equipo multidisciplinar desarrolló Serratus, una infraestructura de computación en la nube (Amazon Web Services, AWS) que, usando un clúster de 22.500 procesadores informáticos (CPUs), permitió búsquedas masivas de secuencias virales en los millones de Gigabytes (Petabytes) de datos de secuenciación disponibles en bases de datos públicas.
El análisis detallado de ciertas familias virales permitió el descubrimiento de más de 30 nuevas especies de coronavirus, incluyendo interesantes ejemplos en vertebrados acuáticos como peces y anfibios cuyos coronavirus presentaron un genoma segmentado en dos fragmentos, una característica descrita en otras familias de virus pero no detectada antes en ningún miembro de los coronavirus.
En el Instituto de Biología Molecular y Celular de Plantas de València (IBMCP) utilizaron Serratus para el análisis del virus causante de la hepatitis D humana, un agente viral llamado Delta, de tamaño genómico mínimo y origen desconocido. Esto permitió al investigador del CSIC en IBMCP, Marcos de la Peña Rivero, detectar virus similares en multitud de otros animales, incluyendo no sólo mamíferos y otros vertebrados, sino también invertebrados. “Sorprendentemente, estos virus se encontraron también en muestras medioambientales recogidas en lagos y suelos de todo el mundo, y cuyos huéspedes serían por el momento desconocidos”, revela de la Peña.
Conexión evolutiva entre virus de humanos y plantas en el medio ambiente
Más aún, las muestras medioambientales con virus similares al de la hepatitis D revelaron la presencia de novedosas formas virales con genomas ultra-compactos y de tamaño ínfimo (sólo 300 bases, las unidades químicas que forman el material genético). “Este descubrimiento permite avanzar una conexión evolutiva cercana entre virus tan distantes como la hepatitis D humana y los agentes subvirales de plantas llamados ‘viroides’”, apunta el investigador del CSIC.
Tanto la base de datos de todos los virus obtenidos en este trabajo como el conjunto de las herramientas desarrolladas, están disponibles de forma libre y abierta (www.serratus.io). Esta herramienta puede ser de gran utilidad para caracterizar la diversidad planetaria de todos los virus existentes y prepararse ante posibles nuevas pandemias, cuyas devastadoras consecuencias sufrimos con enfermedades virales emergentes como la covid-19, causada por el coronavirus SARS-CoV-2.
El IBMCP, centro mixto del CSIC y la Universitat Politècnica de València, es la única institución científica española que participa en este trabajo, donde colaboran, entre otros, el Instituto Heidelberg de Estudios Teóricos y el Instituto Max Planck de Bilogía (Alemania); el Instituto Pasteur (Francia); la Universidad de San Petersburgo (Rusia); la Universidad de California, Berkeley (EE.UU.); y la Universidad de British Columbia (Canadá).
Comunicación CSIC Comunitat Valenciana/CSIC Comunicación
Edgar R, Taylor J, Lin V, Altman T, Barbera P, Meleshko D, Lohr D, Novakovsky G, Buchfink B, Al-Shayeb B, Banfield JF, de la Peña M, Korobeynikov A, Chikhi R, Babaian A). Petabase-scale sequence alignment catalyses viral Discovery. Nature, https://doi.org/10.1038/s41586-021-04332-2
Noticias relacionadas
Investigadores del Instituto de Ciencia de Materiales de Madrid lideran un…
El Centro de Supercomputación de Galicia (CESGA), centro mixto del CSIC y…
Un equipo de científicos del Instituto de Catálisis y Petroleoquímica del…