El aprendizaje automático (un tipo de inteligencia artificial) a partir de los genomas de los virus puede predecir la probabilidad de que cualquiera de ellos que infecte a los animales pase a los humanos, dada una exposición biológicamente relevante, según publican en la revista ‘PLOS Biology’.
La mayoría de las enfermedades infecciosas emergentes de los seres humanos (como el COVID-19) son zoonóticas, es decir, causadas por virus procedentes de otras especies animales.
Identificar antes los virus de alto riesgo puede mejorar las prioridades de investigación y vigilancia. Sin embargo, identificar las enfermedades zoonóticas antes de su aparición es un reto importante porque sólo una pequeña minoría de los 1,67 millones de virus animales que se calcula que pueden infectar a los humanos.
Para desarrollar modelos de aprendizaje automático a partir de secuencias de genomas virales, los investigadores Nardus Mollentze, Simon Babayan y Daniel Streicker, de la Universidad de Glasgow (Reino Unido), recopilaron primero un conjunto de datos de 861 especies de virus de 36 familias.
A continuación construyeron modelos de aprendizaje automático, que asignaron una probabilidad de infección humana basada en la taxonomía del virus y/o su parentesco con los virus conocidos que infectan a los humanos. A continuación, los autores aplicaron el modelo de mejor rendimiento para analizar patrones en el potencial zoonótico previsto de otros genomas de virus muestreados de una serie de especies.
Los investigadores descubrieron que los genomas virales pueden tener características generalizables que son independientes de las relaciones taxonómicas del virus y pueden preadaptar los virus para infectar a los humanos. Así, pudieron desarrollar modelos de aprendizaje automático capaces de identificar las zoonosis candidatas a partir de los genomas virales.
Estos modelos tienen limitaciones, ya que los modelos informáticos son sólo un paso preliminar para identificar los virus zoonóticos con potencial para infectar a los humanos. Los virus señalados por los modelos requerirán pruebas de laboratorio confirmatorias antes de realizar importantes inversiones de investigación adicionales.
Además, aunque estos modelos predicen si los virus pueden infectar a los humanos, la capacidad de infección es sólo una parte del riesgo zoonótico más amplio, en el que también influyen la virulencia del virus en los humanos, la capacidad de transmisión entre humanos y las condiciones ecológicas en el momento de la exposición humana.
«Nuestros resultados demuestran que el potencial zoonótico de los virus puede deducirse en una medida sorprendente a partir de su secuencia genómica –subrayan los autores–. Al destacar los virus con mayor potencial zoonótico, la clasificación basada en el genoma permite orientar con mayor eficacia la caracterización ecológica y virológica».
«Estos hallazgos añaden una pieza crucial a la ya sorprendente cantidad de información que podemos extraer de la secuencia genética de los virus mediante técnicas de IA», añade Babayan.
«Una secuencia genómica suele ser la primera, y a menudo única, información que tenemos sobre los virus recién descubiertos, y cuanta más información podamos extraer de ella, antes podremos identificar el origen del virus y el riesgo zoonótico que puede suponer –prosigue–. Cuanto más virus se caractericen, más eficaces serán nuestros modelos de aprendizaje automático para identificar los virus raros que deben ser vigilados de cerca y priorizados para el desarrollo de vacunas preventivas».