Seleccionar página

Fuente: Peter-Gamal/Pixabay

La capacidad predictiva del aprendizaje automático de inteligencia artificial (IA) está acelerando los descubrimientos en las ciencias de la vida.

Un nuevo estudio muestra cómo la IA y la genómica pueden predecir futuras mutaciones del virus SARS-CoV-2 que causa la enfermedad COVID-19.

“La pandemia del síndrome respiratorio agudo severo coronavirus 2 (SARS-CoV-2) se ha caracterizado por ondas de transmisión iniciadas por nuevas variantes que reemplazan a las más antiguas”, escribió el equipo de investigación del Instituto Broad del MIT y Harvard con sus coautores de la Universidad. de la Facultad de Medicina de Massachusetts y otras afiliaciones. “Dado este patrón de aparición, existe una necesidad obvia de detección temprana de nuevas variantes para evitar un exceso de muertes”.

El equipo de investigación desarrolló un modelo de IA de regresión bayesiana jerárquica llamado PyR0 que puede proporcionar análisis escalables del conjunto completo de conjuntos de datos públicos de los genomas del SARS-CoV-2. El modelo bayesiano predice linajes virales emergentes.

El algoritmo utilizado es totalmente bayesiano. A diferencia de la regresión lineal frecuentista, la regresión lineal bayesiana utiliza distribuciones de probabilidad en lugar de estimaciones puntuales, y el resultado se genera a partir de una distribución normal (gaussiana). El objetivo de la regresión lineal bayesiana es encontrar la distribución posterior de los parámetros del modelo en lugar de encontrar el valor óptimo único de los parámetros del modelo.

A través de pruebas retrospectivas sistemáticas, descubrimos que el modelo habría brindado una alerta temprana y ayudado en la identificación de VoC si se hubiera aplicado de manera rutinaria a muestras de SARS-CoV-2, lo que confirma su utilidad para la salud pública y subraya el valor de compartir rápidamente datos genómicos. .

El modelo de IA se ajustó a 6.466.300 datos genómicos de SARS-CoV-2 de GISAID (Global Initiative on Sharing All Influenza Data). El equipo utilizó la inferencia variacional estocástica para ajustar el modelo grande. Incluso con este enfoque, esta tarea compleja requería resolver un problema de optimización con más de 75 millones de dimensiones.

Los científicos dividieron las muestras genéticas en grupos y luego analizaron la aptitud de cada grupo. Específicamente, el equipo creó 3000 grupos de 1544 linajes PANGO y modeló la aptitud de los linajes por separado en 1560 geografías. Los autores del estudio informaron,

El modelo infiere correctamente que la variante de clasificación de la Organización Mundial de la Salud Omicron (PANGO BA.2) tiene la aptitud más alta hasta la fecha: 8,9 veces [95 percent confidence interval (CI) 8.6 to 9.2] más alto que el linaje A original, presagiando con precisión su ascenso en las regiones donde está circulando.

Según los investigadores, su algoritmo se puede aplicar a diferentes fenotipos virales, así como a cualquier conjunto de datos genómicos virales.

“Usando este modelo, los linajes emergentes se pueden detectar junto con las mutaciones que contribuyen a la transmisibilidad, no solo en Spike sino también en otras proteínas virales”, informaron los autores. “El modelo puede priorizar los linajes a medida que surgen por motivos de salud pública”.

Copyright © 2022 Cami Rosso. Reservados todos los derechos.

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información

ACEPTAR
Aviso de cookies