{"id":54111,"date":"2024-05-16T08:46:30","date_gmt":"2024-05-16T13:46:30","guid":{"rendered":"https:\/\/einsteresante.com\/?p=54111"},"modified":"2024-05-16T08:46:31","modified_gmt":"2024-05-16T13:46:31","slug":"la-ia-ayuda-a-desenmaranar-misterios-de-los-virus-en-los-oceanos-y-en-nuestros-intestinos","status":"publish","type":"post","link":"https:\/\/einsteresante.com\/index.php\/2024\/05\/16\/la-ia-ayuda-a-desenmaranar-misterios-de-los-virus-en-los-oceanos-y-en-nuestros-intestinos\/","title":{"rendered":"La IA ayuda a desenmara\u00f1ar misterios de los virus en los oc\u00e9anos y en nuestros intestinos"},"content":{"rendered":"\n<p><em>Por<\/em>: Libusha Kelly<\/p>\n\n\n\n<p>Los virus son una fuerza misteriosa y poco comprendida en los ecosistemas microbianos. Los investigadores saben que pueden infectar, matar y manipular c\u00e9lulas humanas y bacterianas en casi todos los entornos, desde los oc\u00e9anos hasta el intestino.<\/p>\n\n\n\n<p>Pero los cient\u00edficos a\u00fan no tienen una idea completa de c\u00f3mo los virus afectan el entorno que los rodea, en gran parte debido a su extraordinaria diversidad y capacidad para evolucionar r\u00e1pidamente. Las comunidades de microbios son dif\u00edciles de estudiar en un laboratorio. Muchos microbios son dif\u00edciles de cultivar y su entorno natural tiene muchas m\u00e1s caracter\u00edsticas que influyen en su \u00e9xito o fracaso de las que los cient\u00edficos pueden replicar en un laboratorio.<\/p>\n\n\n\n<p>Por eso, los bi\u00f3logos de sistemas como yo a menudo secuencian todo el ADN presente en una muestra (por ejemplo, una muestra fecal de un paciente), separan las secuencias de ADN viral y luego anotan las secciones del genoma viral que codifican prote\u00ednas. Estas notas sobre la ubicaci\u00f3n, estructura y otras caracter\u00edsticas de los genes ayudan a los investigadores a comprender las funciones que los virus pueden desempe\u00f1ar en el medio ambiente y ayudan a identificar diferentes tipos de virus. Los investigadores anotan virus haciendo coincidir secuencias virales en una muestra con secuencias previamente anotadas disponibles en bases de datos p\u00fablicas de secuencias gen\u00e9ticas virales.<\/p>\n\n\n\n<p>Sin embargo, los cient\u00edficos est\u00e1n identificando secuencias virales en el ADN recolectado del medio ambiente a un ritmo que supera con creces nuestra capacidad para anotar esos genes. Esto significa que los investigadores est\u00e1n publicando hallazgos sobre virus en ecosistemas microbianos utilizando fracciones inaceptablemente peque\u00f1as de los datos disponibles. Para mejorar la capacidad de los investigadores para estudiar virus en todo el mundo, mi equipo y yo hemos desarrollado un enfoque novedoso para anotar secuencias virales utilizando inteligencia artificial.<\/p>\n\n\n\n<p>A trav\u00e9s de modelos de lenguaje de prote\u00ednas similares a modelos de lenguaje grandes como ChatGPT pero espec\u00edficos de prote\u00ednas, pudimos clasificar secuencias virales nunca antes vistas. Esto abre la puerta para que los investigadores no s\u00f3lo aprendan m\u00e1s sobre los virus, sino tambi\u00e9n para abordar cuestiones biol\u00f3gicas que son dif\u00edciles de responder con las t\u00e9cnicas actuales.<\/p>\n\n\n\n<p><strong>Anotar virus con IA<\/strong><br>Los modelos de lenguaje grande utilizan relaciones entre palabras en grandes conjuntos de datos de texto para proporcionar respuestas potenciales a preguntas cuyas respuestas no se les &#8220;ense\u00f1a&#8221; expl\u00edcitamente.<\/p>\n\n\n\n<p>Cuando le preguntas a un chatbot &#8220;\u00bfCu\u00e1l es la capital de Francia?&#8221; por ejemplo, el modelo no busca la respuesta en una tabla de ciudades capitales. M\u00e1s bien, est\u00e1 utilizando su formaci\u00f3n en enormes conjuntos de datos de documentos e informaci\u00f3n para inferir la respuesta: &#8220;La capital de Francia es Par\u00eds&#8221;.<\/p>\n\n\n\n<p>De manera similar, los modelos de lenguaje de prote\u00ednas son algoritmos de inteligencia artificial entrenados para reconocer relaciones entre miles de millones de secuencias de prote\u00ednas de entornos de todo el mundo. A trav\u00e9s de este entrenamiento, es posible que puedan inferir algo sobre la esencia de las prote\u00ednas virales y sus funciones.<\/p>\n\n\n\n<p>Nos preguntamos si los modelos de lenguaje de prote\u00ednas podr\u00edan responder a esta pregunta: &#8220;Dadas todas las secuencias gen\u00e9ticas virales anotadas, \u00bfcu\u00e1l es la funci\u00f3n de esta nueva secuencia?&#8221;<\/p>\n\n\n\n<p>En nuestra prueba de concepto, entrenamos redes neuronales en secuencias de prote\u00ednas virales previamente anotadas en modelos de lenguaje de prote\u00ednas previamente entrenados y luego las usamos para predecir la anotaci\u00f3n de nuevas secuencias de prote\u00ednas virales. Nuestro enfoque nos permite investigar lo que el modelo &#8220;ve&#8221; en una secuencia viral particular que conduce a una anotaci\u00f3n particular. Esto ayuda a identificar prote\u00ednas candidatas de inter\u00e9s, ya sea en funci\u00f3n de sus funciones espec\u00edficas o de c\u00f3mo est\u00e1 organizado su genoma, reduciendo el espacio de b\u00fasqueda de vastos conjuntos de datos.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" src=\"https:\/\/einsteresante.com\/wp-content\/uploads\/2024\/05\/image-43.png\" alt=\"\" class=\"wp-image-54123\"\/><figcaption class=\"wp-element-caption\">Proclorococus es una de las muchas especies de bacterias marinas con prote\u00ednas que los investigadores no hab\u00edan visto antes. Anne Thompson\/Chisholm Lab, MIT v\u00eda Flickr.<\/figcaption><\/figure>\n\n\n\n<p>Al identificar funciones gen\u00e9ticas virales relacionadas m\u00e1s lejanamente, los modelos de lenguaje de prote\u00ednas pueden complementar los m\u00e9todos actuales para proporcionar nuevos conocimientos sobre microbiolog\u00eda. Por ejemplo, mi equipo y yo pudimos utilizar nuestro modelo para descubrir una integrasa no reconocida previamente (un tipo de prote\u00edna que puede mover informaci\u00f3n gen\u00e9tica dentro y fuera de las c\u00e9lulas) en las picocianobacterias marinas <em>Proclorococcus<\/em> y <em>Synechococcus<\/em>, que abundan en todo el mundo.<\/p>\n\n\n\n<p>En particular, esta integrasa puede ser capaz de mover genes dentro y fuera de estas poblaciones de bacterias en los oc\u00e9anos y permitir que estos microbios se adapten mejor a entornos cambiantes. Nuestro modelo de lenguaje tambi\u00e9n identific\u00f3 una nueva prote\u00edna de la c\u00e1pside viral que est\u00e1 muy extendida en los oc\u00e9anos del mundo. Produjimos la primera imagen de c\u00f3mo est\u00e1n organizados sus genes, mostrando que puede contener diferentes conjuntos de genes que creemos que indican que este virus cumple diferentes funciones en su entorno. Estos hallazgos preliminares representan s\u00f3lo dos de los miles de anotaciones que nuestro enfoque ha proporcionado.<\/p>\n\n\n\n<p><strong>Analizando lo desconocido<\/strong><br>La mayor\u00eda de los cientos de miles de virus reci\u00e9n descubiertos siguen sin clasificar. Muchas secuencias gen\u00e9ticas virales coinciden con familias de prote\u00ednas sin funci\u00f3n conocida o nunca antes se hab\u00edan visto. Nuestro trabajo muestra que modelos de lenguaje de prote\u00ednas similares podr\u00edan ayudar a estudiar la amenaza y la promesa de los numerosos virus no caracterizados de nuestro planeta.<\/p>\n\n\n\n<p>Si bien nuestro estudio se centr\u00f3 en los virus en los oc\u00e9anos globales, una mejor anotaci\u00f3n de las prote\u00ednas virales es fundamental para comprender mejor el papel que desempe\u00f1an los virus en la salud y las enfermedades del cuerpo humano. Nosotros y otros investigadores hemos planteado la hip\u00f3tesis de que la actividad viral en el microbioma intestinal humano podr\u00eda verse alterada cuando est\u00e1s enfermo. Esto significa que los virus pueden ayudar a identificar el estr\u00e9s en las comunidades microbianas.<\/p>\n\n\n\n<p>Sin embargo, nuestro enfoque tambi\u00e9n es limitado porque requiere anotaciones de alta calidad. Los investigadores est\u00e1n desarrollando modelos de lenguaje de prote\u00ednas m\u00e1s nuevos que incorporan otras &#8220;tareas&#8221; como parte de su entrenamiento, en particular predecir estructuras de prote\u00ednas para detectar prote\u00ednas similares, para hacerlas m\u00e1s poderosas. Hacer que todas las herramientas de IA est\u00e9n disponibles a trav\u00e9s de los principios de datos FAIR (datos que se pueden encontrar, acceder, interoperar y reutilizar) puede ayudar a los investigadores en general a darse cuenta del potencial de estas nuevas formas de anotar secuencias de prote\u00ednas que conducen a descubrimientos que benefician la salud humana.<\/p>\n\n\n\n<p><em>Este art\u00edculo es una traducci\u00f3n de otro publicado en <a href=\"https:\/\/theconversation.com\/\">The Conversation<\/a>. Puedes leer el texto original haciendo clic <a href=\"https:\/\/theconversation.com\/viruses-are-doing-mysterious-things-everywhere-ai-can-help-researchers-understand-what-theyre-up-to-in-the-oceans-and-in-your-gut-228270\">aqu\u00ed<\/a>.<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Por: Libusha Kelly Los virus son una fuerza misteriosa y poco comprendida en los ecosistemas microbianos. Los investigadores saben que pueden infectar, matar y manipular c\u00e9lulas humanas y bacterianas en casi todos los entornos, desde los oc\u00e9anos hasta el intestino. Pero los cient\u00edficos a\u00fan no tienen una idea completa de c\u00f3mo los virus afectan el [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[9],"tags":[],"class_list":["post-54111","post","type-post","status-publish","format-standard","hentry","category-biologia"],"_links":{"self":[{"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/posts\/54111","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/comments?post=54111"}],"version-history":[{"count":14,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/posts\/54111\/revisions"}],"predecessor-version":[{"id":54126,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/posts\/54111\/revisions\/54126"}],"wp:attachment":[{"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/media?parent=54111"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/categories?post=54111"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/tags?post=54111"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}