{"id":28281,"date":"2022-11-06T01:49:38","date_gmt":"2022-11-06T06:49:38","guid":{"rendered":"https:\/\/einsteresante.com\/?p=28281"},"modified":"2022-11-06T01:49:38","modified_gmt":"2022-11-06T06:49:38","slug":"la-nueva-ia-de-meta-predijo-la-forma-de-600-millones-de-proteinas-en-2-semanas","status":"publish","type":"post","link":"https:\/\/einsteresante.com\/index.php\/2022\/11\/06\/la-nueva-ia-de-meta-predijo-la-forma-de-600-millones-de-proteinas-en-2-semanas\/","title":{"rendered":"La nueva IA de Meta predijo la forma de 600 millones de prote\u00ednas en 2 semanas"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Los cient\u00edficos de Meta, la empresa matriz de Facebook e Instagram, han utilizado un modelo de lenguaje de inteligencia artificial (IA) para predecir las estructuras desconocidas de m\u00e1s de 600 millones de prote\u00ednas pertenecientes a virus, bacterias y otros microbios. El programa, llamado ESMFold, us\u00f3 un modelo que fue originalmente dise\u00f1ado para decodificar lenguajes humanos para hacer predicciones precisas de los giros y vueltas que toman las prote\u00ednas que determinan su estructura 3D. Las predicciones, que se compilaron en el Atlas Metagen\u00f3mico ESM de c\u00f3digo abierto, podr\u00edan usarse para ayudar a desarrollar nuevos medicamentos, caracterizar funciones microbianas desconocidas y rastrear las conexiones evolutivas entre especies lejanamente relacionadas.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">ESMFold no es el primer programa que realiza predicciones de prote\u00ednas. En 2022, la empresa DeepMind, propiedad de Google, anunci\u00f3 que su programa de predicci\u00f3n de prote\u00ednas AlphaFold hab\u00eda descifrado las formas de aproximadamente 200 millones de prote\u00ednas conocidas por la ciencia. ESMFold no es tan preciso como AlphaFold, pero es 60 veces m\u00e1s r\u00e1pido que el programa de DeepMind, dice Meta. Los resultados a\u00fan no han sido revisados \u200b\u200bpor pares.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">&#8220;El Atlas metagen\u00f3mico de ESM permitir\u00e1 a los cient\u00edficos buscar y analizar las estructuras de las prote\u00ednas metagen\u00f3micas a la escala de cientos de millones de prote\u00ednas&#8221;, escribi\u00f3 el equipo de investigaci\u00f3n de Meta en una <a href=\"https:\/\/ai.facebook.com\/blog\/protein-folding-esmfold-metagenomics\/?utm_source=twitter&amp;utm_medium=organic_social&amp;utm_campaign=blog\">publicaci\u00f3n de blog<\/a> que acompa\u00f1a al lanzamiento del art\u00edculo en la base de datos de preimpresi\u00f3n <a href=\"https:\/\/www.biorxiv.org\/content\/10.1101\/2022.07.20.500902v2\">bioRxiv<\/a>. &#8220;Esto puede ayudar a los investigadores a identificar estructuras que no se han caracterizado antes, buscar relaciones evolutivas distantes y descubrir nuevas prote\u00ednas que pueden ser \u00fatiles en medicina y otras aplicaciones&#8221;.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Las prote\u00ednas son los componentes b\u00e1sicos de todos los seres vivos y est\u00e1n formadas por cadenas largas y sinuosas de amino\u00e1cidos, peque\u00f1as unidades moleculares que se unen en innumerables combinaciones para formar la forma 3D de la prote\u00edna. Conocer la forma de una prote\u00edna es la mejor manera de entender su funci\u00f3n, pero hay un n\u00famero asombroso de formas en que la misma combinaci\u00f3n de amino\u00e1cidos en diferentes secuencias puede tomar forma. A pesar de que las prote\u00ednas toman ciertas formas de manera r\u00e1pida y confiable una vez que se han producido, la cantidad de configuraciones posibles es aproximadamente 10^300. La forma est\u00e1ndar de oro para determinar la estructura de una prote\u00edna es usar cristalograf\u00eda de rayos X (ver c\u00f3mo los haces de luz de alta energ\u00eda se difractan alrededor de las prote\u00ednas), pero este es un m\u00e9todo laborioso que puede llevar meses o a\u00f1os para producir resultados, y no funciona para todo tipo de prote\u00ednas. Despu\u00e9s de d\u00e9cadas de trabajo, se han descifrado m\u00e1s de 100 000 estructuras de prote\u00ednas mediante cristalograf\u00eda de rayos X. Para encontrar una forma de solucionar este problema, los investigadores de Meta recurrieron a un modelo inform\u00e1tico sofisticado dise\u00f1ado para decodificar y hacer predicciones sobre los lenguajes humanos, y aplicaron el modelo al lenguaje de las secuencias de prote\u00ednas.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">&#8220;Usando una forma de aprendizaje autosupervisado conocida como modelado de lenguaje enmascarado, entrenamos un modelo de lenguaje en las secuencias de millones de prote\u00ednas naturales&#8221;, escribieron los investigadores. &#8220;Con este enfoque, el modelo debe completar correctamente los espacios en blanco en un pasaje de texto, como &#8216;Para __ o no , ese es el&#8217;. Entrenamos un modelo de lenguaje para completar los espacios en blanco en una secuencia de prote\u00ednas, como &#8220;GL_KKE_AHY_G&#8221; en millones de prote\u00ednas diversas. Descubrimos que la informaci\u00f3n sobre la estructura y funci\u00f3n de las prote\u00ednas surge de este entrenamiento&#8221;.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Para probar su modelo, los cient\u00edficos recurrieron a una base de datos de ADN metagen\u00f3mico (llamado as\u00ed porque ha sido secuenciado en masa a partir de fuentes ambientales o cl\u00ednicas) tomado de lugares tan diversos como el suelo, el agua de mar y el intestino y la piel humanos. Al introducir los datos de ADN en el programa ESMFold, los investigadores predijeron las estructuras de m\u00e1s de 617 millones de prote\u00ednas en solo dos semanas.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Eso es m\u00e1s de 400 millones m\u00e1s de lo que AlphaFold anunci\u00f3 que hab\u00eda descifrado hace cuatro meses, cuando afirm\u00f3 haber deducido la estructura proteica de casi todas las prote\u00ednas conocidas. Esto significa que muchas de estas prote\u00ednas nunca antes se hab\u00edan visto, probablemente porque provienen de organismos desconocidos. Se cree que m\u00e1s de 200 millones de predicciones de prote\u00ednas de ESMFold son de alta calidad, seg\u00fan el modelo, lo que significa que el programa ha sido capaz de predecir las formas con una precisi\u00f3n hasta el nivel de los \u00e1tomos.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Los investigadores esperan utilizar este programa para un trabajo m\u00e1s centrado en las prote\u00ednas. &#8220;Para ampliar a\u00fan m\u00e1s este trabajo, estamos estudiando c\u00f3mo se pueden usar los modelos de lenguaje para dise\u00f1ar nuevas prote\u00ednas y contribuir a resolver los desaf\u00edos en la salud, la enfermedad y el medio ambiente&#8221;, escribi\u00f3 Meta.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Fuente: <a href=\"https:\/\/www.livescience.com\/meta-predicts-600-million-protein-shapes\">Live Science<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Los cient\u00edficos de Meta, la empresa matriz de Facebook e Instagram, han utilizado un modelo de lenguaje de inteligencia artificial (IA) para predecir las estructuras desconocidas de m\u00e1s de 600 millones de prote\u00ednas pertenecientes a virus, bacterias y otros microbios. El programa, llamado ESMFold, us\u00f3 un modelo que fue originalmente dise\u00f1ado para decodificar lenguajes humanos [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[14],"tags":[],"class_list":["post-28281","post","type-post","status-publish","format-standard","hentry","category-tecnologia"],"_links":{"self":[{"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/posts\/28281","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/comments?post=28281"}],"version-history":[{"count":10,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/posts\/28281\/revisions"}],"predecessor-version":[{"id":28291,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/posts\/28281\/revisions\/28291"}],"wp:attachment":[{"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/media?parent=28281"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/categories?post=28281"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/tags?post=28281"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}