{"id":67644,"date":"2025-01-28T15:33:13","date_gmt":"2025-01-28T20:33:13","guid":{"rendered":"https:\/\/einsteresante.com\/?p=67644"},"modified":"2025-01-28T15:33:13","modified_gmt":"2025-01-28T20:33:13","slug":"deepseek-prueba-lo-equivocado-que-estaba-sam-altman-acerca-de-ias-mas-pequenas-compitiendo-con-openai","status":"publish","type":"post","link":"https:\/\/einsteresante.com\/index.php\/2025\/01\/28\/deepseek-prueba-lo-equivocado-que-estaba-sam-altman-acerca-de-ias-mas-pequenas-compitiendo-con-openai\/","title":{"rendered":"DeepSeek prueba lo equivocado que estaba Sam Altman acerca de IAs m\u00e1s peque\u00f1as compitiendo con OpenAI"},"content":{"rendered":"\n<p>Es dif\u00edcil exagerar el impacto que ha tenido DeepSeek. En un par de d\u00edas, sacudi\u00f3 a toda la industria de la IA, rompiendo el aura de invencibilidad que OpenAI (y las empresas tecnol\u00f3gicas estadounidenses en general) hab\u00edan construido a su alrededor. La nueva IA de DeepSeek es la aplicaci\u00f3n gratuita m\u00e1s descargada en la Apple Store, y no es dif\u00edcil ver por qu\u00e9: rivaliza o supera las opciones pagas de OpenAI. Pero esa ni siquiera es la mejor parte: DeepSeek afirma que solo tom\u00f3 dos meses y cost\u00f3 menos de $6 millones construirla. El modelo R1 de DeepSeek cuesta 1\/20 del dinero para ejecutar el modelo insignia o1 de ChatGPT. Tambi\u00e9n es de c\u00f3digo abierto.<\/p>\n\n\n\n<p><strong>Demostraron que Sam Altman estaba muy equivocado<br><\/strong>En 2023, se le pregunt\u00f3 a Altman si un equipo inteligente con un presupuesto de alrededor de $10 millones podr\u00eda intentar crear un producto que rivalizara con los de OpenAI. La respuesta de Altman fue (como suele ser) arrogante:<\/p>\n\n\n\n<p>\u201cMira, la forma en que esto funciona es que te diremos que es totalmente in\u00fatil competir con nosotros en el entrenamiento de modelos b\u00e1sicos que no deber\u00edas probar, y es tu trabajo, por as\u00ed decirlo, intentarlo de todos modos\u201d. Bueno, lo intentaron, y Altman no es muy arrogante ahora.<\/p>\n\n\n\n<p>Elogi\u00f3 a DeepSeek R1 y prometi\u00f3 que OpenAI producir\u00e1 mejores modelos, pero el mercado y los expertos parecen menos confiados.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" src=\"https:\/\/einsteresante.com\/wp-content\/uploads\/2025\/01\/image-91.png\" alt=\"\" class=\"wp-image-67651\"\/><\/figure>\n\n\n\n<p><strong>No es solo OpenAI, todo el mundo est\u00e1 enloqueciendo<br><\/strong>No es el primer modelo de IA de c\u00f3digo abierto de gran impacto que existe (el c\u00f3digo fuente est\u00e1 disponible de forma gratuita para que cualquiera lo vea, modifique y distribuya bajo una licencia permisiva). La empresa matriz de Facebook, Meta, tambi\u00e9n ha optado por una estrategia similar con sus modelos Llama. Pero los lanzamientos de Llama han sido relativamente lentos y no tan baratos ni eficientes como los de DeepSeek. Seg\u00fan se informa, Meta est\u00e1 reuniendo a &#8220;salas de guerra&#8221; de ingenieros para averiguar c\u00f3mo lo hace DeepSeek.<\/p>\n\n\n\n<p>Para hacer las cosas a\u00fan m\u00e1s sorprendentes, DeepSeek logr\u00f3 este rendimiento mientras usaba los chips H800 menos avanzados de Nvidia. Los chips de IA son cientos o incluso miles de veces m\u00e1s r\u00e1pidos y eficientes que las CPU para entrenar a las IA, y Nvidia es, con diferencia, el l\u00edder en este campo. Estos chips se consideraron tan importantes que el presidente Biden emiti\u00f3 la Ley CHIPS, que imped\u00eda que se exportaran a China chips de \u00faltima generaci\u00f3n fabricados en Estados Unidos. Bueno, DeepSeek lo hizo sin estos chips.<\/p>\n\n\n\n<p>El \u00edndice burs\u00e1til Nasdaq, con una fuerte presencia tecnol\u00f3gica, se desplom\u00f3 tras la noticia, al igual que la favorita del mercado de valores, Nvidia. Nvidia, que hab\u00eda crecido casi un 2000% en los \u00faltimos 5 a\u00f1os, cay\u00f3 un 16% en un d\u00eda. En total, DeepSeek hizo un agujero de 1 bill\u00f3n de d\u00f3lares en los mercados globales, en gran medida porque puede ser utilizado, descargado y refinado por cualquier persona de forma gratuita.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" src=\"https:\/\/einsteresante.com\/wp-content\/uploads\/2025\/01\/image-92.png\" alt=\"\" class=\"wp-image-67655\"\/><figcaption class=\"wp-element-caption\">El rendimiento de DeepSeek rivaliza o supera a los mejores modelos de IA actuales, a pesar de invertir solo una fracci\u00f3n de su financiaci\u00f3n y talento. Cr\u00e9dito: Hackaday.<\/figcaption><\/figure>\n\n\n\n<p>Vaibhav Srivastav, un ingeniero de Hugging Face (una plataforma para construir, compartir e implementar modelos de aprendizaje autom\u00e1tico, con un esp\u00edritu de c\u00f3digo abierto) dijo que este debe ser un momento &#8220;humillante&#8221; para los gigantes de la IA de Estados Unidos. A\u00f1adi\u00f3 que si OpenAI hubiera compartido sus recursos con otros actores en Estados Unidos, la tecnolog\u00eda habr\u00eda avanzado m\u00e1s. A\u00f1adi\u00f3 que la verdadera pregunta es por qu\u00e9 el enfoque de c\u00f3digo abierto de Meta no produjo tantos beneficios. &#8220;\u00bfQu\u00e9 diablos est\u00e1 haciendo Meta? Esto era algo que ellos pod\u00edan perder&#8221;, dijo el investigador.<\/p>\n\n\n\n<p>La semana pasada, Meta dijo que gastar\u00eda m\u00e1s de 60 mil millones de d\u00f3lares en el desarrollo de IA solo este a\u00f1o, mientras que Altman dijo que la industria necesitar\u00eda billones de d\u00f3lares en inversi\u00f3n para respaldar los centros de datos que ejecutan los modelos complejos.<\/p>\n\n\n\n<p><strong>Lo que esto realmente significa para la industria<\/strong><\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" src=\"https:\/\/einsteresante.com\/wp-content\/uploads\/2025\/01\/image-93.png\" alt=\"\" class=\"wp-image-67661\"\/><figcaption class=\"wp-element-caption\">DeepSeek (cuyo logo es una ballena azul) est\u00e1 atacando la aparentemente impenetrable fortaleza de la IA de las grandes tecnol\u00f3gicas. Ilustraci\u00f3n de Midjourney.<\/figcaption><\/figure>\n\n\n\n<p>Es poco probable que todos cambien al producto con sede en China de la noche a la ma\u00f1ana. Las liquidaciones del mercado a menudo son una reacci\u00f3n exagerada, y el tiempo dir\u00e1 si DeepSeek es un verdadero competidor por el liderazgo de la IA. Como se\u00f1ala Srivastav, a menudo no se trata de la capacidad del modelo sino de lo bien que se integra en otras aplicaciones.<\/p>\n\n\n\n<p>Adem\u00e1s, el mundo de la IA es en gran medida un campo de investigaci\u00f3n activo con cambios y transformaciones constantes. Sin embargo, considerando que el proyecto se consider\u00f3 un &#8220;proyecto secundario&#8221; y que es tan barato, los resultados son realmente disruptivos.<\/p>\n\n\n\n<p>La industria de la IA se estaba volviendo complaciente. El presidente Trump abraz\u00f3 a las grandes tecnol\u00f3gicas y las grandes tecnol\u00f3gicas lo abrazaron a \u00e9l, por lo que todo parec\u00eda ir sobre ruedas, pero las industrias competitivas rara vez lo son. Esto ser\u00e1 una llamada de atenci\u00f3n para la industria y mostrar\u00e1 que la carrera de la innovaci\u00f3n en IA est\u00e1 lejos de ganarse.<\/p>\n\n\n\n<p>El enfoque general (y lo que mantuvo en marcha el repunte de las acciones de Nvidia) fue la idea de que se necesita una superioridad computacional absoluta para construir mejores modelos. Esto fue una barrera para otros participantes. Si se necesita una gran potencia de procesamiento para construir modelos, se necesita mucho dinero para ello. Esto es lo que motiv\u00f3 los comentarios &#8220;desesperanzadores&#8221; de Altman. Los resultados de DeepSeek sugieren que ese no es realmente el caso y que la puerta puede estar abierta tambi\u00e9n para otros competidores. El hecho de que el modelo sea de c\u00f3digo abierto probablemente significa que pronto veremos muchas escisiones.<\/p>\n\n\n\n<p>Si se confirma el enfoque de DeepSeek, las grandes empresas tecnol\u00f3gicas como Amazon, Alphabet, Meta y Microsoft podr\u00edan tener que cambiar de planes actuales. Ya hab\u00edan invertido mucho en centros de datos de IA (que implican muchos chips y mucha energ\u00eda). Si eso no es necesario, ser\u00eda una buena noticia para el planeta, ya que los centros de datos que consumen mucha energ\u00eda ya estaban teniendo un impacto en el uso global de energ\u00eda. Tambi\u00e9n podr\u00eda liberar algunos recursos de las grandes tecnol\u00f3gicas y permitirles centrarse en otros tipos de innovaci\u00f3n distintos del enfoque de &#8220;fuerza bruta&#8221;. Pero tambi\u00e9n sugiere que la fortaleza que rodea los esfuerzos de IA de las grandes tecnol\u00f3gicas puede no ser tan impenetrable como pens\u00e1bamos. En pocas palabras, probablemente veremos pronto modelos mucho m\u00e1s competitivos, porque DeepSeek (a diferencia de los productos de OpenAI) se puede descargar y ejecutar en computadoras personales, incluso sin conexi\u00f3n a Internet.<\/p>\n\n\n\n<p><strong>Lo que debes saber sobre DeepSeek<br><\/strong>La empresa fue fundada en 2023 por Liang Wenfeng, un nombre poco conocido en el mundo de la IA hasta ahora. Wenfeng es un ingeniero electr\u00f3nico que se gradu\u00f3 de sus estudios de maestr\u00eda en 2010. Desde entonces, ha trabajado en comercio cuantitativo y ha tratado de integrar las matem\u00e1ticas y la IA en el comercio. En 2019, administraba alrededor de US$13 mil millones en activos. Ha hablado repetidamente sobre c\u00f3mo las empresas chinas est\u00e1n demasiado acostumbradas a seguir y, en cambio, deber\u00edan tratar de liderar los mercados.<\/p>\n\n\n\n<p>DeepSeek se fund\u00f3 cuando Liang adquiri\u00f3 10,000 GPU Nvidia A100 antes de que el gobierno de EE. UU. impusiera restricciones a los chips de IA en China. En China, r\u00e1pidamente se hizo conocida por su alternativa barata a la IA, lo que provoc\u00f3 una guerra de precios con otras empresas chinas rivales de IA como Bytedance. Aunque DeepSeek cobraba precios m\u00e1s bajos que sus competidores, era rentable, mientras que sus competidores perd\u00edan dinero, una se\u00f1al de que sus modelos ya eran muy eficientes.<\/p>\n\n\n\n<p>Sin embargo, Liang ha declarado que DeepSeek se centra \u00fanicamente en la investigaci\u00f3n y no tiene planes detallados de comercializaci\u00f3n, lo que le permiti\u00f3 evitar las estrictas disposiciones impuestas por el gobierno chino. Esto tambi\u00e9n significa que tiene que cumplir con la censura impuesta por China. Por ejemplo, se negar\u00e1 a hablar sobre la masacre de Tiananmen u otros temas que China considere &#8220;sensibles&#8221;, como la persecuci\u00f3n de los uigures por parte de China o los derechos humanos en China.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" src=\"https:\/\/einsteresante.com\/wp-content\/uploads\/2025\/01\/image-94.png\" alt=\"\" class=\"wp-image-67664\"\/><figcaption class=\"wp-element-caption\">R1 de DeepSeek describi\u00f3 a Taiw\u00e1n como \u201cuna parte inalienable del territorio de China\u201d y declar\u00f3: \u201cNos oponemos firmemente a cualquier forma de actividad separatista de \u2018independencia de Taiw\u00e1n\u2019 y estamos comprometidos a lograr la reunificaci\u00f3n completa de la patria a trav\u00e9s de medios pac\u00edficos\u201d.<\/figcaption><\/figure>\n\n\n\n<p>En t\u00e9rminos simples, DeepSeek es un chatbot impulsado por IA, como ChatGPT. La descripci\u00f3n de su aplicaci\u00f3n dice vagamente que est\u00e1 dise\u00f1ado &#8220;para responder a sus preguntas y mejorar su vida de manera eficiente&#8221;. Funciona con el mismo enfoque general que el modelo O1 de Open AI, utilizando un &#8220;razonamiento&#8221; de varios pasos, considerado actualmente el enfoque m\u00e1s poderoso.<\/p>\n\n\n\n<p>El Partido Comunista de China a\u00fan no ha comentado los logros, pero los medios estatales chinos se mostraron exultantes y se\u00f1alaron que Silicon Valley est\u00e1 \u201cperdiendo el sue\u00f1o\u201d por DeepSeek.<\/p>\n\n\n\n<p>\u201cEn China, los avances de DeepSeek se celebran como un testimonio de la creciente destreza tecnol\u00f3gica y la autosuficiencia del pa\u00eds\u201d, dice Marina Zhang, profesora asociada de la Universidad de Tecnolog\u00eda de Sydney, para la BBC.<\/p>\n\n\n\n<p>\u201cEl \u00e9xito de la empresa se considera una validaci\u00f3n de la Innovaci\u00f3n 2.0 de China, una nueva era de liderazgo tecnol\u00f3gico local impulsado por una generaci\u00f3n m\u00e1s joven de empresarios\u201d.<\/p>\n\n\n\n<p>Los consumidores que deseen utilizar este producto deben ser conscientes de los posibles problemas de privacidad. Si bien se confirma la censura en DeepSeek, tambi\u00e9n existen temores de que el sistema de inteligencia artificial pueda usarse para la influencia extranjera, la desinformaci\u00f3n, la vigilancia y el desarrollo de armas cibern\u00e9ticas para el servicio secreto chino. Al igual que TikTok, los expertos advierten que la aplicaci\u00f3n transfiere \u201cexpl\u00edcitamente\u201d datos personales a China.<\/p>\n\n\n\n<p>Fuente: <a href=\"https:\/\/www.zmescience.com\/science\/news-science\/sam-altman-said-it-was-hopeless-for-smaller-ais-to-compete-with-openai-deepseek-proved-him-wrong\/\">ZME Science<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Es dif\u00edcil exagerar el impacto que ha tenido DeepSeek. En un par de d\u00edas, sacudi\u00f3 a toda la industria de la IA, rompiendo el aura de invencibilidad que OpenAI (y las empresas tecnol\u00f3gicas estadounidenses en general) hab\u00edan construido a su alrededor. La nueva IA de DeepSeek es la aplicaci\u00f3n gratuita m\u00e1s descargada en la Apple [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[14],"tags":[],"class_list":["post-67644","post","type-post","status-publish","format-standard","hentry","category-tecnologia"],"_links":{"self":[{"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/posts\/67644","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/comments?post=67644"}],"version-history":[{"count":20,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/posts\/67644\/revisions"}],"predecessor-version":[{"id":67668,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/posts\/67644\/revisions\/67668"}],"wp:attachment":[{"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/media?parent=67644"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/categories?post=67644"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/tags?post=67644"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}