¿Sabías que...?ActualidadSociedad

Deepseek, la aplicación de inteligencia artificial china que está cambiando el panorama tecnológico

DeepSeek, el chat de inteligencia artificial creado por China está revolucionando el mercado: ya es la aplicación gratuita más descargada en App Store, superando incluso a ChatGPT.

El 20 de enero, la startup china DeepSeek, dirigida Liang Wenfeng, lanzó R1. Lo que pilló por sorpresa a Silicon Valley y al resto del mundo de la inteligencia artificial (IA) porque el modelo de lenguaje de gran tamaño (LLM, por sus siglas en inglés) podría ser más eficiente que el de los modelos rivales creados por OpenAI, Google y Meta.

Y no podemos olvidar que estas empresas estadounidenses han invertido miles de millones de dólares en la adquisición de chips y datos avanzados para crear sistemas capaces de resolver problemas complejos. Pero DeepSeek parece estar construyéndolos a niveles similares a una fracción del coste.

En un informe publicado a finales de diciembre, los investigadores de DeepSeek calculaban que habían creado y entrenado su modelo V3 por menos de 6 millones de dólares (5,71 millones de euros) utilizando unos 2.000 chips Nvidia H800.

Mientras que empresas como Meta están enloquecidas por conseguir chips Nvidia H100 por miles de millones de euros para construir sus chatbots. Los chips H100 son las GPU insignia de Nvidia.

 

Las sanciones de EEUU impiden a China importar H100, así que, en su lugar importa H800, que tienen menores tasas de transferencia de datos.

 

Además, los futuros sobre los principales indicadores de Wall Street adelantan una apertura en negativo este lunes, con pérdidas superiores al 3% para el índice Nasdaq, ante la irrupción de DeepSeek, cuyos avances desafían el liderazgo estadounidense.

El modelo R1 es comparable con el o1 de OpenAI, la firma creadora del ChatGPT, en la resolución de problemas matemáticos, la programación y la inferencia del lenguaje natural.

Su modelo es de código abierto, con lo que cualquier persona puede examinarlo, modificarlo y desarrollarlo en función de sus necesidades, algo que ha generado un notable impacto en la comunidad de desarrolladores, que destaca tanto su eficiencia como su bajo costo.

Hay voces que apuntan a que China busca que sus empresas ganen influencia global con este tipo de modelos para dar forma a los estándares y las prácticas internacionales de las IA, así como ganar mercado en los países en desarrollo.

Además, este lanzamiento se ha producido justo cuando el presidente estadounidense, Donald Trump, anunciaba el proyecto ‘Stargate’, en el que invertirá 500.000 millones de dólares en los próximos 4 años para construir nuevos centros de datos para apoyar proyectos de IA.

E inmediatamente después de que Washington impusiese restricciones a la exportación a China de chips de alto rendimiento -como los desarrollados por Nvidia y AMD-, a lo que Pekín respondió con llamadas a la innovación.

«El enfoque de DeepSeek desafía el dominio de EEUU en IA, demostrando que sus restricciones han sido ineficaces», señaló el académico Li Baiyang al rotativo ‘GLobal Times’.

Según la empresa china, su modelo fue entrenado durante 55 días con un presupuesto de 5,57 millones de dólares, utilizando procesadores gráficos H800 de Nvidia, una versión de capacidad reducida diseñada para el mercado chino.

Este costo representa menos de una décima parte del gasto en el entrenamiento del modelo 4o de OpenAI, según el periódico chino ‘The Paper’.

Por su parte, DeepSeek señala que su R1 utiliza técnicas avanzadas de aprendizaje automático, lo que le permite «mejorar notablemente» su capacidad para realizar tareas complejas con menos datos previos.

Asimismo, la compañía hizo públicos detalles técnicos de los procesos de entrenamiento del modelo, lo que permitió a otros usuarios utilizarlos como base para desarrollar otras herramientas.

Las comparativas de precios se basan en el cálculo de tókenes, donde 1.000 equivalen aproximadamente a 750 palabras en inglés.

DeepSeek ofrece servicios de interfaz de programación de aplicaciones (API) a un costo de 1 yuan (0,14 dólares, 0,13 euros) por millón de tókenes de entrada y 16 yuanes (2,2 dólares, 2,1 euros) por millón de tókenes de salida.

En comparación, el modelo o1 de OpenAI tiene un precio de 15 dólares (unos 14,4 euros) por millón de tókenes de entrada y 60 dólares (aproximadamente 57 euros) por millón de tókenes de salida.

China reguló en 2023 los servicios de IA para que respeten «los valores socialistas fundamentales», con lo que tienen prohibido «generar contenidos que atenten contra la seguridad nacional, la unidad territorial y la estabilidad social».

Así, muchos internautas centran sus conversaciones estos días sobre la censura en la ‘app’, a la que preguntan sobre la Masacre de Tiananmen de 1989 o si Taiwán forma parte de China, pero DeepSeek se niega a comentar sobre estas cuestiones y sugiere al usuario a que pregunte sobre problemas de «matemáticas, codificación y lógica».

Otra de las principales características de DeepSeek es que su chatbot nativo, el de su web oficial, es totalmente gratuito y no requiere de ninguna suscripción para utilizar su modelo más avanzado.

DeepSeek ha sido desarrollado usando aprendizaje por refuerzo puro, sin datos etiquetados previamente. Lo que supone una hazaña técnica que hasta ahora se consideraba imposible, y que abre nuevas puertas al entrenamiento de este tipo de sistemas.

Este aprendizaje por refuerzo permite que el modelo sea capaz de aprender por si mismo mediante prueba y error, igual que hacemos los humanos.

Esto hace que el resultado inicial sea más errático e impreciso, pero así el propio modelo va descubriendo y desarrollando estrategias de razonamiento únicas para seguir mejorando.

Una vez realizado este entrenamiento, DeepSeek refinó el modelo combinándolo con otros entrenamientos supervisados para pulirlo y crear la versión final de R1, que mantiene este componente pero añadiendo consistencia y pulido.

De cara al usuario su funcionamiento es igual que el de otros modelos. Tiene una pantalla de inicio con una campo de escritura y varias opciones. También dispones de una columna izquierda con un historial de todos tus chats.

Así que, para usarlo tienes que escribir una pregunta en lenguaje natural, igual que lo harías con una pregunta. Entonces, DeepSeek analizará las palabras de tu pregunta para encontrar el resultado, y luego buscará en la base de datos con la que fue entrenado o en Internet para obtener datos con los que componer una respuesta también en lenguaje natural.

Gracias a la manera en la que ha sido creado, este modelo puede entender contextos complejos de preguntas muy largas y elaboradas. Además de ir aprendiendo y mejorando.

Su aplicación puede usarse gratis online o bajándose su app móvil, y no tiene ninguna cuota.

Con este modelo de IA puedes hacer prácticamente lo mismo que con otros modelos. Puedes hacerle todo tipo de preguntas, y te responderá en tiempo real. Preguntale por personajes famosos, lugares, significados, y cualquier cosa que se te ocurra.

Es muy útil para estudiar, ya que puede explicarte temas complejos de manera sencilla, siempre y cuando le pidas específicamente que lo haga así.

También puedes enviarle documentos para que extraiga información clave sobre ellos, y hacerle preguntas relacionadas cobre su contenido.

Sirve para los programar porque puedes escribir o depurar código, así como para resolver problemas matemáticos.

Además, si eres un creador de contenido puedes pedirle que te genere ideas, textos, que componga poesía, o que te cree plantillas o estructuras para artículos. También puede revisar y corregir textos.

En el cuadro donde escribes tu prompt o pregunta, tienes 3 botones y el clip para adjuntar archivos. Pero además tienes el botón de DeepThink R1 para hacer que la IA «piense» en lo que te ha respondido antes o en tu contexto, y te de una respuesta razonada.

Y el botón Search sirve para obtener la información de Internet, indicando cuáles son las fuentes antes de darte la respuesta.

Luego, con cada respuesta que te da tienes botones para copiar el texto, 2 botones para calificarlo positiva o negativamente dependiendo de la calidad de la respuesta, y otro para recargar la respuesta y que te la vuelva a generar desde cero basándose en tu mismo prompt.

Mostrar más

Publicaciones relacionadas

Botón volver arriba