
La startup de inteligencia artificial (AI) China Deepseek ha creado un revuelo entre los entusiastas de la IA con su lanzamiento de una actualización a su modelo insignia, a saber, Deepseek-V3.1, el jueves.
La compañía dijo que el nuevo modelo puede funcionar más rápido que el modelo anterior y está optimizado para chips de fabricación china.
El Deepseek-V3.1 presenta una estructura de inferencia híbrida que permite que el modelo opere tanto en modos de razonamiento como de razonamiento, dijo la compañía en un puesto de WeChat el jueves.
Los usuarios pueden alternar entre estos modos utilizando un botón de «pensamiento profundo» en la aplicación y la plataforma web oficial de la compañía, los cuales ahora ejecutan la versión V3.1.
Revisiones positivas
El consenso de las revisiones iniciales es muy positiva, y muchos ven el modelo como un poderoso contendiente a los AIS de código cerrado de primer nivel.
El modelo es elogiado por su razonamiento superior y sus habilidades de resolución de problemas, particularmente en matemáticas y codificación. En varias pruebas, ha mostrado una capacidad impresionante para desglosar tareas complejas y generar código funcional, incluida la creación de juegos y aplicaciones simples desde cero.
Deepseek sacudió el mundo de la tecnología este año cuando lanzó modelos AI que compiten con los occidentales como el chatgpt de OpenAi con costos operativos significativamente más bajos. El nuevo modelo siguió esa tradición rentable. Sus capacidades se consideran una alternativa viable y más asequible para los desarrolladores y usuarios que desean un alto rendimiento sin el alto precio de algunos modelos comerciales.
Apoyo a las chips nacionales
Para el apoyo a las chips domésticos, Deepseek dijo en un puesto de WeChat su formato de precisión UE8M0 FP8 de Deepseek-V3.1 Modelo está optimizado para «chips domésticos de próxima generación que pronto se liberaron».
FP8, o punto flotante de 8 bits, es un formato de procesamiento de datos que permite que los modelos de IA funcionen de manera más eficiente, utilizando menos memoria mientras se ejecuta más rápido que los métodos tradicionales.
La compañía no identificó qué modelos o fabricantes de chips específicos serían admitidos.
El enfoque en la compatibilidad de chips domésticos puede indicar que los modelos de IA de Deepseek se están posicionando para trabajar con el ecosistema de semiconductores emergentes de China.
(Con aportes de Reuters)
