Saltar al contenido

Operai lanza Modelos gratuitos y descargables en la competencia.

Los logotipos de OpenAI y ChatGPT se ven que se muestran en un teléfono inteligente y un fondo. /VCG

Openai dijo el martes que ha lanzado dos modelos de idiomas de peso abierto que se destacan en un razonamiento avanzado y están optimizados para ejecutarse en computadoras portátiles con niveles de rendimiento similares a sus modelos de razonamiento patentados más pequeños.

Los desarrolladores pueden utilizar los parámetros o pesos capacitados de un modelo de lenguaje abierto, lo que los desarrolladores pueden utilizar para analizar y ajustar el modelo para tareas específicas sin requerir datos de capacitación originales.

«Una de las cosas que son únicas sobre los modelos abiertos es que las personas pueden ejecutarlos localmente. La gente puede ejecutarlas detrás de su propio firewall, en su propia infraestructura», dijo el cofundador de Operai, Greg Brockman, en una sesión informativa de prensa.

Los modelos de lenguaje de peso abierto son diferentes de los modelos de código abierto, que proporcionan acceso al código fuente completo, datos de capacitación y metodologías.

El paisaje de los modelos AI de peso abierto y de código abierto ha sido muy disputado este año. Durante un tiempo, los modelos de llama de Meta se consideraron los mejores, pero eso cambió a principios de este año cuando Deepseek de China lanzó un modelo de razonamiento poderoso y rentable, mientras que Meta luchó por entregar LLAMA 4.

Los dos nuevos modelos Operai son los primeros modelos abiertos que Openai ha lanzado desde GPT-2, que se lanzó en 2019.

El modelo más grande de OpenAI, GPT-OSS-20B, puede ejecutarse con una sola GPU, y el segundo, GPT-OSS-20B, es lo suficientemente pequeño como para funcionar directamente en una computadora personal, dijo la compañía.

Operai dijo que los modelos tienen un rendimiento similar a sus modelos de razonamiento patentados llamados O3-Mini y O4-Mini, y especialmente Excel en la codificación, las matemáticas de competencia y las consultas relacionadas con la salud.

Los modelos fueron entrenados en un conjunto de datos solo de texto que además del conocimiento general, se centró en la ciencia, las matemáticas y el conocimiento de la codificación. Operai no lanzó puntos de referencia que compararon los modelos de peso abierto con los modelos de los competidores como el modelo Deepseek-R1.

(Con aportes de agencias)