OpenAI ha lanzado recientemente un modelo de código abierto llamado GPT-OSS, que es el primer modelo con pesos públicos desde el lanzamiento de GPT-2 en 2019. GPT-OSS ofrece dos versiones, incluyendo la gpt-oss-120b con 120 mil millones de parámetros y la gpt-oss-20b con 20 mil millones de parámetros. La versión más grande se puede ejecutar en una sola GPU de Nvidia y su rendimiento es comparable al modelo o4-mini existente, mientras que la versión más pequeña puede funcionar en dispositivos con solo 16 GB de memoria, con un rendimiento similar al modelo o3-mini. Ambas versiones están bajo la licencia Apache 2.0, permitiendo usos comerciales y están disponibles para descarga gratuita en plataformas como Hugging Face.
El CEO de OpenAI, Sam Altman, ha reconocido que la empresa no ha tomado la postura correcta en la historia de los modelos de código abierto, especialmente tras el lanzamiento este año por parte de la startup china DeepSeek de un modelo de código abierto rentable. Altman señaló que la innovación en modelos de código abierto espera expandirse en Estados Unidos, y subrayó que estos modelos son Basado en valores democráticos, se ofrece de forma gratuita al público.. El cofundador Greg Brockman ve este lanzamiento como suplemento de los servicios de pago existentes, en lugar de un competidor.
El modelo GPT-OSS aplica el método de razonamiento en cadena de pensamiento que OpenAI introdujo por primera vez en el modelo o1 el otoño pasado, a través de un enfoque de respuesta por pasos. Aunque estos modelos de texto puro no son multimodales, tienen la capacidad de navegar por la web, invocar modelos en la nube para ayudar en la ejecución de tareas, ejecutar código y funcionar como software de control de agentes de IA. A diferencia de ChatGPT, GPT-OSS puede funcionar de manera independiente en entornos sin conexión a internet o detrás de un cortafuegos.
Debido a que la publicación del modelo de pesos ha reducido las barreras de uso, permitiendo que cualquier persona intente ajustar el modelo para fines indebidos, OpenAI ha llevado a cabo las pruebas de seguridad más rigurosas en la historia. El investigador de seguridad Eric Wallace mencionó que el equipo realizó pruebas de ajuste detalladas en áreas de riesgo, evaluando a fondo los riesgos potenciales. De acuerdo con el marco de evaluación de preparación de OpenAI, este modelo de pesos públicos no ha alcanzado un nivel de riesgo alto, y el modelo mostrará el proceso de Cadena de pensamiento, permitiendo a los usuarios monitorear el comportamiento del modelo y corregir desinformaciones y abusos.
El investigador Chris Koch mencionó que el rendimiento del gpt-oss-120b es comparable al de los modelos o3 y o4-mini de OpenAI, superándolo incluso en algunas evaluaciones. Este lanzamiento también representa un desafío para Meta, el líder actual del ecosistema de código abierto. Desde 2023, Meta ha lanzado su primera serie de modelos Llama, siendo el más reciente Llama 4 un producto líder en el mercado. Mark Zuckerberg también ha insinuado que, por razones de seguridad, los futuros modelos podrían considerar abandonar la estrategia de código abierto.
Este lanzamiento se produce en el contexto de una creciente competencia por talentos en IA entre empresas tecnológicas como OpenAI y Meta. En 2025, los investigadores en IA, que serán muy solicitados, enfrentarán atractivas ofertas de trabajo. La nueva publicación de OpenAI podría generar una feroz competencia para Meta, y su impacto específico dependerá de la aceptación del modelo GPT-OSS por parte de los desarrolladores. Al mismo tiempo, Meta se centra en desarrollar una superinteligencia que supere la cognición humana y ha establecido un laboratorio interno dirigido por Alexandr Wang, el ex CEO de Scale.
Este lanzamiento marca un cambio significativo en la competitividad de la industria de la IA. Con la intensificación de la competencia entre China y Estados Unidos en el ámbito de la tecnología de IA, se espera que más empresas tecnológicas estadounidenses imiten a OpenAI y lancen modelos de código abierto para hacer frente a los competidores chinos. En los próximos meses, podríamos ver a gigantes tecnológicos como Google y Microsoft acelerar el lanzamiento de modelos de código abierto, mientras que la competencia en términos de estándares de seguridad y benchmarks de rendimiento se volverá cada vez más intensa.



