Home Tecnología Sam Altman cube que Operai lanzará un modelo de IA de ‘peso...

Sam Altman cube que Operai lanzará un modelo de IA de ‘peso abierto’ este verano

4
0

Sam Altman reveló hoy que Operai lanzará un modelo de inteligencia synthetic de peso abierto en los próximos meses.

“Estamos entusiasmados de lanzar un poderoso modelo de lenguaje de peso abierto con razonamiento en los próximos meses”, escribió el CEO en x.

La medida es en parte una respuesta al éxito fugitivo del modelo R1 de la compañía china Deepseek, así como la popularidad de los modelos de Llama de Meta.

Poco después de que el modelo de Deepseek se lanzó en enero, Altman dijo que OpenAi estaba “en el lado equivocado de la historia” con respecto a los modelos abiertos, lo que indica un cambio possible en la dirección. El lunes dijo que la compañía ha estado pensando en lanzar un modelo de peso abierto durante algún tiempo, agregando “ahora se siente importante hacerlo”.

Operai puede sentir la necesidad de demostrar que puede entrenar al nuevo modelo a bajo precio, ya que el modelo de Deepseek fue supuestamente entrenado a una fracción del costo de la mayoría de los modelos de IA grandes.

“Esta es una noticia increíble”, dijo a Wired de Clement Delangue, cofundador y CEO de Huggingface, una compañía que se especializa en alojar modelos de IA abiertos. “Con Deepseek, todos se están dando cuenta del poder de los pesos abiertos”.

Operai actualmente hace que su IA esté disponible a través de un chatbot y a través de la nube. R1, LLAMA y otros modelos de peso abierto se pueden descargar de forma gratuita y modificada. Los pesos de un modelo se refieren a los valores dentro de una gran crimson neuronal, algo que se establece durante el entrenamiento. Los modelos de peso abierto son más baratos de usar y también se pueden adaptar para casos de uso confidenciales, como manejar información altamente confidencial.

Steven Heidel, miembro del private técnico de Operai, reposté Altman’s Anuncio y agregó: “Estamos lanzando un modelo este año que puede ejecutar en su propio {hardware}”.

Johannes Heidecke, un investigador que trabaja en la seguridad de la IA en Operai, también volvió a publicar el mensaje en X, y agregó que la compañía realizaría pruebas rigurosas para garantizar que el modelo de peso abierto no se pudiera usar fácilmente. A algunos investigadores de IA les preocupa que los modelos de peso abierto puedan ayudar a los delincuentes a lanzar ataques cibernéticos o incluso a desarrollar armas biológicas o químicas. “Si bien los modelos abiertos traen desafíos únicos, estamos guiados por nuestro marco de preparación y no lanzaremos modelos que creemos que plantean riesgos catastróficos”, escribió Heidecke.

Operai At this time también publicó una página net Invitando a los desarrolladores Para solicitar el acceso temprano al próximo modelo. Altman dijo en su publicación que la compañía organizaría eventos para desarrolladores con prototipos tempranos del nuevo modelo en las próximas semanas.

Meta fue la primera compañía importante de IA en seguir un enfoque más abierto, lanzando la primera versión de LLAMA en julio de 2023. Un número creciente de modelos de IA de peso abierto ya está disponible. Algunos investigadores señalan que LLAMA y otros modelos no son tan transparentes como podrían ser, porque los datos de capacitación y otros detalles aún se mantienen en secreto. Meta también impone una licencia que limita la capacidad de otras compañías para beneficiarse de las aplicaciones y herramientas construidas con LLAMA.

ACTUALIZACIÓN 31 de marzo de 2025, 4:21 EST: Este artículo se actualizó con un comentario de Clement Delangue, cofundador y CEO de Huggingface.

fuente