OpenAI lanza un modelo de inteligencia artificial con capacidad de razonar

 

OpenAI ha anunciado hoy una nueva familia de modelos de inteligencia artificial, bautizados o1, capaces de "razonar de manera similar a un ser humano" y abordar problemas complejos en matemáticas, programación y ciencia. El anuncio supone un nuevo paso en el objetivo de OpenAI de crear una inteligencia artificial general.

"Estamos ante el comienzo de un nuevo paradigma: una IA que puede realizar razonamientos complejos de propósito general", ha escrito Sam Altman, CEO de OpenAI, en la red social X.

El modelo o1 de OpenAI ha aprendido a pensar de manera crítica, a considerar diferentes enfoques y a reconocer sus propios errores para aprender . Esta capacidad de razonamiento profundo permite a o1 abordar problemas complejos de manera más efectiva que los modelos anteriores, según asegura la compañía. Como la IA dedica más tiempo a pensar y generar una respuesta más reflexionada, en lugar de responder de inmediato como los modelos GPT, será posible mejorar la calidad de las respuestas.

"o1 piensa durante segundos, pero nuestro objetivo es que las versiones futuras piensen durante horas, días e incluso semanas. El coste de generar la respuesta será mayor, pero, ¿cuánto se pagaría por un nuevo medicamento contra el cáncer? ¿Por baterías innovadoras? ¿Por una prueba de la hipótesis de Riemann? La IA puede ser más que chatbots", ha señalado el investigador de OpenAI Noam Brown en un post en X.

La compañía creadora de ChatGPT asegura en un comunicado que este nuevo modelo ha demostrado en las pruebas realizadas un rendimiento comparable al de estudiantes de doctorado en campos como la física, química y biología. Asimismo, señala que han obtenido buenos resultados en matemáticas y programación. Según OpenAI, en el examen de la Olimpiada Internacional de Matemáticas, o1 obtuvo una puntuación del 83%, lo que supone una mejora significativa respecto a sus predecesores.

El laboratorio de IA matiza que el lanzamiento de o1, que se conocía durante su desarrollo con el nombre clave de Strawberry, no significa que la compañía abandone el desarrollo de nuevas versiones de sus modelos GPT.

De hecho, OpenAI señala que estos nuevos modelos todavía tienen limitaciones. Al tratarse de un modelo incipiente, aún no dispone de muchas de las funciones que hacen útil a ChatGPT, como la búsqueda de información en Internet y la carga de archivos e imágenes. Asimismo, puede tardar más tiempo dar una respuesta. En este sentido, la start up señala que para muchos casos de uso su modelo GPT-4o "será más eficiente a corto plazo".

El modelo, en inglés, se puede probar en una versión preliminar a través de ChatGPT, seleccionándolo en el selector de modelos para los usuarios de pago de sus versiones Plus y Team. Los suscriptores de los planes para empresas y educación podrán acceder la próxima semana.

La compañía también ha lanzado un modelo más pequeño y rápido, denominado o1 mini, diseñado especialmente para programar código. En ambos casos, hay una limitación de uso semanal, concretamente de 30 preguntas para o1 y 50 para la versión mini.

La empresa dirigida por Sam Altman asegura que su objetivo en el futuro es integrarlo en ChatGPT, de manera que el chatbot pueda utilizar el modelo más adecuado (o1 o GPT) en función de la petición que haga el usuario. Asimismo, señala que en próximas versionesm o1 será capaz de buscar información online, así como comprender archivos e imágenes.

Los modelos GPT de OpenAI han sido entrenados para poder reproducir patrones del texto. Sin embargo, el enfoque del modelo o1 es diferente: en lugar de limitarse a imitar patrones, aprende a resolver problemas por sí mismo utilizando aprendizaje por refuerzo, una técnica que enseña al sistema mediante recompensas y penalizaciones.

Además, o1 utiliza un proceso de razonamiento similar al humano, en el que analiza problemas paso a paso para llegar a una solución, en lugar de responder de manera instantánea. De esta forma, se pretende que la IA tenga menos "alucinaciones", que es el término que se utiliza cuando los chatbots inventan la información.

El anuncio supone un nuevo paso en la forma en la que los modelos de IA procesan la información, puesto que ya no están limitados al entrenamiento previo, como los GPT. Ahora, se puede mejorar el rendimiento otorgando más recursos computacionales durante el proceso en el que el modelo "piensa" para generar la respuesta, de manera que pueda hacer razonamientos más complejos o profundos y, por tanto, mejorar la calidad de sus respuestas.

Este tipo de modelos no siempre son mejores, según señala Brown. "Muchas tareas no necesitan razonamiento y, a veces, no vale la pena esperar una respuesta de o1 en lugar de una rápida de GPT-4o. Una de las motivaciones para lanzar una versión preliminar es ver qué casos de uso son más populares, para mejorar así los modelos", explica.

OpenAI persigue crear una inteligencia artificial general, es decir, aquella que busca replicar la capacidad cognitiva humana. Esta inteligencia, de alcanzarse, podría ser capaz de comprender, aprender y aplicar el conocimiento en cualquier tarea intelectual.

Esta carrera tecnológica requiere de cuantiosos recursos financieros. La compañía está negociando una ronda de financiación de hasta 6.500 millones de dólares a una valoración de 150.000 millones de dólares.

.-

Comentarios

Entradas populares