La carrera por sostener el liderazgo en la industria de la inteligencia artificial (IA) tuvo un hito importante el 20 de enero, cuando la compañía china DeepSeek ganó repercusión internacional gracias a su modelo R1, que sobresale no solo por su solvencia sino además por el bajo costo que ostenta frente a competidores como OpenAI, que a partir de entonces hizo nuevos lanzamientos para afianzar su posición en el mercado de chatbots inteligentes.

La firma con sede en San Francisco anunció el domingo una nueva herramienta para su producto estrella, ChatGPT. Se trata de "deep research" (investigación profunda), un agente de IA –es decir, un modelo optimizado para la resolución de tareas específicas– con la capacidad de elaborar reportes equiparables a los de un analista de investigación, según indicaron sus desarrolladores.

Lo que OpenAI destacó sobre deep research es que "logra en decenas de minutos lo que a un humano le tomaría muchas horas". En concreto, este agente integrado en la versión Pro de ChatGPT (que cuesta USD 200 al mes) funciona impulsado por una versión de o3, el modelo de vanguardia de la compañía, y tiene un límite de hasta 100 consultas al mes.

Con la función de deep research, ChatGPT es capaz de encontrar, analizar y sintetizar cientos de fuentes en línea para crear un "informe completo", examinando para ello "cantidades masivas" de texto, imágenes y archivos PDF.

OpenAI lanzó una demo en video el domingo mostrando cómo deep research generaba un análisis sobre el mercado para aplicaciones de traducción. En esa presentación, la compañía explicó que la herramienta se toma entre cinco y 30 minutos para completar cada tarea, y al finalizar cita las fuentes de cada una de las afirmaciones que incluye en sus reportes.

Aunque indicaron que este agente de investigación profunda esta destinado a profesionales que trabajan en áreas como finanzas, ciencia e ingeniería, también puede ser utilizado para examinar las posibilidades de compra de un usuario que está buscando, por ejemplo, automóviles o muebles.

Este anuncio de OpenAI llegó días después de que la compañía dirigida por Sam Altman anunciara que aceleraría sus lanzamientos en respuesta a los avances logrados por DeepSeek.

El salto a o3, el modelo de frontera de OpenAI

Desde el lanzamiento de ChatGPT, que en sus inicios funcionaba con el modelo GPT-3.5, OpenAI ha iterado en varias ocasiones la tecnología que constituye el cerebro detrás de sus productos, y su último lanzamiento fue o3, sucesor de o1 y su modelo de "razonamiento" más potente hasta la fecha.

A diferencia de modelos anteriores, la compañía de IA dio un giro en esta nueva serie para potenciar sus capacidades de procesamiento y analíticas, configurándolos para que se tomen más tiempo para "pensar" a la hora de generar sus respuestas.

Es por esto que los modelos de la serie "o" dedican más tiempo a procesar los pedidos de los usuarios en comparación con los modelos convencionales, que priorizan la velocidad en la generación de sus respuestas. OpenAI apuntó que la serie de modelos o3 fue optimizada para búsquedas web y análisis de datos.

De momento, o3 solo está disponible para algunos usuarios de ChatGPT, mientras que su versión más reducida, o3-mini, sí se lanzó de manera abierta. El segundo es la alternativa más rápida y eficiente, para usos que no requieren de tanto tiempo de investigación, aunque sigue la misma lógica de tomarse más tiempo para responder.

Comparativa de las capacidades para resolver tareas de programación entre los modelos de la serie o de OpenAI.

Este lanzamiento no pasó desapercibido entre especialistas, algunos de los cuales manifestaron su preocupación por el rápido avance de la IA. Esto quedó plasmado en el primer Informe Internacional sobre Seguridad de la IA del AI Action Summit, en el que Yoshua Bengio, editor principal del reporte, se refirió a o3 y advirtió que sus capacidades "podrían tener profundas implicaciones para los riesgos de la IA".

Bengio dijo que o3 sorprendió a los expertos, incluido él mismo, con su desempeño en una prueba clave de razonamiento abstracto.

Andrew Rogoyski, director del Instituto de IA centrada en las personas de la Universidad de Surrey, también se expresó en el mismo sentido al mencionar el riesgo de que los humanos confíen plenamente en los resultados de herramientas como la investigación profunda hecha por IA, prescindiendo del chequeo de la información.

"Hay un problema fundamental con las IA intensivas en conocimiento y es que un humano necesitará muchas horas y mucho trabajo para verificar si el análisis de la máquina es bueno", dijo Rogoyski.

Otro de los lanzamientos recientes de OpenAI fue Operator, un agente diseñado para completar tareas repetitivas que los usuarios desarrollan en sus navegadores, como completar formularios, realizar compras online e incluso crear memes. Operator interpreta las interfaces de las plataformas en las que se llevan a cabo estas tareas, y puede incluso usar una foto de una lista de compras para generar un pedido completo.

De momento, solo está disponible mediante una versión de prueba en Estados Unidos. Para funcionar, se confeccionó un nuevo modelo llamado Computer-Using Agent (CUA), que combina las capacidades de visión de GPT-4o con el razonamiento avanzado a través del aprendizaje por refuerzo.