OpenAI lanza modelo de inteligencia artificial más rápido y económico de ChatGPT
OpenAI está lanzando una versión más rápida y económica del modelo de inteligencia artificial que sustenta su chatbot, ChatGPT, mientras la startup trabaja para mantener su liderazgo en un mercado cada vez más saturado.
Durante un evento transmitido en vivo el lunes, OpenAI presentó GPT-4o. Es una versión actualizada de su modelo GPT-4, que ahora tiene más de un año. El nuevo modelo de lenguaje grande, entrenado con grandes cantidades de datos de Internet, manejará mejor texto, audio y video en tiempo real. Las actualizaciones estarán disponibles en las próximas semanas.
Haga una pregunta verbalmente y el sistema podrá responder con una respuesta de audio en milisegundos, según la compañía, lo que permitirá una conversación más fluida. Del mismo modo, si le envía al sistema un mensaje de imagen, puede responder con una imagen.
"Esta es la primera vez que estamos dando un gran salto en la interacción y la facilidad de uso", dijo a Bloomberg News Mira Murati, directora de tecnología de OpenAI. "Realmente estamos haciendo posible que usted colabore con herramientas como ChatGPT".
La actualización traerá una serie de funciones para los usuarios gratuitos que anteriormente estaban limitadas a aquellos con una suscripción paga a ChatGPT, como la capacidad de buscar en la web respuestas a consultas, hablar con el chatbot y escuchar respuestas en varias voces, y ordénele que almacene detalles que el chatbot pueda recordar en el futuro.
El lanzamiento de GPT-4o está a punto de revolucionar el panorama de la IA en rápida evolución, donde GPT-4 sigue siendo el estándar de oro. Un número creciente de nuevas empresas y grandes empresas tecnológicas, incluidas Anthropic, Cohere y Google de Alphabet Inc., han lanzado recientemente modelos de inteligencia artificial que, según dicen, igualan o superan el rendimiento de GPT-4 en ciertos puntos de referencia.
El anuncio de OpenAI también llega el día antes de la conferencia de desarrolladores Google I/O. Se espera que Google, uno de los primeros líderes en el espacio de la inteligencia artificial, utilice el evento para revelar más actualizaciones de IA después de competir para seguir el ritmo de OpenAI, respaldado por Microsoft Corp.
En lugar de depender de diferentes modelos de IA para procesar diferentes entradas, GPT-4o (la “o” significa omni) combina voz, texto y visión en un solo modelo, lo que le permite ser más rápido que su predecesor. La compañía afirmó que el nuevo modelo es dos veces más rápido y significativamente más eficiente.
"Cuando tienes tres modelos diferentes que funcionan juntos, se introduce mucha latencia en la experiencia y se rompe la inmersión de la experiencia", dijo Murati. "Pero cuando tienes un modelo que razona de forma nativa a través de audio, texto y visión, entonces eliminas toda la latencia y puedes interactuar con ChatGPT más como lo estamos haciendo ahora".
Pero el nuevo modelo tuvo algunos inconvenientes. El audio se cortaba con frecuencia mientras los investigadores hablaban durante su demostración. El sistema de inteligencia artificial también sorprendió a la audiencia cuando, después de guiar a un investigador a través del proceso de resolución de un problema de álgebra, intervino con una voz que sonó coqueta: "Vaya, ese es el traje que tienes puesto".
OpenAI está comenzando a implementar las nuevas capacidades de texto e imagen de GPT-4o para algunos usuarios de pago de ChatGPT Plus y Team hoy, y pronto ofrecerá esas capacidades a los usuarios empresariales. La compañía pondrá a disposición de los usuarios de ChatGPT Plus la nueva versión de su asistente en “modo de voz” en las próximas semanas.
Como parte de sus actualizaciones, OpenAI dijo que también permitirá que cualquiera acceda a su tienda GPT, que incluye chatbots personalizados creados por los usuarios. Anteriormente, sólo estaba disponible para clientes de pago.
La especulación sobre el próximo lanzamiento de OpenAI se ha convertido en un juego de mesa en Silicon Valley en las últimas semanas. Un nuevo y misterioso chatbot causó revuelo entre los observadores de la IA después de que apareció en un sitio web de evaluación comparativa y pareció rivalizar con el rendimiento de GPT-4. El director ejecutivo de OpenAI, Sam Altman, hizo guiños de referencia al chatbot en X, alimentando los rumores de que su empresa estaba detrás de esto.
La empresa está trabajando en una amplia gama de productos, incluida tecnología de voz y software de vídeo. OpenAI también está desarrollando una función de búsqueda para ChatGPT, informó anteriormente Bloomberg .
El viernes, la compañía sofocó algunas de las especulaciones febriles diciendo que no lanzaría de manera inminente GPT-5, una versión muy esperada de su modelo que algunos en el mundo tecnológico esperan que sea radicalmente más capaz que los sistemas de IA actuales. También dijo que no presentaría un nuevo producto de búsqueda, una herramienta que podría competir con Google. Las acciones de Google subieron con la noticia.
Pero después de que concluyó el evento, Altman se apresuró a mantener la especulación. "Pronto tendremos más cosas para compartir", escribió en X.