La guía de IA

Un blog sobre inteligencia artificial, generado 90% por inteligencia humana.

Chat GPT 4.5: ¿el hermano sensible y artístico de la familia OpenAI?

·

,

«El modelo más grande y con más conocimiento que hemos publicado hasta la fecha»

Mia Glaese, miembro del equipo de OpenAI

Con estas palabras presentó OpenAI a su modelo GPT-4.5, su más reciente lanzamiento y el sucesor de la familia de modelos GPT-4 que, a la fecha, son los que alimentan la versión gratuita de ChatGPT1.

Fuertes declaraciones, sí, en especial en el contexto de otros modelos que tanto OpenAI como sus competidores han publicado en los últimos meses. Quizás por eso, y para controlar expectativas, la empresa sintió la necesidad de advertir, incluso antes de su lanzamiento oficial, que el GPT-4.5 no se trata de un modelo de frontera2.

Pero, ¿cómo que no es un modelo de frontera si es el más grande que han publicado? ¿Por qué el modelo con más conocimiento en la historia de OpenAI fue recibido con reacciones como mucho tibias? Para responder estas preguntas, es necesario entrar en un poco más de detalle.

¿Qué es y qué no es GPT-4.5?

Desde el lanzamiento del modelo o1 en setiembre de 2024, OpenAI ha dividido sus modelos en dos grupos: los que razonan y los que no.

Los modelos que razonan son aquellos cuya numeración comienza con «o». De momento, estos son los pertenecientes a las familias o1 y o33. El uso del verbo razonar aquí es para tomar con pinzas, ya que cuando menos se puede poner en duda que las IA actuales sean capaces de un verdadero proceso de razonamiento4. Ahora, lo que sí hacen estos modelos es dedicar un tiempo para analizar el problema que se les plantea y dividirlo en pasos más pequeños antes de emitir una respuesta. GPT-4.5 no es un modelo razonador.

Esto significa que es un modelo del grupo de no razonadores que se caracterizan por responder de forma más rápida y directa. Por eso, mientras que los modelos razonadores funcionan mejor cuando se les plantean pocas prompts de mayor complejidad, a los modelos no razonadores es mejor usarlos de forma más bien conversacional, con prompts más escuetas que se complementen entre sí y los guíen en su proceso de respuesta. Este grupo de modelos incluye a familias como la GPT-3.5 y GPT-45.

En la mayoría de las pruebas o benchmarks a las que se suele someter a los modelos para determinar qué tan buenos son (y qué tanto debemos temer por nuestro futuro laboral), los modelos razonadores suelen puntuar mejor, ya que son óptimos para tareas que requieren un poco más de lógica, como problemas matemáticos o de programación.

Esta no es la excepción con GPT-4.5, que como modelo no razonador puntúa por debajo del modelo o3 (hasta ahora, el más potente de OpenAI) en casi todos los estándares de comparación. Entonces, ¿para qué molestarse en lanzar este nuevo modelo?

Es que GPT-4.5 no busca superar al modelo o3 en estas pruebas. Ya lo dijimos al comienzo: GPT-4.5 no es un modelo de frontera, pero sí promete mejoras en otros aspectos. Para empezar, según OpenAI, es un modelo más preciso y produce considerablemente menos alucinaciones. Pero, además, promete ser el mejor en un nuevo benchmark

Vibras, viejo

Así como lo leés: para OpenAI, GPT-4.5 es su modelo con mejores vibras. De hecho, la empresa desarrolló un benchmark de vibras que puso a prueba al pedir a humanos que puntuaran las respuestas de sus distintos modelos en varias rúbricas, incluyendo «inteligencia creativa».

¿La conclusión? Que GPT-4.5 es simplemente más chill. O, como dice OpenAI en su video de presentación, tiene un mayor coeficiente emocional. En otras palabras, GPT-4.5 te entiende mejor, es más empático, te escucha más, es mejor conversador. Y aunque suene más a un perfil desesperado de Tinder que a la descripción de características de un nuevo modelo de inteligencia artificial, esto no es menor.

Sí, lo de las vibras puede ser algo subjetivo, pero OpenAI parece sugerir que sus testers humanos prefieren hablar con GPT-4.5 antes que con GPT-4.0. Considerando que este es un producto que la empresa debe vender a todo tipo de usuarios, no solo aquellos con conocimiento técnico, sin dudas es un atractivo importante. Podría decirse que GPT-4.5 tiene una mejor experiencia de usuario.

Quizás estés pensando que esto también lo hace ideal para usar en chatbots y en teoría sí, pero hay un gran problema: GPT-4.5 es muy caro. Esto es una consecuencia casi inevitable de su gran tamaño. Al menos de momento, intentar desarrollar un producto externo que se comunique con este modelo sería demasiado costoso y ni sus beneficios lograrían justificar el gasto.

Entonces, ¿GPT-4.5 vale la pena?

La respuesta, como para casi todo en la vida, es que depende.

Si lo que querés es resolver problemas que requieran de pensamientos complejos y con mucha lógica, entonces no, no vale la pena. Vas a estar mejor con un modelo razonador, en particular con o3 que es el más avanzado de la suite de OpenAI.

Si sos un usuario más casual, puede que te sea más ameno interactuar con GPT-4.5 dado que «tiene mejores vibras» algo que, como dijimos, puede ser un buen punto de venta para OpenAI si logra replicar esta característica a un precio más económico. Pero, aún así, hay otra ventaja que aún no hemos discutido: al ser más natural y empático, GPT-4.5 tiende a ser mejor en tareas creativas, especialmente en tareas de escritura.

Así es, GPT-4.5 parece ser más sensible y mejor artista y esto por sí solo ya es justificación suficiente para la publicación de este modelo.

Si sos de los que les gusta leer en Internet, seguramente ya has desarrollado un sexto sentido para detectar textos escritos por IA. Es que, en general, todos son muy parecidos y ninguno es demasiado bueno. Ahora, si GPT-4.5 realmente es tan bueno como dicen, podría ser un modelo transformador para varias industrias6.

En un período del desarrollo de la IA generativa en que parece que cada mes se lanza un modelo más inteligente y mejor para superar a contrapartes humanos en la solución de grandes problemas matemáticos y científicos, es entendible que, en especial la audiencia más orientada a la tecnología, no haya pensado gran cosa de GPT-4.5. De hecho, se desprende del anuncio de su lanzamiento que, probablemente, este será el último modelo no razonador que lance OpenAI.

Sin embargo, esto no quita mérito a lo logrado. Si la IA va a convertirse en algo ubicuo, como esperan muchos de quienes la desarrollan, tiene que ser más fácil de digerir por los humanos. Tiene que ser más simpática y ganar adeptos. Y, sobre todo, si la IA quiere replicar la inteligencia humana, no debemos olvidar que esta no solo implica resolver problemas de matemática a nivel de doctorando. La inteligencia emocional y creativa es igual de humana e importante, y este lanzamiento al menos parece entenderlo.


Notas al pie:

  1. Actualmente, los suscriptores del plan gratuito de ChatGPT tienen acceso limitado a los modelos o3-mini y GPT-4.o, pero tienen acceso ilimitado al modelo GPT-4.o mini (OpenAI, s.f.) ↩︎
  2. Los modelos de frontera (en inglés, frontier models) son aquellos que «exceden las capacidades que de momento existen en los modelos más avanzados» (OpenAI, 2023, 26 de julio). ↩︎
  3. Presuntamente, no hubo una familia o2 para evitar conflictos con la empresa de telecomunicaciones británica del mismo nombre. ↩︎
  4. El por qué de esto amerita un nuevo artículo en el futuro, pero ya lo discutimos parcialmente al explorar el significado del término chain of thought o CoT. ↩︎
  5. También hubo un GPT-1 y, en este caso sí, un GPT-2 pero, como se puede ver en el video de presentación de GPT-4.5 (OpenAI, s.f.), eran considerablemente más rústicos que sus sucesores. ↩︎
  6. Si sería transformador para bien o para mal, ya es otra discusión completamente diferente. ↩︎

Referencias:

Una respuesta a “Chat GPT 4.5: ¿el hermano sensible y artístico de la familia OpenAI?”

  1. […] Tiempo atrás hablamos del lanzamiento de GPT-4.5 que no parecía tener muchas ventajas sobre los otros modelos ya publicados por OpenAI, con una excepción. Según insistieron en destacar sus creadores, GPT-4.5 daba mejores vibras. Tanta fue la insistencia sobre este punto, que no quedó duda de que era un aspecto de suma importancia para la empresa. Algunos especularon que se debía a que la amabilidad del modelo era uno de los factores en que se veía considerablemente atrás de su mayor competencia: los modelos Claude, de Anthropic. […]

    Me gusta

Deja un comentario

¡Quiero más!

¿Te gustó este post? ¿Querés ser el primer humano en enterarte cuando se publique el próximo?