Mientras que el mercado de generadores texto a imagen Poco a poco se vuelve más denso, queda una pregunta: ¿qué herramienta ofrece el mejor rendimiento? La organización de Análisis Artificial, que proporciona «Evaluación comparativa y conocimientos objetivos para ayudar a los desarrolladores, consumidores, investigadores y usuarios de modelos de IA»ofrece una respuesta a esta pregunta con Campo de texto a imagen. Un ranking, similar a Chatbot Arena, que evalúa objetivamente los modelos de generación de imágenes impulsados por IA en función de las aportaciones de los usuarios. En el sitio web de la organización, se invita a los visitantes a comparar dos modelos cuya identidad se les oculta, evaluando cuál responde con mayor precisión a la consulta.
Los 10 mejores modelos de generación de imágenes en agosto de 2024
En agosto de 2024, sorpresa: el ranking establecido por el Análisis Artificial está dominado por un nuevo jugador. Black Forest Labs, una startup fundada por los creadores de Stable Diffusion, ocupa directamente el primer lugar gracias a la versión más avanzada de FLUX.1, un modelo generativo presentado el 1 de agosto de 2024. En menos de un mes, esta tecnología, que impulsa el polémico generador de el agente conversacional Grok diseñado por X (Twitter), se ha consolidado firmemente en este ranking, ya que otras dos iteraciones se sitúan entre los 10 primeros (4º y 7º).
El resto del podio lo ocupa el último modelo implementado por Ideogram y la versión 6.1 de Midjourney que recientemente se liberó de Discord lanzando su propio sitio web. En el resto del ranking, Stability.ai se mantiene entre los 10 primeros (6º), al igual que Playground AI (8º). OpenAI, líder en generación de texto, está muy por detrás de la competencia en generación de imágenes, y sus tecnologías impulsan a DALL-E solo en las posiciones novena y décima.
Aquí están los 10 modelos de generación de imágenes con mejor rendimiento en agosto de 2024:
- FLUJO.1 (pro): 1.151 (puntuación Elo)
- Ideograma v2: 1.130
- Mitad del viaje v6.1: 1,126
- FLUJO.1 (desarrollador): 1,118
- Mitad del viaje v6: 1,112
- Difusión estable 3 amplia: 1.098
- FLUX.1 (schnell): 1.091
- Parque infantil v2.5: 1.046
- PANEL 3 HD: 1.041
- LOSA 3: 1.023
Los criterios de clasificación del Text to Image Arena
Al igual que Chatbot Arena, Text to Image Arena se basa en un sistema de duelo. El principio es el siguiente: se invita a los usuarios a decidir entre dos modelos anónimos, designando el que mejor responda a la consulta inicial. Luego, cada modelo recibe una puntuación Elo, que evoluciona según su rendimiento. Por ejemplo, si un modelo A sufre una derrota contra un modelo B cuyo puntaje Elo es menor, pierde puntos, y viceversa. Según Artificial Analysis, el ranking se actualiza cada hora.