La base de la revolucion de la generacion de imagenes es un conjunto de potentes modelos base con fortalezas distintas. DALL-E 3 produce imagenes con una fuerte adherencia a las instrucciones y una representacion coherente del texto, mientras que Firefly esta entrenado con imagenes de archivo con licencia para mayor seguridad comercial. Imagen 3 representa el impulso de Google hacia el fotorrealismo, y Roboflow proporciona la infraestructura de vision por computadora para entrenar y desplegar modelos de imagen personalizados.
1
4.7
2
4.7
3
4.7
4
4.5
5
4.0