¡BOTS DE DIÁLOGO PARA IMÁGENES! Esta es una de esas herramientas super útiles y accesibles. BLIP es un modelo de visión que te permitía con lenguaje natural hacer Q&A sobre su contenido. Ahora llega BLIP-2, que similar a Flamingo de DeepMind te permite conversar sobre ellas!
BLIP-2: Conversational Image Analysis with Natural Language
By
–
Leave a Reply