En mi vídeo de 2019 se explica efectivamente por donde va la idea. Y el motivo de por qué reaparecen estos trabajos y cada vez parecen más impresionantes, es porque la parte del decoder se va sustituyendo con la tecnología generativa de moda. En este caso con Stable Diffusion.
Stable Diffusion replaces decoder in generative model architectures
By
–