De las CNNs a los embeddings visuales: la puerta de entrada a los modelos visión-lenguaje.
Explora el mundo de convoluciones y pooling.
Explora el mundo de visión-lenguaje: de cnn a embeddings.