Visión Computacional

De las CNNs a los embeddings visuales: la puerta de entrada a los modelos visión-lenguaje.