De la atención a GPT y luego MoE: el camino real para entender los LLMs modernos.
Aprende todo sobre mecanismos de atención.
Aprende todo sobre self-attention y gpt.
Aprende todo sobre mezcla de expertos (moe).