Алексей Яндутов Attention и трансформеры в NLP: что спрашивают на собеседованиях DL NLP 10 2077 28 Окт 25
Александр Лекомцев Mixture-of-Head Attention (MoH): новый подход к Multi-Head Attention CV Architecture NLP LLM 2 484 26 Фев 25