Алексей Яндутов Сбор данных и разметка: как с нуля собрать хорошие данные под реальную задачу? LLM 5 878 18 Апр 25
Александр Лекомцев Mixture-of-Head Attention (MoH): новый подход к Multi-Head Attention CV Architecture NLP LLM 2 160 26 Фев 25