Антон Наумов, Шамиль Мамедов Vision-Language-Action (VLA) Models: от токенов к действиям DL Architecture LLM 4 1858 20 Ноя 25