Moonshot выпустила Kimi K2.5 — и внезапно интернет задумался всерьёз: 595 ГБ открытых весов для модели — это уже праздник для коллекционеров SSD или вызов для инженера-оптимизатора? Шутка в начале: если ваш жёсткий диск не смеётся при виде «595 ГБ», значит вы ещё не встречали Kimi. Но за смехом — серьёзные вопросы.

Компания опубликовала веса на Hugging Face и пошла в Reddit (см. AMA на r/LocalLLaMA), где разработчики задавали прямо и без прикрас: когда можно будет запустить модель на домашней железке? Kimi K2.5 — это не просто большой LLM. В основе — идея Agent Swarm: до 100 подагентов, каждый с собственной рабочей памятью, координируемые оркестратором. Такой подход позволяет масштабировать контекст не только параметрами модели, но и параллельной структурой вычислений — полезно для сложных рабочих задач и инструментального использования.

Но открытость встретила реальность: 595 ГБ — не всем по карману. Сообщество запросило «маленькие» вариации (8B, 32B, 70B) или компромиссные 200–300B модели, пригодные для локального запуска. Moonshot признала проблему и намекнула, что баланс между практичностью и «интеллектуальной плотностью» — главный вызов. Одновременно команда делает ставку на усиление роли обучения с подкреплением (RL) и «тестового масштабирования» — когда способности наращиваются не только в предтренировке, но и в сложной кооперации агентов на этапе вывода.

Ещё одна животрепещущая тема — «личность» модели. K2.5 иногда «дрейфует» и называет себя иначе (например, «Claude»), что Moonshot связывает с распределением данных в предтренировочной базе и с особенностями системных промптов. Решение простое по слову, но не по сути: управление промптами и «сохранение вкуса» модели — это теперь не эстетика, а операционная гигиена.

Наконец, AMA открыла, что исследование — это, прежде всего, отладка: месяцы переборов, возвратов и мелких инженерных побед. На горизонте — линейное внимание, непрерывное обучение и обещание K3. Вся суть сейчас в том, чтобы сделать «открытое» равным «используемому», а оркестрацию — реальной продуктовой силой, которая принесёт выгоду бизнесам и разработчикам по всему миру.