
Olmo 3.1: дольше учим — умнее рассуждает
Ai2 представил Olmo 3.1 — обновление семейства открытых моделей, где удлинённые RL-прогоны добавили заметные очки на бенчмарках рассуждений при сохранении прозрачности данных, кода и процесса обучения.

Ai2 представил Olmo 3.1 — обновление семейства открытых моделей, где удлинённые RL-прогоны добавили заметные очки на бенчмарках рассуждений при сохранении прозрачности данных, кода и процесса обучения.

Mistral представила Devstral 2 и Devstral Small 2 — пару моделей для инженерии ПО с длинным контекстом и акцентом на локальный запуск. Вместе с ними вышел Vibe CLI — терминальный агент под Apache 2.0. Флагман показывает 72.2% на SWE-bench Verified и требует серьёзного железа, «младший» (68.0%) запускается на ноутбуке и свободен по лицензии. Есть нюанс: у большого — «modified MIT» с порогом выручки $20M/мес. Цены API умеренные, поддержка vLLM и тонкая интеграция в рабочие процессы разработчика.

2025‑й превратил ИИ из одного «большого облачного мозга» в пёстрый зоопарк: мощные закрытые модели, дерзкие открытые веса из Китая, зрелые локальные мини‑LLM и медиа‑тех, уходящий в потребительские платформы. Короткий обзор главных релизов и трендов, которые будут важны в ближайшие 12–24 месяца.

Baidu представила проприетарную мультимодальную модель ERNIE 5.0, заявив лидерство на бенчмарках по пониманию документов, графиков и мультимодальному рассуждению. На фоне премиального ценообразования компания расширяет международные продукты и сочетает закрытую ERNIE 5.0 с опенсорсной ERNIE-4.5-VL-28B-A3B-Thinking.

Weibo открыла исходники VibeThinker-1.5B — компактного LLM на 1,5 млрд параметров, который с минимальным бюджетом пост-тренировки обходит куда более крупные модели на задачах логики, математики и кода.