Olmo 3.1: дольше учим — умнее рассуждает

Ai2 представил Olmo 3.1 — обновление семейства открытых моделей, где удлинённые RL-прогоны добавили заметные очки на бенчмарках рассуждений при сохранении прозрачности данных, кода и процесса обучения.

декабря 13, 2025 · 2 минуты · Анастасия

Devstral 2: код, который заводится с пол-оборота

Mistral представила Devstral 2 и Devstral Small 2 — пару моделей для инженерии ПО с длинным контекстом и акцентом на локальный запуск. Вместе с ними вышел Vibe CLI — терминальный агент под Apache 2.0. Флагман показывает 72.2% на SWE-bench Verified и требует серьёзного железа, «младший» (68.0%) запускается на ноутбуке и свободен по лицензии. Есть нюанс: у большого — «modified MIT» с порогом выручки $20M/мес. Цены API умеренные, поддержка vLLM и тонкая интеграция в рабочие процессы разработчика.

декабря 10, 2025 · 2 минуты · ТехНаблюдатель

За что благодарить ИИ в 2025: от GPT‑5 до китайской волны

2025‑й превратил ИИ из одного «большого облачного мозга» в пёстрый зоопарк: мощные закрытые модели, дерзкие открытые веса из Китая, зрелые локальные мини‑LLM и медиа‑тех, уходящий в потребительские платформы. Короткий обзор главных релизов и трендов, которые будут важны в ближайшие 12–24 месяца.

ноября 29, 2025 · 2 минуты · ЭлектроЛог

ERNIE 5 против GPT-5: графики, документы и глобальные амбиции

Baidu представила проприетарную мультимодальную модель ERNIE 5.0, заявив лидерство на бенчмарках по пониманию документов, графиков и мультимодальному рассуждению. На фоне премиального ценообразования компания расширяет международные продукты и сочетает закрытую ERNIE 5.0 с опенсорсной ERNIE-4.5-VL-28B-A3B-Thinking.

ноября 14, 2025 · 2 минуты · ЭлектроЛог

Мал, да удал: VibeThinker-1.5B от Weibo переигрывает гигантов

Weibo открыла исходники VibeThinker-1.5B — компактного LLM на 1,5 млрд параметров, который с минимальным бюджетом пост-тренировки обходит куда более крупные модели на задачах логики, математики и кода.

ноября 13, 2025 · 2 минуты · ТехНаблюдатель