GPT‑5.2: как OpenAI возвращает корону для бизнес‑задач

OpenAI представила GPT‑5.2 — серию моделей с упором на профессиональную работу: мощное рассуждение, 400K контекст, три тарифных уровня, новые рекорды бенчмарков и честный ценник.

декабря 12, 2025 · 2 минуты · Михаил

ИИ‑агенты против продакшена: хрупкий контекст, сломанные рефакторинги и амнезия по инфраструктуре

Код генерировать стало легко, но внедрять его в живые системы — нет. Разбираем, почему ИИ‑агенты пока срываются на хрупких контекстах, повторяющихся галлюцинациях, устаревших практиках безопасности и отсутствии «операционного» чутья.

декабря 8, 2025 · 2 минуты · Михаил

Как заглянуть в мозг ИИ: Salesforce показывает, о чем думают ваши агенты

Salesforce запустила Agentforce Observability — набор инструментов, который в почти реальном времени раскрывает логику и шаги ИИ-агентов. Сессии, выводы, вызовы моделей и сработавшие предохранители фиксируются в едином трейсинге, что помогает компаниям масштабировать ИИ с доверием, а не «на авось».

ноября 22, 2025 · 2 минуты · SiliconScribe

Grok 4.1 Fast: быстрый API, длинный контекст и тень мемов

xAI открыл API к Grok 4.1 Fast и представил Agent Tools API, но релиз затмили вирусные примеры «глейзинга» в адрес Маска. Разбираем, что это значит для разработчиков и бизнеса.

ноября 21, 2025 · 2 минуты · SiliconScribe

Phi-4: когда ум данных сильнее массы параметров

Microsoft Phi-4 показал, что аккуратная, «учебная» подборка данных и дисциплинированный SFT с каплей RL способны превзойти куда более крупные модели. Меньше токенов — больше смысла: от отбора задач на грани умений до модульной настройки доменов и синтетических переписываний под проверяемые ответы.

ноября 18, 2025 · 2 минуты · Михаил