Если ваш офис давно мечтал о волшебнике, который любит таблицы больше, чем кофе, — кажется, он только что пришёл и уже просит доступ к вашим папкам.
OpenAI представила GPT‑5.2 — «самую способную» линейку для профессиональной работы. На бумаге это выглядит как заявка на реванш: контекстное окно 400 000 токенов, до 128 000 на выходе, дата‑срез знаний до 31 августа 2025 и явная поддержка «reasoning tokens», то есть глубокой цепочки рассуждений.
Модель выходит в трёх ипостасях:
- GPT‑5.2 Instant: быстрые черновики, переводы, поиск.
- GPT‑5.2 Thinking: сложные, многошаговые задачи, математика и код.
- GPT‑5.2 Pro: «тяжёлая артиллерия» там, где важнее точность, чем задержка.
Для разработчиков — в API: gpt-5.2, gpt-5.2-chat-latest (Instant) и gpt-5.2-pro.
По цифрам OpenAI звучит уверенно. На GDPval (44 профессии) Thinking бьёт или догоняет топ‑экспертов в 70,9% задач. SWE‑bench Pro — новая вершина: 55,6%. В науке и логике — GPQA Diamond до 93,2% (Pro), FrontierMath +9 п.п., ARC‑AGI у Pro переваливает за 90%.
Цена умнеет вместе с моделью. Thinking — $1.75 за 1M входных и $14 за 1M выходных токенов; Pro — $21 и $168 соответственно. Дорого? Да. Но ставка на «меньше итераций — больше результата» и лучшую токенную эффективность делает экономику привлекательной для дорогих сценариев.
Где модель особенно «живая» — это длинные агентные цепочки. Партнёры сообщают: быстрее извлекает факты из длинных документов (~40%), точнее рассуждает в Life Sciences, сильнее в глубоком кодинге. Понимание интерфейсов тоже прибавило: на ScreenSpot‑Pro у Thinking — 86,3% против 64,2% у 5.1. Сценарии вроде «рейс задержан — пересадка — специальное место — компенсация» GPT‑5.2 ведёт от начала до конца.
Есть и приземлённость: апдейтов в генерации изображений пока нет — «скоро будет». Зато надёжность лучше: на деперсонифицированных запросах ошибок на 38% меньше. Сохранены и «старые вайбы» — 5.1 остаётся для тех, кто тонко подгонял промпты.
Впереди — Adult Mode (после внедрения предсказания возраста) и, по слухам, архитектурный рывок в 2026. А пока — аккуратный, но заметный шаг к офисному ИИ, который действительно помогает, а не просто разговаривает.
