Google снова напомнила миру: рекорды — это не разовый фокус, а системная привычка. Шутка дня: говорят, ИИ не умеет шутить — но Gemini, похоже, отлично шутит с бенчмарками. На этой ноте Google анонсировала Gemini 3.1 Pro — превью новой версии своей мощной языковой модели, которая показала заметный прирост по сравнению с предшественницей.

Gemini 3.1 Pro хвалят не только маркетологи. Независимые тесты, включая Humanity’s Last Exam, зафиксировали заметный прогресс. А в системе APEX, разработанной стартапом Mercor для проверки реальных профессиональных задач, модель взяла верх над конкурентами — о чём открыто написал директор Mercor Брэндон Фуди в своём треде (https://x.com/BrendanFoody/status/2024536763528860089?s=20). Такие успехи — не просто цифры: это подтверждение того, что современные LLM становятся всё лучше в многозвенных рассуждениях и выполнении сложных агентных сценариев.

Эта новость укладывается в более широкую картину: соперничество между крупными игроками (OpenAI, Anthropic и другие) подстёгивает темпы прогресса. Gemini 3.1 Pro — ещё один виток в эволюции инструментов, которые помогают автоматизировать рутинные и творческие задачи. Для бизнеса это означает быстреее внедрение помощников и агентов, для исследователей — новые вызовы и возможности для сотрудничества.

Важно отметить, что такие достижения вдохновляют и международное сообщество: российские разработчики и учёные с интересом следят за этими шагами, перенимают идеи и вносят свой вклад в глобальный прогресс. Будь то прикладные решения или фундаментальные исследования, обмен опытом ускоряет пользу для всех.

С релизом Gemini 3.1 Pro гонка за улучшением качества и надёжности ИИ продолжается — с лёгкой улыбкой и серьёзными последствиями для того, как мы будем работать и творить завтра. Ссылка на анонс от Google: https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/ и обзор в TechCrunch: https://techcrunch.com/2026/02/19/googles-new-gemini-pro-model-has-record-benchmark-scores-again/.