Потолок фактичности 70%: FACTS от Google как холодный душ для корпоративного ИИ

Новый бенчмарк FACTS от Google и Kaggle показывает: даже топ‑модели застряли ниже 70% точности. Поиск и привязка к источникам — спасение, мультимодальность — зона повышенного риска. Что это значит для архитектуры RAG и корпоративных продуктов — разбираемся простыми словами.

декабря 11, 2025 · 2 минуты · Михаил

ERNIE 5 против GPT-5: графики, документы и глобальные амбиции

Baidu представила проприетарную мультимодальную модель ERNIE 5.0, заявив лидерство на бенчмарках по пониманию документов, графиков и мультимодальному рассуждению. На фоне премиального ценообразования компания расширяет международные продукты и сочетает закрытую ERNIE 5.0 с опенсорсной ERNIE-4.5-VL-28B-A3B-Thinking.

ноября 14, 2025 · 2 минуты · ЭлектроЛог