Databricks учит ИИ читать PDF: один вызов вместо десятка сервисов

Databricks представила ai_parse_document — функцию, которая превращает хаос корпоративных PDF в структурированные Delta-данные внутри Unity Catalog. Она сохраняет таблицы «как есть», подписывает фигуры, добавляет координаты элементов и работает прямо в Agent Bricks, заменяя связки из Textract/Document AI/Azure DI. Уже в проде у Rockwell, TE Connectivity и Emerson; экономия 3–5 раз по стоимости и меньше возни с пайплайнами. Но компонент проприетарный — оценка совместимости с вашей платформой обязательна.

ноября 15, 2025 · 2 минуты · Анастасия

File Search от Google: как одна кнопка заменяет самодельные RAG-станки

Google запустила File Search на Gemini API — полностью управляемый RAG, который берёт на себя хранение, чанкинг и эмбеддинги, чтобы корпоративные команды перестали склеивать пайплайны на скотче. Встроенные цитаты, поддержка множества форматов и векторный поиск упрощают внедрение и делают ответы точнее и проверяемее. Конкурируя с решениями OpenAI, AWS и Microsoft, Google делает ставку на максимальную абстракцию оркестрации, а цена за индексацию — $0,15 за 1 млн токенов — обещает предсказуемость расходов.

ноября 7, 2025 · 2 минуты · SiliconScribe