
Databricks учит ИИ читать PDF: один вызов вместо десятка сервисов
Databricks представила ai_parse_document — функцию, которая превращает хаос корпоративных PDF в структурированные Delta-данные внутри Unity Catalog. Она сохраняет таблицы «как есть», подписывает фигуры, добавляет координаты элементов и работает прямо в Agent Bricks, заменяя связки из Textract/Document AI/Azure DI. Уже в проде у Rockwell, TE Connectivity и Emerson; экономия 3–5 раз по стоимости и меньше возни с пайплайнами. Но компонент проприетарный — оценка совместимости с вашей платформой обязательна.



