Предупреждение для любителей самоделок: если ваш RAG держится на скотче и оптимизме — пора хотя бы скотч сменить на API. Google выкатил File Search для Gemini API — управляемый RAG, который обещает вынести весь зоопарк инструментов за кулисы и оставить разработчикам только кнопку “сделай красиво”.

Суть проста: File Search берёт на себя хранение, стратегию разбиения на фрагменты и генерацию эмбеддингов. Никаких танцев с облачными бакетами, пайплайнами для парсинга и ручной подборки параметров: вызываешь внутри generateContent — и получаешь семантический поиск по своим данным. В ответах — встроенные цитаты до конкретных мест в документах, чтобы доверие было не на вере, а на фактах.

Поддержка форматов широка: от PDF и DOCX до TXT, JSON и распространённых типов файлов кода. Векторный поиск понимает смысл, а не только совпадения слов, и вытаскивает релевантные куски даже при «косых» формулировках запроса. Двигатель — Gemini Embedding, успевший возглавить MTEB, так что с базовой «нюхалкой смысла» всё в порядке.

Бизнес-модель прозрачна: часть возможностей (хранение и эмбеддинги на этапе запроса) — бесплатно, а за индексацию платишь фиксированные $0,15 за миллион токенов. Для корпоративных команд это означает предсказуемые бюджеты и меньше причин устраивать тендер на каждый новый компонент.

Конечно, Google не один в поле RAG: у OpenAI есть Assistants с файловым поиском, у AWS в Bedrock — управляемая автоматика по данным, Microsoft тоже в строю. Но ставка Google — на “абстрагировать всё”: не кусочек пайплайна, а всю кухню целиком.

Практика? В студии Phaser, где создают Beam для генерации игр, File Search пробежался по 3 000 файлов и ускорил путь от идеи до прототипа с дней до минут. Когда нужный сниппет кода или архитектурный совет всплывает сам, творческий цикл наконец дышит ровно.

Итог: если ваша RAG-система напоминает конструктор без инструкции, File Search — это инструкция, отвёртка и магнитный лоток для болтов в одном флаконе. Подключил — и поехали.