Какие задачи решаем
- Поиск по документам с цитатами и ссылками на источники.
- Индексирование файлов: PDF, DOCX, таблицы, базы знаний, сайты.
- Обновление индекса по расписанию и по вебхукам.
- Разграничение доступа и персональные контексты.
- API для интеграции в боты, сайты, внутренние сервисы.
Что вы получите
- Pipeline загрузки/очистки/разбиения и эмбеддинга документов.
- Векторное хранилище (pgvector/Supabase) и сервис поиска.
- Виджет/интерфейс поиска с подсветкой цитат и источников.
- Метрики качества (precision@k/feedback) и панель администрирования.
- Документацию по обновлению индекса и добавлению источников.
Референсная архитектура
ЯдроRetriever + Векторное хранилище
ХранилищаPostgreSQL + pgvector / Supabase, S3 для файлов
КэшRedis (результаты/токены)
Секретыenv / SOPS / Vault
ПроксиCaddy (TLS/Auth)
CI/CDGitLab CI (ETL, обновление индекса)
НаблюдаемостьPrometheus, Grafana
Интеграции «из коробки»
Google Drive
Confluence
Сайты (краулер)
S3
PDF/DOCX/CSV
API/Webhooks
OpenAI/Ollama
Админ‑панель*
Процесс работы
- Диагностика — источники данных, политика доступа.
- Проектирование — схема индекса и обновления.
- Внедрение — ETL/эмбеддинги, интерфейс/виджет.
- Передача — метрики качества и регламенты пополнения.
Сроки пилота
5–10 рабочих дней для 1–2 источников и базового интерфейса.
Поддержка и SLA
- Время реакции: P1 — 1 ч, P2 — 4 ч, P3 — 1 раб. день.
- Бэкапы индекса и источников: ежедневные; хранение 14–30 дней.
- Ежемесячные отчёты по качеству поиска (feedback/precision@k).
Стоимость
RAG‑пилот (1 источник, базовый индекс)
MVP
от 90 000 ₽
RAG «под ключ» (мульти‑источники, роли, интерфейс)
от 200 000 ₽
Поддержка индекса и качества
от 35 000 ₽/мес
Какие задачи закрываем
- Единый поиск по PDF/Docs/почте и базам знаний.
- Актуализация документов и прав доступа автоматически.
- Ответы «по делу» вместо бесконечных переписок.
Что вы получите через 2–4 недели
- Рабочий чат-поиск для сотрудников/клиентов.
- Подключённые источники и регулярная индексация.
- Отчёты по точности и востребованным темам.
Первые результаты
Первые точные ответы — за 5–10 рабочих дней. Улучшение релевантности и источников — за 2–4 недели.
Как это влияет на бизнес
- Меньше вопросов в поддержку и «потерянных» писем.
- Быстрое обучение новых сотрудников.
- Знания остаются в компании, а не в чатах.
Ключевые акценты
Быстрые ответы
PDF/Docs/почта
On-prem
Без утечек
Точность
Отчёты
Процесс работы
- Анализ — источники и примеры вопросов.
- Проект — схема индексации и доступов.
- Внедрение — подключение источников, настройка.
- Передача — обучение, регламенты обновления.
Пакеты и стоимость
Пилот (1–2 источника, чат-поиск)от 110 000 ₽
Расширенный (несколько департаментов)от 190 000 ₽
Сопровождение и обновленияот 30 000 ₽/мес
Ответы на частые вопросы
- Конфиденциальность? On-prem/ваше облако, аудит, доступы по ролям.
- Языки? Русский/английский, подстраиваемся под терминологию.
- Какие источники? Почта, диски, базы, CRM/Confluence — обсуждаем на диагностике.