RAG — способ заставить языковую модель отвечать по вашим данным, а не выдумывать. Разбираем архитектуру AI-ассистента поверх 1С на GigaChat: как устроен поиск по базе знаний, почему он почти не галлюцинирует и что нужно для запуска в своём контуре.
Большие языковые модели умеют красиво рассуждать, но не знают вашей компании: вашего прайса, регламентов, истории договоров. Если задать им вопрос по внутренним данным — они начнут выдумывать (это называют «галлюцинациями»). RAG (Retrieval-Augmented Generation, генерация с дополнением через поиск) решает эту проблему: модель отвечает только на основе ваших документов, а не из общих знаний.
Разберём, как это работает на практике поверх 1С и Битрикс24 — без хайпа и без обещаний «AI заменит сотрудников».
// 01Что такое RAG и зачем он бизнесу
Идея простая: прежде чем ответить, система находит в вашей базе знаний релевантные фрагменты и передаёт их модели как контекст. Модель формулирует ответ строго по этому контексту и ссылается на источник. Результат — ассистент, который отвечает «по вашим документам», а не по интернету.
Зачем это бизнесу: сократить время на поиск информации. Менеджер вместо 15 минут листания регламентов получает ответ со ссылкой на пункт за 10 секунд. На масштабе сотен сотрудников это десятки человеко-часов в день.
// 02Как устроен RAG: 4 шага
- Индексация. Документы (регламенты, договоры, данные 1С, база знаний) режутся на фрагменты и превращаются в векторы — числовые представления смысла. Хранятся в векторной базе.
- Поиск. Вопрос пользователя тоже превращается в вектор, и система находит самые близкие по смыслу фрагменты.
- Дополнение. Найденные фрагменты подставляются в запрос к модели как контекст с инструкцией «отвечай только по этим данным».
- Генерация. Модель формулирует ответ и указывает, из какого документа он взят.
Качество RAG на 70% определяется не моделью, а тем, как подготовлены и нарезаны данные. «Мусор на входе — мусор на выходе» здесь работает буквально.
// 03Какую модель выбрать
Для российского бизнеса вопрос модели — это и про качество, и про закон. Данные часто нельзя отправлять за пределы РФ.
| Модель | Размещение | Когда выбирать |
|---|---|---|
| GigaChat | Облако РФ | Быстрый старт, данные не покидают РФ |
| YandexGPT | Облако РФ | Интеграция с экосистемой Яндекса |
| Llama / open-source | On-prem | Строгие требования к данным, контур без интернета |
На практике мы часто начинаем с GigaChat в облаке РФ для пилота, а при жёстких требованиях ИБ переносим решение на on-prem с open-source моделью. Подробнее — на странице AI-автоматизации.
// 04Как избежать галлюцинаций
- Жёсткая инструкция модели: «если ответа нет в контексте — скажи, что не знаешь». Это убирает большую часть выдумок.
- Ссылки на источник в каждом ответе. Пользователь видит, откуда взята информация, и может проверить.
- Метрики качества: мы измеряем долю ответов «с источником» и регулярно прогоняем тестовый набор вопросов.
- Человек в контуре на критичных сценариях — AI готовит черновик, решение принимает сотрудник.
// 05Сценарии в 1С и Битрикс24
- AI-первая линия поддержки. Бот отвечает на типовые вопросы клиентов по базе знаний, эскалируя сложные в Битрикс24.
- Ассистент менеджера. «Какие условия по договору с клиентом X?» — ответ из данных 1С со ссылкой.
- Распознавание документов (OCR + LLM). Входящие счета и акты автоматически разбираются и заносятся в учёт.
- Поиск по регламентам. Сотрудник спрашивает на естественном языке вместо листания PDF.
RAG — это не «волшебный AI», а инженерная система поиска и генерации. Её ценность в дисциплине: правильные данные, проверяемые ответы, измеримое качество.
// 06Частые вопросы
Как RAG в 1С избегает выдумывания фактов?
Модель отвечает строго по найденным в вашей базе фрагментам и получает инструкцию признаваться, если ответа в контексте нет. Каждый ответ сопровождается ссылкой на источник, который можно проверить.
Можно ли развернуть AI-ассистента без передачи данных в интернет?
Да. Для строгих требований ИБ решение разворачивается on-prem на open-source модели в закрытом контуре — данные не покидают вашу инфраструктуру.
Сколько занимает пилот?
Обычно 4–8 недель: подготовка данных, настройка поиска, выбор модели и тестирование на реальных вопросах с замером качества.
Хотите AI-ассистента поверх своих данных?
Бесплатная 40-минутная сессия с инженером — разберём вашу ситуацию.