ALL SYSTEMS OPERATIONALSLA 99.97NOC 24/7
TRIPWIRE.RU / БЛОГ
00:00:00 MSKv.26.05

RAG в 1С: как устроен AI-ассистент без галлюцинаций

RAG — способ заставить языковую модель отвечать по вашим данным, а не выдумывать. Разбираем архитектуру AI-ассистента поверх 1С на GigaChat: как устроен поиск по базе знаний, почему он почти не галлюцинирует и что нужно для запуска в своём контуре.

Большие языковые модели умеют красиво рассуждать, но не знают вашей компании: вашего прайса, регламентов, истории договоров. Если задать им вопрос по внутренним данным — они начнут выдумывать (это называют «галлюцинациями»). RAG (Retrieval-Augmented Generation, генерация с дополнением через поиск) решает эту проблему: модель отвечает только на основе ваших документов, а не из общих знаний.

Разберём, как это работает на практике поверх и Битрикс24 — без хайпа и без обещаний «AI заменит сотрудников».

// 01Что такое RAG и зачем он бизнесу

Идея простая: прежде чем ответить, система находит в вашей базе знаний релевантные фрагменты и передаёт их модели как контекст. Модель формулирует ответ строго по этому контексту и ссылается на источник. Результат — ассистент, который отвечает «по вашим документам», а не по интернету.

Зачем это бизнесу: сократить время на поиск информации. Менеджер вместо 15 минут листания регламентов получает ответ со ссылкой на пункт за 10 секунд. На масштабе сотен сотрудников это десятки человеко-часов в день.

// 02Как устроен RAG: 4 шага

  1. Индексация. Документы (регламенты, договоры, данные 1С, база знаний) режутся на фрагменты и превращаются в векторы — числовые представления смысла. Хранятся в векторной базе.
  2. Поиск. Вопрос пользователя тоже превращается в вектор, и система находит самые близкие по смыслу фрагменты.
  3. Дополнение. Найденные фрагменты подставляются в запрос к модели как контекст с инструкцией «отвечай только по этим данным».
  4. Генерация. Модель формулирует ответ и указывает, из какого документа он взят.
Ключевая мысль

Качество RAG на 70% определяется не моделью, а тем, как подготовлены и нарезаны данные. «Мусор на входе — мусор на выходе» здесь работает буквально.

// 03Какую модель выбрать

Для российского бизнеса вопрос модели — это и про качество, и про закон. Данные часто нельзя отправлять за пределы РФ.

МодельРазмещениеКогда выбирать
GigaChatОблако РФБыстрый старт, данные не покидают РФ
YandexGPTОблако РФИнтеграция с экосистемой Яндекса
Llama / open-sourceOn-premСтрогие требования к данным, контур без интернета
Выбор зависит от чувствительности данных и требований ИБ.

На практике мы часто начинаем с GigaChat в облаке РФ для пилота, а при жёстких требованиях ИБ переносим решение на on-prem с open-source моделью. Подробнее — на странице AI-автоматизации.

// 04Как избежать галлюцинаций

  • Жёсткая инструкция модели: «если ответа нет в контексте — скажи, что не знаешь». Это убирает большую часть выдумок.
  • Ссылки на источник в каждом ответе. Пользователь видит, откуда взята информация, и может проверить.
  • Метрики качества: мы измеряем долю ответов «с источником» и регулярно прогоняем тестовый набор вопросов.
  • Человек в контуре на критичных сценариях — AI готовит черновик, решение принимает сотрудник.

// 05Сценарии в 1С и Битрикс24

  • AI-первая линия поддержки. Бот отвечает на типовые вопросы клиентов по базе знаний, эскалируя сложные в Битрикс24.
  • Ассистент менеджера. «Какие условия по договору с клиентом X?» — ответ из данных 1С со ссылкой.
  • Распознавание документов (OCR + LLM). Входящие счета и акты автоматически разбираются и заносятся в учёт.
  • Поиск по регламентам. Сотрудник спрашивает на естественном языке вместо листания PDF.
RAG — это не «волшебный AI», а инженерная система поиска и генерации. Её ценность в дисциплине: правильные данные, проверяемые ответы, измеримое качество.

// 06Частые вопросы

Как RAG в 1С избегает выдумывания фактов?

Модель отвечает строго по найденным в вашей базе фрагментам и получает инструкцию признаваться, если ответа в контексте нет. Каждый ответ сопровождается ссылкой на источник, который можно проверить.

Можно ли развернуть AI-ассистента без передачи данных в интернет?

Да. Для строгих требований ИБ решение разворачивается on-prem на open-source модели в закрытом контуре — данные не покидают вашу инфраструктуру.

Сколько занимает пилот?

Обычно 4–8 недель: подготовка данных, настройка поиска, выбор модели и тестирование на реальных вопросах с замером качества.

Хотите AI-ассистента поверх своих данных?

Бесплатная 40-минутная сессия с инженером — разберём вашу ситуацию.

Обсудить проект
// Читать дальше