Советы по составлению базы знаний для AI-оператора

Подробно подключение и базовую настройку AI-оператора мы описали в инструкции "Настройка AI-оператора для автоматических ответов клиентам".

В этой статье мы расскажем про нюансы оформления файлов для бота и дадим советы для более эффективного поиска по ним.

Содержание:

Что можно загрузить

Структура файлов

Примеры данных для загрузки

Дополнительное тегирование файлов

Что можно загрузить

В блоке настроек "Дополнительные материалы" можно загрузить файлы (не больше пяти), которые помогут с формулировкой ответа.

Это могут быть:

  • Часто задаваемые вопросы (FAQ): вопросы от ваших клиентов и ответы на них.
  • База знаний о продуктах и услугах: описания, характеристики, инструкции по использованию.
  • Прайс-листы: актуальные цены на товары или услуги.
  • Контакты и адреса магазинов: информация о местоположении ваших филиалов и точек продаж.
  • Рекомендации по использованию продуктов: советы и руководства для пользователей.
  • Юридическая информация: политика конфиденциальности, условия использования, договоры.
  • Маркетинговые материалы: информация об акциях, скидках и специальных предложениях.

AI-оператор поддерживает следующие форматы: .docx, .pptx, .csv, .html, .rtf, .xlsx, .xml, .md, .txt, .json, .pdf. Максимальный размер файла - 30 МБ.

Структура файлов

Чтобы AI-оператор мог быстрее находить нужную информацию, а вам было удобнее систематизировать и обновлять файлы, собрали несколько советов:

  • Структурируйте информацию: Каждая строка, запись или абзац должны содержать отдельную мысль или единицу данных.
  • Используйте заголовки и разделы, чтобы данные были организованы логично.
  • Используйте содержательные названия, чтобы AI-оператору было проще ориентироваться в данных. Лучше избегать общих названий, таких как "Документ" или "Данные". Название файла должно отражать его содержание.
  • Проверяйте данные на опечатки и дубли перед загрузкой.
  • Обновляйте файлы регулярно, чтобы AI-оператор предоставлял актуальные данные.
  • Тестируйте AI-оператора после загрузки: задайте ему вопросы и убедитесь, что ответы соответствуют загруженной информации.
  • Если вы используете таблицы, убедитесь, что все ячейки заполнены данными, и объединенных ячеек нет. Объединенные ячейки могут привести к некорректному анализу данных.

Примеры данных для загрузки

Ниже несколько примеров файлов для Базы Знаний AI-оператора. Такая структура не обязательна, а приведена только в качестве ориентира.

В формате JSON

Для списка адресов:

[ 
  { 
    "Страна": "Россия", 
    "Регион": "Московская область", 
    "Город": "Москва", 
    "Тип магазина": "Флагманский", 
    "Торговый центр": "Павелецкая Плаза", 
    "Адрес магазина": "Павелецкая пл., д. 3", 
    "График работы": "Пн-Вс 10:00 - 22:00", 
    "Ближайшая станция метро": "Павелецкая", 
    "Как найти": "-1 этаж" 
  }, 
  { 
    "Страна": "Россия", 
    "Регион": "Московская область", 
    "Город": "Москва", 
    "Тип магазина": "Флагманский", 
    "Торговый центр": "Лухмановский Пассаж", 
    "Адрес магазина": "Лухмановская ул., д. 24А", 
    "График работы": "Пн-Вс 10:00 - 22:00", 
    "Ближайшая станция метро": "", 
    "Как найти": "1 этаж" 
  } 
]

Для каталога товаров:

[ 
  { 
    "Артикул": "MA1465-10", 
    "Модель": "MARK-II", 
    "Производитель": "Мир пончиков", 
    "Название": "Аппарат для приготовления пончиков", 
    "Описание": "Аппатар для приготовления пончиков MARK-II - это отличный компактный прибор для быстрого приготовления пончиков. Для наилучшего пропекания в конструкции реализован равномерный прогрев рабочей поверхности с антипригарным покрытием. Не нагревающиеся ручки позволяют использовать прибор без риска обжечься, а система защиты от перегрева исключает повреждение прибора.", 
    "Цена": "1500 рублей", 
    "Наличие": "В наличии",  
  }, 
]

В формате HTML

<!DOCTYPE html>
<html lang="ru">
<head>
    <meta charset="UTF-8">
    <title>Часто задаваемые вопросы</title>
</head>
<body>
    <h1>Часто задаваемые вопросы (FAQ)</h1>
    <section>
        <h2>Общие вопросы</h2>
        <ul>
            <li>
                <strong>Вопрос:</strong> Какие способы оплаты вы принимаете?<br>
                <strong>Ответ:</strong> Мы принимаем Visa, Mastercard и PayPal.
            </li>
            <li>
                <strong>Вопрос:</strong> Как отследить мой заказ?<br>
                <strong>Ответ:</strong> Используйте ссылку для отслеживания, отправленную на вашу электронную почту.
            </li>
        </ul>
    </section>
</body>
</html>

Дополнительное тегирование файлов

Чтобы улучшить поиск AI-оператора по загруженным документам, вы можете заключить часть информации в квадратные скобки. Так он будет лучше распознавать критически важные данные и точнее отвечать на вопросы клиентов в чате.

Вы можете протегировать [[слово]], [[аббревиатуру]], [[артикул]], [[выражение]]. Мы рекомендуем так размечать именно уникальные сущности, например, артикулы, модели, названия тарифов, номера договоров, ограничения, названия ролей и пр.

AI-оператор распознаёт их и будет отвечать строго по вашим данным, даже если в базе знаний большие прайс-листы и сложные документы.

На примере каталога товаров выше, заключим в квадратные скобки модель и артикул:

[ 
  { 
    "Артикул": "[[MA1465-10]]", 
    "Модель": "[[MARK-II]]", 
    "Производитель": "Мир пончиков", 
    "Название": "Аппарат для приготовления пончиков MARK-II", 
    "Описание": "Аппарат для приготовления пончиков MARK-II - это отличный компактный прибор для быстрого приготовления пончиков. Для наилучшего пропекания в конструкции реализован равномерный прогрев рабочей поверхности с антипригарным покрытием. Не нагревающиеся ручки позволяют использовать прибор без риска обжечься, а система защиты от перегрева исключает повреждение прибора.", 
    "Цена": "1500 рублей", 
    "Наличие": "В наличии",  
  }, 
]

Посетитель пишет в чат с AI-оператором, например "Сколько стоит Аппарат для пончиков MARK-II и есть ли он в наличии?".

AI-оператор сможет найти точное совпадение по тегу [[MARK-II]] и ответит, опираясь на данные из каталога: "Аппарат для приготовления пончиков MARK-II стоит 1500 рублей. Товар есть в наличии."

Одинаковые теги могут встречаться в разных документах. AI-оператор будет собирать информацию для ответа из всех файлов.

В уже загруженных документах изменить ничего не получится. Удалите их и добавьте новые протегированные. Проставить теги в документах вам нужно будет своими силами. Для этого можно использовать онлайн-редакторы, инструменты для поиска и замены, свои скрипты или Excel-таблицы.

Статьи по теме
Есть вопросы?
Спросите техподдержку в чате на сайте, мы всегда рады помочь.
Работаем 24 часа 7 дней в неделю.