Советы по составлению базы знаний для AI-оператора
Подробно подключение и базовую настройку AI-оператора мы описали в инструкции "Настройка AI-оператора для автоматических ответов клиентам".
В этой статье мы расскажем про нюансы оформления файлов для бота и дадим советы для более эффективного поиска по ним.
Содержание:
Дополнительное тегирование файлов
Что можно загрузить
В блоке настроек "Дополнительные материалы" можно загрузить файлы (не больше пяти), которые помогут с формулировкой ответа.
Это могут быть:
- Часто задаваемые вопросы (FAQ): вопросы от ваших клиентов и ответы на них.
- База знаний о продуктах и услугах: описания, характеристики, инструкции по использованию.
- Прайс-листы: актуальные цены на товары или услуги.
- Контакты и адреса магазинов: информация о местоположении ваших филиалов и точек продаж.
- Рекомендации по использованию продуктов: советы и руководства для пользователей.
- Юридическая информация: политика конфиденциальности, условия использования, договоры.
- Маркетинговые материалы: информация об акциях, скидках и специальных предложениях.
AI-оператор поддерживает следующие форматы: .docx, .pptx, .csv, .html, .rtf, .xlsx, .xml, .md, .txt, .json, .pdf. Максимальный размер файла - 30 МБ.
Структура файлов
Чтобы AI-оператор мог быстрее находить нужную информацию, а вам было удобнее систематизировать и обновлять файлы, собрали несколько советов:
- Структурируйте информацию: Каждая строка, запись или абзац должны содержать отдельную мысль или единицу данных.
- Используйте заголовки и разделы, чтобы данные были организованы логично.
- Используйте содержательные названия, чтобы AI-оператору было проще ориентироваться в данных. Лучше избегать общих названий, таких как "Документ" или "Данные". Название файла должно отражать его содержание.
- Проверяйте данные на опечатки и дубли перед загрузкой.
- Обновляйте файлы регулярно, чтобы AI-оператор предоставлял актуальные данные.
- Тестируйте AI-оператора после загрузки: задайте ему вопросы и убедитесь, что ответы соответствуют загруженной информации.
- Если вы используете таблицы, убедитесь, что все ячейки заполнены данными, и объединенных ячеек нет. Объединенные ячейки могут привести к некорректному анализу данных.
Примеры данных для загрузки
Ниже несколько примеров файлов для Базы Знаний AI-оператора. Такая структура не обязательна, а приведена только в качестве ориентира.
В формате JSON
Для списка адресов:
[
{
"Страна": "Россия",
"Регион": "Московская область",
"Город": "Москва",
"Тип магазина": "Флагманский",
"Торговый центр": "Павелецкая Плаза",
"Адрес магазина": "Павелецкая пл., д. 3",
"График работы": "Пн-Вс 10:00 - 22:00",
"Ближайшая станция метро": "Павелецкая",
"Как найти": "-1 этаж"
},
{
"Страна": "Россия",
"Регион": "Московская область",
"Город": "Москва",
"Тип магазина": "Флагманский",
"Торговый центр": "Лухмановский Пассаж",
"Адрес магазина": "Лухмановская ул., д. 24А",
"График работы": "Пн-Вс 10:00 - 22:00",
"Ближайшая станция метро": "",
"Как найти": "1 этаж"
}
]
Для каталога товаров:
[
{
"Артикул": "MA1465-10",
"Модель": "MARK-II",
"Производитель": "Мир пончиков",
"Название": "Аппарат для приготовления пончиков",
"Описание": "Аппатар для приготовления пончиков MARK-II - это отличный компактный прибор для быстрого приготовления пончиков. Для наилучшего пропекания в конструкции реализован равномерный прогрев рабочей поверхности с антипригарным покрытием. Не нагревающиеся ручки позволяют использовать прибор без риска обжечься, а система защиты от перегрева исключает повреждение прибора.",
"Цена": "1500 рублей",
"Наличие": "В наличии",
},
]
В формате HTML
<!DOCTYPE html>
<html lang="ru">
<head>
<meta charset="UTF-8">
<title>Часто задаваемые вопросы</title>
</head>
<body>
<h1>Часто задаваемые вопросы (FAQ)</h1>
<section>
<h2>Общие вопросы</h2>
<ul>
<li>
<strong>Вопрос:</strong> Какие способы оплаты вы принимаете?<br>
<strong>Ответ:</strong> Мы принимаем Visa, Mastercard и PayPal.
</li>
<li>
<strong>Вопрос:</strong> Как отследить мой заказ?<br>
<strong>Ответ:</strong> Используйте ссылку для отслеживания, отправленную на вашу электронную почту.
</li>
</ul>
</section>
</body>
</html>
Дополнительное тегирование файлов
Чтобы улучшить поиск AI-оператора по загруженным документам, вы можете заключить часть информации в квадратные скобки. Так он будет лучше распознавать критически важные данные и точнее отвечать на вопросы клиентов в чате.
Вы можете протегировать [[слово]], [[аббревиатуру]], [[артикул]], [[выражение]]. Мы рекомендуем так размечать именно уникальные сущности, например, артикулы, модели, названия тарифов, номера договоров, ограничения, названия ролей и пр.
AI-оператор распознаёт их и будет отвечать строго по вашим данным, даже если в базе знаний большие прайс-листы и сложные документы.
На примере каталога товаров выше, заключим в квадратные скобки модель и артикул:
[
{
"Артикул": "[[MA1465-10]]",
"Модель": "[[MARK-II]]",
"Производитель": "Мир пончиков",
"Название": "Аппарат для приготовления пончиков MARK-II",
"Описание": "Аппарат для приготовления пончиков MARK-II - это отличный компактный прибор для быстрого приготовления пончиков. Для наилучшего пропекания в конструкции реализован равномерный прогрев рабочей поверхности с антипригарным покрытием. Не нагревающиеся ручки позволяют использовать прибор без риска обжечься, а система защиты от перегрева исключает повреждение прибора.",
"Цена": "1500 рублей",
"Наличие": "В наличии",
},
]
Посетитель пишет в чат с AI-оператором, например "Сколько стоит Аппарат для пончиков MARK-II и есть ли он в наличии?".
AI-оператор сможет найти точное совпадение по тегу [[MARK-II]] и ответит, опираясь на данные из каталога: "Аппарат для приготовления пончиков MARK-II стоит 1500 рублей. Товар есть в наличии."
Одинаковые теги могут встречаться в разных документах. AI-оператор будет собирать информацию для ответа из всех файлов.
В уже загруженных документах изменить ничего не получится. Удалите их и добавьте новые протегированные. Проставить теги в документах вам нужно будет своими силами. Для этого можно использовать онлайн-редакторы, инструменты для поиска и замены, свои скрипты или Excel-таблицы.

Работаем 24 часа 7 дней в неделю.
