База знаний для AI-бота: 5 источников данных, которые нужно загрузить
База знаний для бота простым языком: что это, какие 5 источников загружать (прайс, FAQ, расписание, политика возврата, контакты), анти-патерны (PDF на 200 страниц), частота обновления. Примеры для 3 ниш.
Head of content в WowPostio. 8+ лет в SMM для малого бизнеса.
Светлана — владелица стоматологической клиники в Питере. Подключила AI-бот в Direct месяц назад, ожидала «магии»: бот ответит на всё. Через неделю — разочарование. На вопрос «сколько стоит протезирование?» бот честно отвечает «уточню и вернусь», на «делаете ли вы детям?» — «нужно уточнить с врачом». Светлана уверена, что бот «глупый». На самом деле бот идеальный — он просто не знает её клинику. У него нет базы знаний. Загрузка пяти PDF с прайсом, расписанием, FAQ, описанием специалистов и политикой записи занимает 20 минут. Через час после загрузки тот же бот отвечает на 89% входящих по конкретным ценам и услугам. База знаний — это то, что отличает «AI-бот, который тупит» от «AI-бот, который работает».
Коротко. База знаний (Knowledge Base, KB) для AI-бота — это структурированные данные о вашем бизнесе, к которым бот обращается, отвечая на вопросы клиентов. Технически это RAG (Retrieval-Augmented Generation): LLM не «помнит» вашу клинику, она читает вашу базу под каждый вопрос. Без KB бот говорит общие фразы; с правильной KB — отвечает по конкретным ценам, услугам и расписанию. Загрузка пяти источников (прайс, FAQ, расписание, политика возврата, контакты) занимает 20–40 минут и поднимает точность ответов с 35% до 89%.
Что такое база знаний простым языком?
Технические статьи объясняют KB через «embedding», «vector database», «top-k retrieval» — это правда, но для владельца SMB это пустые слова. По сути, база знаний — это памятьбота про ваш бизнес.
Представьте, что вы наняли нового администратора в клинику. Чтобы он отвечал клиентам на телефоне, вы дали ему папку с материалами: прайс на услуги, расписание врачей, FAQ «самые частые вопросы», политика записи, адреса филиалов. Когда звонит клиент с вопросом «сколько стоит лечение кариеса?», администратор открывает папку, находит ответ и говорит «3 500 ₽ начальная стадия».
AI-бот работает точно так же. Папка — это knowledge base. Поиск в папке — это retrieval. Формулировка ответа на основе найденного — это generation. Вместе — RAG.
Без папки администратор отвечает «не знаю» или импровизирует с риском соврать. Без knowledge base AI-бот галлюцинирует или честно отвечает «уточню и вернусь». В обоих случаях клиент уходит.
Какие 5 источников данных нужны для базы знаний?
По нашему опыту на 200+ SMB-аккаунтов в нишах услуг и e-commerce, эти пять блоков закрывают 85% типовых вопросов. Загрузить их в любой современный AI-бот — 20–40 минут.
Источник 1: прайс или меню
Самый частый вопрос в директе любого бизнеса — «сколько стоит?». Без прайса бот ответить не может. Что грузить:
- Стоматология / клиника — таблица «услуга — стартовая цена — длительность». «Лечение кариеса — от 3 500 ₽ — 60 минут».
- Кафе / ресторан — меню с категориями (горячее, напитки, десерты), названиями, ценами, ингредиентами (для аллергиков), наличием веганских и безглютеновых позиций.
- Салон красоты — услуги с разбивкой по мастерам (если разная цена), длительность, цена. «Стрижка женская — Анна 2 800 ₽ / Светлана 3 500 ₽».
- Эксперт-консультант — форматы (разовая сессия / абонемент / интенсив), цены, длительность, что входит.
Источник 2: FAQ из реальной переписки
Это самый недооценённый источник. Откройте директ и выгрузите 30–50 последних диалогов. Соберите вопросы, которые повторяются 3+ раза — это и есть ваш «реальный» FAQ.
Типичные категории для большинства ниш:
- «Это безопасно? / Это не вредно?» — обычно про процедуры или продукты с потенциальным риском.
- «А что если не понравится?» — про политику возврата или гарантии.
- «Как у вас платить?» — про способы оплаты, рассрочку, СБП.
- «Делаете ли детям?» / «Принимаете беременных?» — про ограничения.
- «Сколько раз надо приходить?» — про курсы и серии процедур.
Один реальный вопрос «А вы заразиться нельзя в кабинете?» в knowledge base стоит дороже, чем 50 теоретических из интернета — потому что именно этот вопрос написали именно ваши клиенты.
Источник 3: расписание
Часы работы по дням недели, выходные, праздники, расписание конкретных мастеров/специалистов, сезонные изменения. Структурно лучше всего в табличном виде.
Подводный камень — праздники в РФ. 23 февраля, 8 марта, майские, Новый год — клиенты пишут «вы 8-го работаете?», и если KB этого не знает, бот выдаёт стандартное расписание и подставляет вас. Обновлять KB надо за неделю до каждого длинного праздника.
Источник 4: политика возврата / гарантии / предоплата
Здесь сидят все возражения «а если…». Что нужно описать:
- Что делать, если клиенту не подошёл результат (стрижка, процедура, продукт).
- Возврат денег: возможен ли, в каких сроках, в каких случаях.
- Перенос записи: за сколько часов, штраф или бесплатно.
- Опоздание клиента: что делать, если опоздал больше 15 минут.
- Предоплата: сумма, способы, возвратность.
Эту секцию владельцы чаще всего забывают, и она ловит бота на 15–20% самых конверсионных диалогов (где клиент уже почти готов, но снимает последнее возражение).
Источник 5: контакты с филиалами
Адреса, метро, парковка, телефоны, мессенджеры, время пути от ближайших ориентиров. Если филиалов несколько — для каждого. Если есть онлайн-формат — описать как отдельный «канал».
Анти-патерны: что НЕ грузить в knowledge base?
Самая частая ошибка — «у меня есть PDF на 80 страниц про нашу клинику, залью в бота». Бот тупит, потому что:
- Скан-PDF с фото без OCR. Бот видит картинку, текст не распознаёт. Решение — OCR через бесплатные инструменты, потом загрузка текста.
- PDF с маркетингом, миссией, историей.«Мы основаны в 2014 году тремя друзьями…» — клиенту это не нужно, и бот теряется в шуме при поиске. Грузить только функциональную информацию: «что», «сколько», «когда», «где», «как».
- Внутренние документы для сотрудников.Инструкция администратору «при опоздании клиента на 30 минут — взять предоплату» — не должна попасть в KB бота. Иначе бот может сказать клиенту «с вас удержим предоплату» в публичном директе.
- Дублирующиеся версии прайса. Если старый прайс остался в KB рядом с новым — бот может случайно отдать старую цену клиенту. Жёстко: обновили → удалили старое, не накапливаем.
- Длинные истории клиентов и отзывы. Это контент для постов, не для бота. Бот должен отвечать фактами, не историями.
Как правильно структурировать KB чтобы бот отвечал точно?
Три принципа, которые мы рекомендуем владельцам:
Принцип 1: короткие законченные факты
Плохо: «У нас широкий выбор процедур по уходу за лицом, включая чистку, пилинг, массаж и многое другое, цены начинаются от 2 500 ₽ за базовые и доходят до 12 000 ₽ за комплексные программы…».
Хорошо:
- «Чистка лица механическая — 2 500 ₽ — 60 мин»
- «Чистка лица ультразвуковая — 3 200 ₽ — 50 мин»
- «Химический пилинг поверхностный — 4 800 ₽ — 45 мин»
- «Программа anti-age (5 процедур) — 12 000 ₽»
AI-бот извлекает точный факт из второго варианта за 0.3 секунды. Из первого — путается и выдаёт расплывчатое «от 2 500 ₽».
Принцип 2: один факт — одно место
Если цена на стрижку в KB записана в двух местах (в «прайсе» и в «FAQ»), и они расходятся — бот может выдать любую. Жёстко: один факт хранится в одном месте, все остальные источники на него ссылаются («подробный прайс — в разделе X»).
Принцип 3: язык клиента, не специалиста
Плохо: «Лечение пульпита с применением депофореза гидроксида меди-кальция».
Хорошо: «Лечение нерва зуба (пульпит). Сохраняем зуб живым, без удаления. Цена — от 6 500 ₽, занимает 60–90 минут».
Клиент пишет «болит зуб с нервом, что делать?». Бот должен найти ответ. Если KB написана языком стоматолога — бот не сматчит «болит с нервом» с «пульпит». Если языком клиента — найдёт сразу.
Как часто обновлять базу знаний?
Главное правило: каждый раз, когда меняется факт. На практике это означает регулярные триггеры:
| Триггер | Что обновить | Срочность |
|---|---|---|
| Сменили цены | прайс | в день изменения |
| Поменялось расписание | расписание | за неделю до |
| Открыли новый филиал | контакты | за день до открытия |
| Праздничные дни | расписание | за неделю до |
| Появилась новая услуга | прайс + FAQ | в день запуска |
| Сменили мастера/специалиста | расписание + прайс | за день до |
| 3 новых типовых вопроса от клиентов | FAQ | раз в 2 недели |
Самая дешёвая привычка — поставить в календаре «раз в две недели — пересмотр knowledge base, 15 минут». Открываете директ, смотрите, какие вопросы повторялись, на которые бот отвечал «уточню и вернусь». Эти 3–5 пробелов и есть ваш апдейт.
Примеры базы знаний для трёх ниш
Кафе и доставка еды
Что должно быть в KB:
- Меню по категориям (горячее, холодное, напитки, десерты) с ценами и весом порций.
- Аллергены: глютен, лактоза, орехи — пометить для каждой позиции.
- Веганские, безглютеновые, кето-позиции — отдельным списком.
- Зоны доставки и стоимость по зонам.
- Время доставки в пиковые и обычные часы.
- Способы оплаты (СБП, наличные курьеру, рассрочка).
- Минимальная сумма заказа для бесплатной доставки.
Кейс — кафе.
Клиника / стоматология
- Прайс по услугам с «от»-ценой и средним диапазоном.
- Список врачей с специализацией и образованием (важно для доверия).
- Расписание по дням недели на каждого врача.
- FAQ по «детям с какого возраста», «беременным можно», «обезболивание включено».
- Адрес, метро, парковка, способ записи.
- Политика переноса записи и опозданий.
- ВАЖНО: бот НЕ должен ставить диагнозы. В KB пометка «при подобных запросах — направить на консультацию».
Кейс — клиника.
Эксперт-консультант
- Форматы (разовая консультация, абонемент, интенсив, курс) с ценами и длительностью.
- Что входит в каждый формат (домашние задания, поддержка в чате, материалы).
- Темы и проблемы, по которым работаете (с конкретикой, не «личностный рост вообще»).
- Условия отмены и переноса сессий.
- Способы связи (Zoom, Telegram, личная встреча — где применимо).
- Кейсы клиентов в обезличенной форме (без имён): «работала с такой-то проблемой 3 месяца, результат — X».
Кейс — эксперт.
Что попробовать прямо сейчас?
Практический план на 1 вечер:
- Соберите в одном файле 5 источников из списка выше — под вашу нишу. Если ниши среди 3 примеров нет, ориентируйтесь по типу: «услуга на месте», «доставка», «онлайн-формат».
- Структурируйте по 3 принципам: короткие факты, один факт — одно место, язык клиента.
- Возьмите 7-дневный триал AI-бота с поддержкой knowledge base. Залейте 5 файлов.
- Прогоните 20 тестовых вопросов из вашего реального директа. Посмотрите, где бот отвечает «уточню» — это дыры в KB, дозалейте.
- Через 3–4 итерации (1 вечер) точность доходит до 85%+. Запускайте на реальный трафик.
Связанные гайды — «чат-бот для Instagram в директе», «авто-ответы на комментарии» и «передача заказов в WhatsApp». Если хочется всё в одном — смотрите наш подход к AI, который закрывает не только директ, но и контент-план, и публикации.
Частые вопросы
Что такое база знаний для AI-бота простым языком?
База знаний (Knowledge Base) — это структурированные данные о вашем бизнесе, к которым бот обращается, отвечая клиентам. Технически RAG: LLM не «помнит» вашу клинику, она читает вашу базу под каждый вопрос. Без KB бот говорит общие фразы; с KB — отвечает по конкретным ценам и услугам.
Какие 5 источников данных нужно загрузить в knowledge base?
Прайс или меню с конкретными ценами и категориями. FAQ из 30–50 реальных вопросов из директа (не теоретических). Расписание по дням недели + праздники. Политика возврата, переносов, опозданий, предоплаты. Контакты с филиалами, адресами, способами связи. Эти 5 закрывают 85% типовых вопросов.
Как обучить AI-бота на своих данных?
Не «обучить» в смысле тренировки — а загрузить в knowledge base. Соберите 5 источников в текстовом виде, структурируйте короткими законченными фактами на языке клиента (не специалиста), загрузите в KB бота, прогоните 20 тестовых вопросов из реального директа, дозалейте пробелы. 20–40 минут до первого результата.
Можно ли загрузить PDF с описанием клиники в knowledge base?
Можно, но осторожно. Скан-PDF без OCR — бот не прочитает картинку. PDF с маркетингом и историей компании — шум, который мешает поиску. Грузите только функциональную информацию (что, сколько, когда, где, как). PDF на 80 страниц = бот тупит — разделите на 5 функциональных блоков.
Как часто нужно обновлять базу знаний бота?
По триггерам: сменили цены — в день изменения, поменялось расписание — за неделю, открылся филиал — за день до открытия, праздничные дни — за неделю до. Раз в две недели — 15 минут на пересмотр KB по пробелам, на которые бот отвечал «уточню и вернусь». Без обновления KB бот быстро устаревает.
Что такое RAG для чат-бота?
RAG (Retrieval-Augmented Generation) — это подход, где LLM не «знает» ваш бизнес из коробки, а читает knowledge base под каждый запрос. Шаги: вопрос клиента → поиск релевантных фактов в KB → формирование ответа на основе найденного. Результат: бот отвечает по вашим данным, а не общими фразами из интернета.
Сколько времени занимает настройка knowledge base?
Базовая настройка с 5 источниками — 20–40 минут (сбор файлов + загрузка). До точности 85%+ — ещё 1 вечер тестирования: прогоняете 20 реальных вопросов, дозаливаете пробелы, повторяете 3–4 раза. Дальше — 15 минут раз в 2 недели на актуализацию.