BetaБета-версия сайта. По всем вопросам пишите на support@wowpostio.com
Все статьиAI и автоматизация

База знаний для AI-бота: 5 источников данных, которые нужно загрузить

База знаний для бота простым языком: что это, какие 5 источников загружать (прайс, FAQ, расписание, политика возврата, контакты), анти-патерны (PDF на 200 страниц), частота обновления. Примеры для 3 ниш.

Анна Петрова18 мая 2026 г.10 мин чтения

Head of content в WowPostio. 8+ лет в SMM для малого бизнеса.

Светлана — владелица стоматологической клиники в Питере. Подключила AI-бот в Direct месяц назад, ожидала «магии»: бот ответит на всё. Через неделю — разочарование. На вопрос «сколько стоит протезирование?» бот честно отвечает «уточню и вернусь», на «делаете ли вы детям?» — «нужно уточнить с врачом». Светлана уверена, что бот «глупый». На самом деле бот идеальный — он просто не знает её клинику. У него нет базы знаний. Загрузка пяти PDF с прайсом, расписанием, FAQ, описанием специалистов и политикой записи занимает 20 минут. Через час после загрузки тот же бот отвечает на 89% входящих по конкретным ценам и услугам. База знаний — это то, что отличает «AI-бот, который тупит» от «AI-бот, который работает».

Коротко. База знаний (Knowledge Base, KB) для AI-бота — это структурированные данные о вашем бизнесе, к которым бот обращается, отвечая на вопросы клиентов. Технически это RAG (Retrieval-Augmented Generation): LLM не «помнит» вашу клинику, она читает вашу базу под каждый вопрос. Без KB бот говорит общие фразы; с правильной KB — отвечает по конкретным ценам, услугам и расписанию. Загрузка пяти источников (прайс, FAQ, расписание, политика возврата, контакты) занимает 20–40 минут и поднимает точность ответов с 35% до 89%.

Что такое база знаний простым языком?

Технические статьи объясняют KB через «embedding», «vector database», «top-k retrieval» — это правда, но для владельца SMB это пустые слова. По сути, база знаний — это памятьбота про ваш бизнес.

Представьте, что вы наняли нового администратора в клинику. Чтобы он отвечал клиентам на телефоне, вы дали ему папку с материалами: прайс на услуги, расписание врачей, FAQ «самые частые вопросы», политика записи, адреса филиалов. Когда звонит клиент с вопросом «сколько стоит лечение кариеса?», администратор открывает папку, находит ответ и говорит «3 500 ₽ начальная стадия».

AI-бот работает точно так же. Папка — это knowledge base. Поиск в папке — это retrieval. Формулировка ответа на основе найденного — это generation. Вместе — RAG.

Без папки администратор отвечает «не знаю» или импровизирует с риском соврать. Без knowledge base AI-бот галлюцинирует или честно отвечает «уточню и вернусь». В обоих случаях клиент уходит.

Какие 5 источников данных нужны для базы знаний?

По нашему опыту на 200+ SMB-аккаунтов в нишах услуг и e-commerce, эти пять блоков закрывают 85% типовых вопросов. Загрузить их в любой современный AI-бот — 20–40 минут.

Источник 1: прайс или меню

Самый частый вопрос в директе любого бизнеса — «сколько стоит?». Без прайса бот ответить не может. Что грузить:

  • Стоматология / клиника — таблица «услуга — стартовая цена — длительность». «Лечение кариеса — от 3 500 ₽ — 60 минут».
  • Кафе / ресторан — меню с категориями (горячее, напитки, десерты), названиями, ценами, ингредиентами (для аллергиков), наличием веганских и безглютеновых позиций.
  • Салон красоты — услуги с разбивкой по мастерам (если разная цена), длительность, цена. «Стрижка женская — Анна 2 800 ₽ / Светлана 3 500 ₽».
  • Эксперт-консультант — форматы (разовая сессия / абонемент / интенсив), цены, длительность, что входит.

Источник 2: FAQ из реальной переписки

Это самый недооценённый источник. Откройте директ и выгрузите 30–50 последних диалогов. Соберите вопросы, которые повторяются 3+ раза — это и есть ваш «реальный» FAQ.

Типичные категории для большинства ниш:

  • «Это безопасно? / Это не вредно?» — обычно про процедуры или продукты с потенциальным риском.
  • «А что если не понравится?» — про политику возврата или гарантии.
  • «Как у вас платить?» — про способы оплаты, рассрочку, СБП.
  • «Делаете ли детям?» / «Принимаете беременных?» — про ограничения.
  • «Сколько раз надо приходить?» — про курсы и серии процедур.

Один реальный вопрос «А вы заразиться нельзя в кабинете?» в knowledge base стоит дороже, чем 50 теоретических из интернета — потому что именно этот вопрос написали именно ваши клиенты.

Источник 3: расписание

Часы работы по дням недели, выходные, праздники, расписание конкретных мастеров/специалистов, сезонные изменения. Структурно лучше всего в табличном виде.

Подводный камень — праздники в РФ. 23 февраля, 8 марта, майские, Новый год — клиенты пишут «вы 8-го работаете?», и если KB этого не знает, бот выдаёт стандартное расписание и подставляет вас. Обновлять KB надо за неделю до каждого длинного праздника.

Источник 4: политика возврата / гарантии / предоплата

Здесь сидят все возражения «а если…». Что нужно описать:

  • Что делать, если клиенту не подошёл результат (стрижка, процедура, продукт).
  • Возврат денег: возможен ли, в каких сроках, в каких случаях.
  • Перенос записи: за сколько часов, штраф или бесплатно.
  • Опоздание клиента: что делать, если опоздал больше 15 минут.
  • Предоплата: сумма, способы, возвратность.

Эту секцию владельцы чаще всего забывают, и она ловит бота на 15–20% самых конверсионных диалогов (где клиент уже почти готов, но снимает последнее возражение).

Источник 5: контакты с филиалами

Адреса, метро, парковка, телефоны, мессенджеры, время пути от ближайших ориентиров. Если филиалов несколько — для каждого. Если есть онлайн-формат — описать как отдельный «канал».

Анти-патерны: что НЕ грузить в knowledge base?

Самая частая ошибка — «у меня есть PDF на 80 страниц про нашу клинику, залью в бота». Бот тупит, потому что:

  • Скан-PDF с фото без OCR. Бот видит картинку, текст не распознаёт. Решение — OCR через бесплатные инструменты, потом загрузка текста.
  • PDF с маркетингом, миссией, историей.«Мы основаны в 2014 году тремя друзьями…» — клиенту это не нужно, и бот теряется в шуме при поиске. Грузить только функциональную информацию: «что», «сколько», «когда», «где», «как».
  • Внутренние документы для сотрудников.Инструкция администратору «при опоздании клиента на 30 минут — взять предоплату» — не должна попасть в KB бота. Иначе бот может сказать клиенту «с вас удержим предоплату» в публичном директе.
  • Дублирующиеся версии прайса. Если старый прайс остался в KB рядом с новым — бот может случайно отдать старую цену клиенту. Жёстко: обновили → удалили старое, не накапливаем.
  • Длинные истории клиентов и отзывы. Это контент для постов, не для бота. Бот должен отвечать фактами, не историями.

Как правильно структурировать KB чтобы бот отвечал точно?

Три принципа, которые мы рекомендуем владельцам:

Принцип 1: короткие законченные факты

Плохо: «У нас широкий выбор процедур по уходу за лицом, включая чистку, пилинг, массаж и многое другое, цены начинаются от 2 500 ₽ за базовые и доходят до 12 000 ₽ за комплексные программы…».

Хорошо:

  • «Чистка лица механическая — 2 500 ₽ — 60 мин»
  • «Чистка лица ультразвуковая — 3 200 ₽ — 50 мин»
  • «Химический пилинг поверхностный — 4 800 ₽ — 45 мин»
  • «Программа anti-age (5 процедур) — 12 000 ₽»

AI-бот извлекает точный факт из второго варианта за 0.3 секунды. Из первого — путается и выдаёт расплывчатое «от 2 500 ₽».

Принцип 2: один факт — одно место

Если цена на стрижку в KB записана в двух местах (в «прайсе» и в «FAQ»), и они расходятся — бот может выдать любую. Жёстко: один факт хранится в одном месте, все остальные источники на него ссылаются («подробный прайс — в разделе X»).

Принцип 3: язык клиента, не специалиста

Плохо: «Лечение пульпита с применением депофореза гидроксида меди-кальция».

Хорошо: «Лечение нерва зуба (пульпит). Сохраняем зуб живым, без удаления. Цена — от 6 500 ₽, занимает 60–90 минут».

Клиент пишет «болит зуб с нервом, что делать?». Бот должен найти ответ. Если KB написана языком стоматолога — бот не сматчит «болит с нервом» с «пульпит». Если языком клиента — найдёт сразу.

Как часто обновлять базу знаний?

Главное правило: каждый раз, когда меняется факт. На практике это означает регулярные триггеры:

ТриггерЧто обновитьСрочность
Сменили ценыпрайсв день изменения
Поменялось расписаниерасписаниеза неделю до
Открыли новый филиалконтактыза день до открытия
Праздничные днирасписаниеза неделю до
Появилась новая услугапрайс + FAQв день запуска
Сменили мастера/специалистарасписание + прайсза день до
3 новых типовых вопроса от клиентовFAQраз в 2 недели

Самая дешёвая привычка — поставить в календаре «раз в две недели — пересмотр knowledge base, 15 минут». Открываете директ, смотрите, какие вопросы повторялись, на которые бот отвечал «уточню и вернусь». Эти 3–5 пробелов и есть ваш апдейт.

Примеры базы знаний для трёх ниш

Кафе и доставка еды

Что должно быть в KB:

  • Меню по категориям (горячее, холодное, напитки, десерты) с ценами и весом порций.
  • Аллергены: глютен, лактоза, орехи — пометить для каждой позиции.
  • Веганские, безглютеновые, кето-позиции — отдельным списком.
  • Зоны доставки и стоимость по зонам.
  • Время доставки в пиковые и обычные часы.
  • Способы оплаты (СБП, наличные курьеру, рассрочка).
  • Минимальная сумма заказа для бесплатной доставки.

Кейс — кафе.

Клиника / стоматология

  • Прайс по услугам с «от»-ценой и средним диапазоном.
  • Список врачей с специализацией и образованием (важно для доверия).
  • Расписание по дням недели на каждого врача.
  • FAQ по «детям с какого возраста», «беременным можно», «обезболивание включено».
  • Адрес, метро, парковка, способ записи.
  • Политика переноса записи и опозданий.
  • ВАЖНО: бот НЕ должен ставить диагнозы. В KB пометка «при подобных запросах — направить на консультацию».

Кейс — клиника.

Эксперт-консультант

  • Форматы (разовая консультация, абонемент, интенсив, курс) с ценами и длительностью.
  • Что входит в каждый формат (домашние задания, поддержка в чате, материалы).
  • Темы и проблемы, по которым работаете (с конкретикой, не «личностный рост вообще»).
  • Условия отмены и переноса сессий.
  • Способы связи (Zoom, Telegram, личная встреча — где применимо).
  • Кейсы клиентов в обезличенной форме (без имён): «работала с такой-то проблемой 3 месяца, результат — X».

Кейс — эксперт.

Что попробовать прямо сейчас?

Практический план на 1 вечер:

  1. Соберите в одном файле 5 источников из списка выше — под вашу нишу. Если ниши среди 3 примеров нет, ориентируйтесь по типу: «услуга на месте», «доставка», «онлайн-формат».
  2. Структурируйте по 3 принципам: короткие факты, один факт — одно место, язык клиента.
  3. Возьмите 7-дневный триал AI-бота с поддержкой knowledge base. Залейте 5 файлов.
  4. Прогоните 20 тестовых вопросов из вашего реального директа. Посмотрите, где бот отвечает «уточню» — это дыры в KB, дозалейте.
  5. Через 3–4 итерации (1 вечер) точность доходит до 85%+. Запускайте на реальный трафик.

Связанные гайды — «чат-бот для Instagram в директе», «авто-ответы на комментарии» и «передача заказов в WhatsApp». Если хочется всё в одном — смотрите наш подход к AI, который закрывает не только директ, но и контент-план, и публикации.

Попробовать бесплатно · Шаблон контент-плана

Частые вопросы

Что такое база знаний для AI-бота простым языком?

База знаний (Knowledge Base) — это структурированные данные о вашем бизнесе, к которым бот обращается, отвечая клиентам. Технически RAG: LLM не «помнит» вашу клинику, она читает вашу базу под каждый вопрос. Без KB бот говорит общие фразы; с KB — отвечает по конкретным ценам и услугам.

Какие 5 источников данных нужно загрузить в knowledge base?

Прайс или меню с конкретными ценами и категориями. FAQ из 30–50 реальных вопросов из директа (не теоретических). Расписание по дням недели + праздники. Политика возврата, переносов, опозданий, предоплаты. Контакты с филиалами, адресами, способами связи. Эти 5 закрывают 85% типовых вопросов.

Как обучить AI-бота на своих данных?

Не «обучить» в смысле тренировки — а загрузить в knowledge base. Соберите 5 источников в текстовом виде, структурируйте короткими законченными фактами на языке клиента (не специалиста), загрузите в KB бота, прогоните 20 тестовых вопросов из реального директа, дозалейте пробелы. 20–40 минут до первого результата.

Можно ли загрузить PDF с описанием клиники в knowledge base?

Можно, но осторожно. Скан-PDF без OCR — бот не прочитает картинку. PDF с маркетингом и историей компании — шум, который мешает поиску. Грузите только функциональную информацию (что, сколько, когда, где, как). PDF на 80 страниц = бот тупит — разделите на 5 функциональных блоков.

Как часто нужно обновлять базу знаний бота?

По триггерам: сменили цены — в день изменения, поменялось расписание — за неделю, открылся филиал — за день до открытия, праздничные дни — за неделю до. Раз в две недели — 15 минут на пересмотр KB по пробелам, на которые бот отвечал «уточню и вернусь». Без обновления KB бот быстро устаревает.

Что такое RAG для чат-бота?

RAG (Retrieval-Augmented Generation) — это подход, где LLM не «знает» ваш бизнес из коробки, а читает knowledge base под каждый запрос. Шаги: вопрос клиента → поиск релевантных фактов в KB → формирование ответа на основе найденного. Результат: бот отвечает по вашим данным, а не общими фразами из интернета.

Сколько времени занимает настройка knowledge base?

Базовая настройка с 5 источниками — 20–40 минут (сбор файлов + загрузка). До точности 85%+ — ещё 1 вечер тестирования: прогоняете 20 реальных вопросов, дозаливаете пробелы, повторяете 3–4 раза. Дальше — 15 минут раз в 2 недели на актуализацию.

Попробовать бесплатно

Карта для старта не нужна.