Фразата "обучаване на AI" носи коннотации на огромни набори от данни, GPU клъстери, експертиза в машинното обучение и вида на изчислителния бюджет, който могат да си позволят само добре финансирани изследователски лаборатории. Това възприятие, макар и точно за изграждане на фундаментни модели от нулата, е дивашко подвеждащо, когато е дума за създаване на чатбот, който разбира вашия специфичен бизнес. Разликата е важна, защото предотвращава хиляди компании да внедрят решения за разговорна изкуствена интелигентност, които не само са в техния обхват, но могат да бъдат развернати за по-малко време, отколкото е необходимо за написване на дневния ред на събрание.

Обучаването на чатбот на знания, специфични за компанията, не изисква обучаване на езиков модел от нулата. Той изисква предоставяне на съществуващ езиков модел с контекста, който му е необходим, за да отговори точно на въпроси относно вашия бизнес. Моделът вече знае как да разбира въпроси, да строи съгласувани отговори и да поддържа разговорния поток. Това, което му липсва, е знание на вашите специфични продукти, политики, процедури и терминология. Предоставянето на това знание е въпрос на качване на документи, не на стартиране на цикли на обучение на хиляди GPU. Процесът е по-близо до даването на ориентационна папка на нов служител, отколкото до всичко, което наподобява изследване на машинното обучение.

ChatBot API на yeb.to прави този процес явен и опростен. Качете вашите документи със знание. Системата ги преработва в база от знания, която се търси. Определете сценарии на използване, които описват какво трябва да може да прави чатботът. Започнете разговори. Чатботът използва качено знание, за да отговаря на въпроси, предоставя информация и ръководи потребителите през процеси, които са специфични за вашия бизнес. Петнадесет минути от първото качване до първия полезен разговор не е маркетингов оптимизъм. Това е действителният график, когато знаеште документи са вече организирани и сценариите на използване са ясни.

Какво се счита за знание и как работи качването

Качването на знание приема поредица от формати на документи, които покриват начините, по които повечето компании съхранят своите институционални познания. PDF на ръководства на продукти, Word документи, съдържащи наръчници на политики, текстови файлове със събирки на често задавани въпроси, Markdown файлове с техническа документация и обикновени текстови експортирания от wiki системи - всички служат като валидни източници на знание. Системата поглъща тези документи, разбива ги на семантично съгласувани парчета и ги индексира по начин, който позволява на чатботът да извлека съответстващи пасажи, когато отговаря на въпроси.

Качеството на отговорите на чатбота зависи преки от качеството и пълнотата на качено знание. Ръководство на продукт, което подробно описва характеристики, случаи на използване, ограничения и стъпки за отстраняване на неизправности, произвежда чатбот, който може да отговаря на подробни въпроси на продуктите с точност. Разреден документ, който покрива само основни характеристики, произвежда чатбот, който може да отговаря на основни въпроси, но отлага всичко по-специфично. Това не е ограничение на технологията, а отражение на фундаменталния принцип, че чатботът знае това, което му е казано, и казването на него повече произвежда по-добри резултати.

Процесът на качване обработва форматирането на документи автоматично, отстраняване на нерелевантна информация за оформление, докато запазва семантичната структура, която е важна за разбирането. Заглавията стават граници на секции. Точките с куршум стават предмети, които могат да се изброят. Таблиците поддържат своите връзки ред-колона. Целта е да се извлече информационното съдържание от документа, докато се отхвърля слоят на представяне, защото чатботът трябва да разбира какво казва документът, а не какъв шрифт използва. Тази автоматична обработка отстранява необходимостта от ръчна подготовка на документи, което означава, че съществуващите корпоративни документи могат да бъдат качени както са без преформатиране.

Могат да бъдат качени множество документи, за да се изгради всеобхватна база от знания, която обхваща различни аспекти на бизнеса. Пълна конфигурация може да включва каталог на продукти, наръчник на услугата на клиентите, техническо често задавано въпросе, наръчник на цени и документ на преглед на компанията. Всеки документ допринася на различен аспект на знанието на чатбота, и системата ги интегрира безпроблемно, така че един разговор може да изтегля информация от множество източници. Клиент, който задава въпрос относно характеристика на продукт и след това задава въпрос относно цени получава съгласувани отговори на двата въпроса, дори че информацията идва от различни качени документи.

Сценарии на използване и обучаване на чатбота какво трябва да прави

Качването на знание казва на чатбота какво знае. Определянето на сценарии на използване казва на него какво трябва да прави с това знание. Сценарий на използване е описание на разговорен сценарий, който чатботът трябва да бъде подготвен да обработка: отговаряне на въпроси на продуктите, насочване на потребители чрез процес на конфигурация, квалифициране на продажни водачи, обработка на запитвания за поддръжка или други разговорни цели, които се съответстват с нуждите на бизнеса.

Сценариите на използване служат като поведенчески насоки, които оформят как чатботът прилага своето знание. Без определени сценарии на използване, чатботът отговаря на въпроси чрез извличане на съответстващо знание и представяне на него. С определени сценарии на използване, чатботът разбира не само каква информация да предостави, но как да структурира разговора около тази информация. Сценарий на поддръжка може да инструктира чатбота да задава уточняващи въпроси, преди да предостави решения. Сценарий на квалифициране на продажби може да го инструктира да събира информация относно нуждите на потенциалния клиент, преди да препоръча продукти. Общ сценарий на често задавано въпросе може да го инструктира да предостави преки отговори без обширна преамбула.

Процесът на определяне на сценарии на използване не изисква програмиране или експертиза на инженерството на подсказки. Всеки сценарий на използване е описан на естествен език: какъв тип въпроси или искания потребителят може да има, каква информация чатботът трябва да предостави, какъв тон трябва да използва и какви действия трябва да предложи. Системата преводи тези описания в параметри на поведение, които насочват отговорите на чатбота. Нетехнически собственик на бизнес може да определи сценарии на използване толкова ефективно, колкото разработчик, защото определенията се изразяват на същия естествен език, който самият чатбот използва.

Броят и спецификата на сценариите на използване трябва да отразяват предназначения обхват на чатбота. Чатбот за поддръжка на клиентите може да се нуждае от десет до петнадесет сценария на използване, покриваща различни категории на поддръжка. Прост чатбот на често задавано въпросе може да се нуждае от три или четири. Чатбот на квалифициране на продажби може да се нуждае от пет до седем сценария на използване, покриваща различни линии на продукти или сегменти на клиентите. Начало с по-малко, по-широки сценарии на използване и усъвършенстване в по-специфични въз основа на действителни модели на разговори е практически подход, който произвежда добри резултати бързо и се подобрява по времето, докато данните за използване разкриват кои сценарии се нуждаят от по-подробна обработка.

Първи разговор и какво чатботът действително знае

Моментът на истината пристига, когато първи реален въпрос е задан. Не тестов въпрос, на който разработчикът вече знае отговора, но истински въпрос от някой, който очаква полезен отговор. Това е където качеството на базата на знания и яснотата на сценариите на използване или платят, или разкриват пропуски. Добре подготвен чатбот обработва първи въпрос с увереност, предоставяйки точен отговор, извлечен от качено знание и представен в тон, съответстващ на определените сценарии на използване. Лошо подготвен чатбот се колебае, предоставяйки обобщени отговори, които могат да се отнесат към всяка компания или отклоняйки с вариации на "моля, свържете се с поддръжката за повече информация".

Първите няколко дни на живо функциониране са най-ценни за подобряване на ефективността на чатбота. Разговорите разкриват въпросите, които реалните потребители действително задават, които често се различават значително от въпросите, които бизнесът очаква да задават. Чатбот на продукти може да получи повече въпроси относно цени и наличност, отколкото относно характеристики, предлагащо, че базата на знания се нуждае от по-силна документация на цени. Чатбот на поддръжка може да получи въпроси, формулирани по начини, които определенията на сценариите на използване не са предвидели, предлагащо усъвършенствания на насочванията на разговори.

Повторение на базата на знания и сценариите на използване въз основа на реални данни за разговори е ключ към бързо подобряване. Всеки разговор, който произвежда неудовлетворителен отговор, определя конкретна пропаст: или базата на знания не разполага с съответстващата информация, или определението на сценарий на използване не насочва чатбота да прилага наличното информация правилно. Адресирането на тези пропуски е постепенна работа, добавяне на документ тук, усъвършенстване на сценарий на използване там, и всяко подобрение положителна ефект на всички бъдещи разговори, които докосват същата тема. Чатботът се подобрява значително с всеки кръг на усъвършенстване, и темпото на подобрение е най-бързо в първите няколко седмици, когато най-често пропуските се определят и попълват.

Кривата на обучаване за поддържащите чатбота е еднакво бърза. До края на първата седмица, личността, управляваща чатбота, разбира какъв тип знание произвежда най-добрите отговори, как специфични определенията на сценариите на използване трябва да бъдат, и кои модели на разговори се нуждаят от внимание. Това оперативно познаване, придобито чрез преки опит, а не чрез четене на документация, е това, което трансформира чатбота от инструмент на конфигурация и забрава в непрекъснато подобряваща се активност, която при всяка преминала седмица произвежда повече стойност за бизнеса.

Не е необходимо ML експертиза и какво това действително означава

Твърдението, че не е необходимо машинно обучение експертиза, заслужава разпаковане, защото звучи като маркетингов език и е важно да обясним защо е истински верно. ChatBot API обработва всички технически сложни операции вътрешно: разбиване на документи, векторно вграждане, семантично търсене, управление на контекстния прозорец, конструкция на подсказки и генериране на отговори. Това са операциите, които изискват ML знание за внедряване от нулата. Те не изискват ML знание за използване чрез API, който абстрахира тях зад просто интерфейс.

Умленията, необходими за настройка и поддържане на чатбота чрез тази система, са напълно нетехнически: способност да се организира корпоративно знание в документи, способност да се описват разговорни сценарии на естествен език и способност да се четат дневници на разговори и се определят, където отговорите не са били достатъчни. Това са умления, които всеки мениджър на бизнес, водач на поддръжка на клиентите или специалист по маркетинг притежава. Техническата инфраструктура се обработва от API, и деловата интелигентност се обработва от хората, които разбират бизнеса.

Това разделение на отговорности е това, което прави петнадесет минути внедряване реално, а не аспирационно. Технически трудни части са вече решени и работят като услуга. Специфичните за бизнес части, които само бизнесът може да предоставя, са ясни да се предостават чрез качване на документи и определения на сценарии на използване на естествен език. Пресечната точка на тези два входа произвежда чатбот, който комбинира разговорните способности на голям езиков модел със специфично знание и поведенчески насоки на бизнеса, без да е необходимо някой включен да разбира как работи или езиковият модел, или системата на извличане на знание вътрешно.

Резултатът е чатбот, който познава вашите продукти, говори на тона на вашия бранд, обработва сценариите, които определяте, и се подобрява, когато го храните с по-добро знание и по-ясни насоки. Всички ML конвейери работят зад кулисите, невидим за потребителя на бизнеса, което е точно как трябва да работи. Бизнесът не трябва да разбира трансформатори и вграждания, повече от като водач трябва да разбира впръскване на гориво и инженерство на передачи. Превозното средство работи. Местоназначението е достигнато. Детайлите на двигателя са грижа на някой друг.

Често задавани въпроси

Какви формати на файлове се поддържат за качване на знание

Системата приема PDF, DOCX, TXT, Markdown и обикновени текстови файлове. Повечето корпоративна документация съществува в един от тези формати, и конвейера на обработка обработва специфичната структура на всеки формат, за да извлече информационното съдържание, докато запазва семантични взаимоотношения между секции, заглавия и текст на тялото.

Колко съдържание е необходимо за ефективен чатбот

Минимална жизнеспособна база на знания може да бъде толкова малка, колкото един всеобхватен документ на често задавано въпросе, покриващ най-често срещаните въпроси. По-пълни внедрявания обикновено включват документация на продукти, наръчници на политики и процедурни наръчници, общо дальчо десет до петдесет страни на съдържание. Ефективността на чатбота мащабира с пълнотата на своята база на знания, така че начало с малко и разширяване въз основа на пропуски на разговори е практически подход.

Може ли чатботът да обработва въпроси извън своята база на знания

Когато чатботът получава въпрос, който пада извън своята качено знание, той признава ограничението, а не генерира спекулативни отговори. Специфичното поведение може да бъде конфигурирано чрез определения на сценариите на използване, като пренасочване към човешка поддръжка, предложение на алтернативни теми, които може да помогне, или предоставяне на обобщен отговор, докато отбелязва, че по-специфична информация е налична от човешки агент.

Как бързо чатботът отразява актуализации на базата на знания

Актуализациите на базата на знания влизат в сила в рамките на минути от качване на документи. Няма период на преквалификация или опашка на обработка. Актуализирани или допълнителни документи се индексират и стават налични за чатбота за незабавно използване в следващите разговори. Този бърз цикъл на актуализация позволява отговори на същия ден на промени на продукти, актуализации на политики или нова информация.

Са ли данните на разговори приватни и защитени

Данните на разговори се свързват с API акаунта, който създава чатбота и не се споделят с други акаунти или използват за целите на обучение. Качено знание документи и дневници на разговори са достъпни само чрез удостоверения API, гарантирайки че собствена информация на бизнеса остава под контрола на поддържащия на акаунта.

Могат ли множество чатботи да бъдат създадени от различни бази на знания

Да. Различни бази на знания и конфигурации на сценариите на използване могат да поддържат множество чатботи в рамките на един и същи акаунт. Това позволява един организацията да развърне отделни чатботи за различни цели, като чатбот на поддръжка на клиентите и внътрешен чатбот на политики на HR, всеки обучен на различни комплекти на документи и конфигуриран с различни поведенчески насоки.