Am antrenat un chatbot AI pe documentele companiei mele în cincisprezece minute
Expresia "antrenarea unui AI" poartă connotații de seturi de date vaste, clustere GPU, expertiză în învățarea automată și bugetul computational pe care doar laboratoarele de cercetare bine finanțate și-l permit. Această percepție, deși exactă pentru construirea modelelor fundamentale de la zero, este extrem de înșelătoare atunci când vine vorba de crearea unui chatbot care înțelege afacerea ta specifică. Distincția contează pentru că împiedică mii de companii să implementeze soluții de AI conversațional care nu doar că sunt la îndemâna lor, dar pot fi implementate în mai puțin timp decât durează scrierea unei agende de întâlnire.
Antrenarea unui chatbot pe cunoștințele specifice companiei nu necesită antrenarea unui model de limbaj de la zero. Necesită furnizarea unui model de limbaj existent cu contextul de care are nevoie pentru a răspunde cu acuratețe la întrebări despre afacerea ta. Modelul știe deja cum să înțeleagă întrebări, să construiască răspunsuri coerente și să menține fluxul conversațional. Ce îi lipsește este cunoașterea produselor, politicilor, procedurilor și terminologiei tale specifice. Furnizarea acestei cunoștințe este o chestiune de încărcare de documente, nu de executare a buclelor de antrenament pe mii de GPU-uri. Procesul este mai apropiat de a oferi unui nou angajat un dosar de orientare decât de ceva care seamănă cu cercetarea din învățarea automată.
ChatBot API de la yeb.to face acest proces explicit și raționalizat. Încarcă documentele cu cunoștințele tale. Sistemul le procesează într-o bază de cunoștințe căutabilă. Definește cazuri de utilizare care descriu ce ar trebui să fie în stare să facă chatbot-ul. Începe conversații. Chatbot-ul se bazează pe cunoștințele încărcate pentru a răspunde la întrebări, a furniza informații și a ghida utilizatorii prin procese specifice afacerii tale. Cincisprezece minute de la prima încărcare la prima conversație utilă nu este optimism de marketing. Este cronologia reală atunci când documentele cu cunoștințe sunt deja organizate și cazurile de utilizare sunt clare.
Ce se consideră cunoștință și cum funcționează încărcarea
Încărcarea cunoștințelor acceptă o gamă de formate de documente care acoperă modalitățile în care majoritatea companiilor îsi stochează cunoștințele instituționale. PDF-uri ale manualelor de produs, documente Word care conțin manuale de politică, fișiere text cu compilări de Întrebări Frecvente, fișiere Markdown cu documentație tehnică și exporturi în text simplu din sisteme wiki servesc toate ca surse valide de cunoștințe. Sistemul asimilează aceste documente, le împarte în bucăți semantic coerente și le indexează în mod care permite chatbot-ului să recupereze pasaje relevante atunci când răspunde la întrebări.
Calitatea răspunsurilor chatbot-ului depinde direct de calitatea și completitudinea cunoștințelor încărcate. Un manual de produs care descrie în profunzime caracteristici, cazuri de utilizare, limitări și pași de depanare produce un chatbot care poate răspunde la întrebări detaliate despre produs cu acuratețe. Un document rar care acoperă doar caracteristici de bază produce un chatbot care poate răspunde la întrebări de bază, dar se abține de la orice mai specific. Aceasta nu este o limitare a tehnologiei, ci un reflex al principiului fundamental că chatbot-ul știe ceea ce i-a fost spus, iar a-i spune mai mult produce rezultate mai bune.
Procesul de încărcare gestionează formatarea documentului automat, eliminând informațiile de aspect irelevante, păstrând în același timp structura semantică care contează pentru înțelegere. Anteturile devin limite de secțiune. Punctele de enumerare devin articole enumerate. Tabelele îsi păstrează relațiile rând-coloană. Scopul este extragerea conținutului informației din document, eliminând stratul de prezentare, deoarece chatbot-ul trebuie să înțeleagă ce spune documentul, nu ce font folosește. Această procesare automatizată elimină necesitatea pregătirii manuale a documentelor, ceea ce înseamnă că documentele existente ale companiei pot fi încărcate cum sunt, fără reformatare.
Pot fi încărcate mai multe documente pentru a construi o bază de cunoștințe cuprinzătoare care să cuprindă diferite aspecte ale afacerii. O configurare completă ar putea include un catalog de produse, un manual de servicii pentru clienți, o Întrebare Frecventă tehnică, un ghid de prețuri și un document cu prezentare generală a companiei. Fiecare document contribuie la un aspect diferit al cunoștințelor chatbot-ului, iar sistemul le integrează fără probleme, astfel încât o conversație singură poate extrage informații din mai multe surse. Un client care întreabă despre o caracteristică de produs și apoi întreabă despre prețuri primește răspunsuri coerente la ambele întrebări, chiar dacă informațiile provin din documente încărcate diferite.
Cazuri de utilizare și predarea chatbot-ului ce ar trebui să facă
Încărcarea cunoștințelor spune chatbot-ului ce știe. Definirea cazurilor de utilizare îi spune ce ar trebui să facă cu acea cunoștință. Un caz de utilizare este o descriere a unui scenariu conversațional pe care chatbot-ul ar trebui să fie pregătit să-l gestioneze: răspunderea la întrebări despre produse, ghidarea utilizatorilor printr-un proces de configurare, calificarea unor piețe de vânzări, gestionarea cererilor de asistență sau orice alt obiectiv conversațional care se aliniază cu nevoile afacerii.
Cazurile de utilizare servesc ca orientări comportamentale care modelează modul în care chatbot-ul aplică cunoștințele sale. Fără cazuri de utilizare definite, chatbot-ul răspunde la întrebări prin recuperarea cunoștințelor relevante și prezentarea lor. Cu cazuri de utilizare definite, chatbot-ul înțelege nu doar ce informații să furnizeze, ci și cum să structureze conversația în jurul acelei informații. Un caz de utilizare de asistență ar putea instrui chatbot-ul să pună întrebări clarificatoare înainte de a furniza soluții. Un caz de utilizare de calificare a vânzărilor ar putea să-l instruiască să adune informații despre nevoile prospectului înainte de a recomanda produse. Un caz de utilizare de Întrebări Frecvente general ar putea să-l instruiască să furnizeze răspunsuri directe fără preambuă extinsă.
Procesul de definire a cazurilor de utilizare nu necesită expertiză în programare sau inginerie promptă. Fiecare caz de utilizare este descris în limbaj natural: ce tip de întrebări sau cereri ar putea avea utilizatorul, ce informații ar trebui să furnizeze chatbot-ul, ce ton ar trebui să folosească și ce acțiuni ar trebui să sugereze. Sistemul traduce aceste descrieri în parametri comportamentali care ghidează răspunsurile chatbot-ului. Un proprietar de afaceri non-tehnic poate defini cazurile de utilizare la fel de eficace ca un dezvoltator, deoarece definițiile sunt exprimate în același limbaj natural pe care îl folosește și chatbot-ul însuși.
Numărul și specificitatea cazurilor de utilizare ar trebui să reflecte domeniul de aplicare intenționat al chatbot-ului. Un chatbot de asistență pentru clienți ar putea avea nevoie de zece până la cincisprezece cazuri de utilizare care acoperă categorii diferite de asistență. Un chatbot simplu de Întrebări Frecvente ar putea avea nevoie de trei sau patru. Un chatbot de calificare a vânzărilor ar putea avea nevoie de cinci până la șapte cazuri de utilizare care acoperă linii de produse diferite sau segmente de clienți. Începerea cu mai puține, cazuri de utilizare mai largi și rafinarea în cazuri mai specifice pe baza modelelor de conversație reale este o abordare practică care produce rezultate bune rapid și se îmbunătățește în timp pe măsură ce datele de utilizare dezvăluie ce scenarii necesită o gestionare mai detaliată.
Prima conversație și ce știe de fapt chatbot-ul
Momentul adevărului sosește atunci când prima întrebare reală este pusă. Nu o întrebare de test pe care dezvoltatorul știe deja răspunsul, ci o întrebare genuină de la cineva care se așteaptă la un răspuns util. Aici este locul unde calitatea bazei de cunoștințe și claritatea cazurilor de utilizare fie se dovedesc, fie dezvăluie goluri. Un chatbot bine pregătit gestionează prima întrebare cu încredere, furnizând un răspuns precis extras din cunoștințele încărcate și prezentat într-un ton în concordanță cu cazurile de utilizare definite. Un chatbot slab pregătit se zbate, furnizând răspunsuri generice care ar putea aplica oricărei companii sau deviind cu variații ale "vă rog contactați suportul pentru mai multe informații."
Primele câteva zile de operare în direct sunt cele mai valoroase pentru îmbunătățirea eficacității chatbot-ului. Conversațiile dezvăluie întrebările pe care utilizatorii reali le pun de fapt, care adesea diferă semnificativ de întrebările pe care afacerea se aștepta să le pună. Un chatbot de produs ar putea primi mai multe întrebări despre prețuri și disponibilitate decât despre caracteristici, sugerând că baza de cunoștințe are nevoie de documentație de prețuri mai puternică. Un chatbot de asistență ar putea primi întrebări formulate în moduri pe care definițiile cazurilor de utilizare nu le-au anticipat, sugerând rafinări ale orientărilor conversaționale.
Iterarea pe baza cunoștințelor și cazurilor de utilizare pe baza datelor de conversație reale este cheia unei îmbunătățiri rapide. Fiecare conversație care produce un răspuns nesatisfăcător identifică un gol specific: fie baza de cunoștințe nu conține informațiile relevante, fie definiția cazului de utilizare nu ghidează chatbot-ul să aplice corect informațiile disponibile. Abordarea acestor goluri este o muncă incrementală, adăugând un document aici, rafinând un caz de utilizare acolo, și fiecare îmbunătățire beneficiază toate conversațiile viitoare care ating același subiect. Chatbot-ul se îmbunătățește semnificativ cu fiecare rundă de rafinare, iar ritmul îmbunătățirii este cel mai rapid în primele câteva săptămâni atunci când cele mai comune goluri sunt identificate și umplute.
Curba de învățare pentru cei care mențin chatbot-ul este la fel de rapidă. La sfârșitul primei săptămâni, persoana care gestionează chatbot-ul înțelege ce fel de cunoștință produce cele mai bune răspunsuri, cât de specifice trebuie să fie definițiile cazurilor de utilizare și ce modele conversaționale necesită atenție. Această familiaritate operațională, dobândită prin experiență directă mai degrabă decât prin lectură de documentație, este ceea ce transformă chatbot-ul dintr-un instrument de configurare și uitare într-un activ care se îmbunătățește continuu și devine mai valoros pentru afacere cu fiecare săptămână care trece.
Nu este necesară expertiza în ML și ce înseamnă de fapt
Afirmația că nu este necesară expertiză în învățarea automată merită a fi explicată pentru că sună a limbaj de marketing și este important să explici de ce este cu adevărat adevărat. ChatBot API gestionează în intern toate operațiile complex tehnic: fragmentarea documentelor, încorporare vectorială, căutare semantică, gestionarea ferestrei de context, construcția promptă și generarea de răspunsuri. Acestea sunt operațiile care necesită cunoștințe de ML pentru a fi implementate de la zero. Nu necesită cunoștințe de ML pentru a fi utilizate printr-o API care le abstracts după o interfață simplă.
Abilitățile necesare pentru a configura și menține un chatbot prin acest sistem sunt complet non-tehnice: capacitatea de a organiza cunoștințele companiei în documente, capacitatea de a descrie scenarii conversaționale în limbaj natural și capacitatea de a citi jurnalele de conversație și a identifica locurile în care răspunsurile au fost insuficiente. Acestea sunt abilități pe care le posedă orice manager de afaceri, lider de asistență pentru clienți sau profesionist de marketing. Infrastructura tehnică este gestionată de API, iar inteligența comercială este gestionată de oamenii care înțeleg afacerea.
Această diviziune a responsabilităților este ceea ce face implementarea în cincisprezece minute realistă mai degrabă decât aspirațională. Părțile tehnic greu sunt deja rezolvate și funcționează ca serviciu. Părțile specifice afacerii, pe care doar afacerea le poate furniza, sunt straightforward de furnizat prin încărcare de documente și definiții de cazuri de utilizare în limbaj natural. Intersecția acestor două intrări produce un chatbot care combină capacitățile conversaționale ale unui model de limbaj mare cu cunoștințele specifice și orientările comportamentale ale afacerii, fără ca cineva implicat să trebuiască să înțeleagă cum funcționează intern nici modelul de limbaj, nici sistemul de recuperare a cunoștințelor.
Rezultatul este un chatbot care cunoaște produsele tale, vorbește în tonul brandului tău, gestionează scenariile pe care le definești și se îmbunătățește pe măsură ce îi furnizezi cunoștințe mai bune și orientări mai clare. Întregul pipeline de ML rulează pe scenă, invizibil pentru utilizatorul afacerii, ceea ce este exact modul în care ar trebui să funcționeze. Afacerea nu trebuie să înțeleagă transformere și încorporări mai mult decât un șofer trebuie să înțeleagă injecția de combustibil și ingineria transmisiei. Vehiculul funcționează. Destinația este atinsă. Detaliile motorului sunt preocuparea altcuiva.
Întrebări Frecvente
Ce formate de fișier sunt acceptate pentru încărcarea cunoștințelor
Sistemul acceptă fișiere PDF, DOCX, TXT, Markdown și text simplu. Majoritatea documentației companiilor există într-one din aceste formate, iar linia de procesare gestionează structura specifică a fiecărui format pentru a extrage conținutul informației, păstrând relații semantice între secțiuni, anteturi și text cu corp.
Cât conținut este necesar pentru un chatbot eficace
O bază de cunoștințe viabilă minim poate fi la fel de mică ca un singur document cuprinzător de Întrebări Frecvente care acoperă cele mai comune întrebări. Implementările mai complete incluzic de obicei documentație de produs, ghiduri de politici și manuale de proceduri totalizând zece până la cincizeci de pagini de conținut. Eficacitatea chatbot-ului se scalează cu completitudinea bazei sale de cunoștințe, deci începerea mic și expandarea pe baza golurilor de conversație este o abordare practică.
Poate chatbot-ul gestiona întrebări în afara bazei sale de cunoștințe
Când chatbot-ul primește o întrebare care cade în afara cunoștințelor sale încărcate, ea recunoaște limitarea mai degrabă decât a genera răspunsuri speculatoare. Comportamentul specific poate fi configurat prin definiții ale cazurilor de utilizare, cum ar fi redirecționarea spre asistență umană, sugerarea unor subiecte alternative pe care poate ajuta, sau furnizarea unui răspuns general, notând că informații mai specifice sunt disponibile de la un agent uman.
Cât de repede reflectă chatbot-ul actualizări ale bazei de cunoștințe
Actualizările bazei de cunoștințe intră în vigoare în termen de minute de la încărcarea documentului. Nu există o perioadă de reantrenament sau coadă de procesare. Documentele actualizate sau suplimentare sunt indexate și devin disponibile pentru utilizare imediată de chatbot în conversațiile ulterioare. Acest ciclu de actualizare rapid permite răspunsuri în aceeași zi la schimbări de produse, actualizări de politici sau informații noi.
Sunt datele de conversație private și sigure
Datele de conversație sunt asociate cu contul API care a creat chatbot-ul și nu sunt partajate cu alte conturi sau utilizate în scopuri de antrenament. Documentele cu cunoștințe încărcate și jurnalele de conversație sunt accesibile doar prin API autentificat, asigurând că informațiile proprietare ale afacerii rămân sub controlul deținătorului contului.
Pot fi create mai multe chatbot-uri din baze de cunoștințe diferite
Da. Baze de cunoștințe diferite și configurații de cazuri de utilizare pot susține mai multe chatbot-uri în cadrul aceluiași cont. Aceasta permite unei organizații simple să implementeze chatbot-uri separate în scopuri diferite, cum ar fi un bot de asistență orientat către client și un bot de politică HR intern, fiecare antrenat pe seturi de documente diferite și configurat cu orientări comportamentale diferite.