Faktúry, lekárske predpisy, vizitky a bankové výpisy - jeden skener na všetko
Moderný profesionál sa počas ktoréhokoľvek týždňa zaoberá minimálne pol tuctom typov dokumentov. Faktúra príde od dodávateľa a treba ju zaznamenať do účtovného systému. Lekársky predpis sa vyzdvihne v lekárni a mal by sa zaznamenať na miesto spoľahlivejšie ako zásuvka v kuchyni. Vizitka sa vymení na konferencii a kontaktné údaje sa musia dostať do telefónu skôr, ako sa vizitka stratí v tašte na notebook. Bankový výpis príde a transakcie je treba zladiť. Potvrdenie z obchodného obedu je treba priložiť k správe o výdajoch. Výsledok laboratórneho testu z ročnej prehliadky by sa mal porovnať s číslami z minulého roku. Každý z týchto dokumentov existuje v inej forme s inými poľami a inými účelmi a až donedávna každý vyžadoval vlastný pracovný postup na digitalizáciu.
Krajina aplikácií odráža túto fragmentáciu. Existujú vyhradené skenery potvrdení, vyhradené skenery vizitiek, vyhradené nástroje na spracovanie faktúr, vyhradené čítačky lekárskych dokumentov. Každá z nich robí svoju špecifickú úlohu celkom dobre, ale vytvárame svoju vlastnú dátovú izolačnú bunku, vlastný účet na údržbu, vlastné rozhranie na naučenie a vlastné predplatné na zaplatenie. Kognitívne zaťaženie udržiavania šiestich špecializovaných skenovaní aplikácií pre šesť typov dokumentov je dosť významné na to, aby väčšina ľudí robila najľahší spôsob: urobte fotku telefónom, položte ju do zložky a dúfajte, že „fotka dokumentu v zložke" je dostatočný organizačný systém. Nikdy to nie je, ale alternatíva používania viacerých špecializovaných nástrojov sa cítí horšie.
Skener na scan.yeb.to má zásadne iný prístup. Jeden koncový bod spracováva osem typov dokumentov. Nahrajte fotku ktoréhokoľvek podporovaného dokumentu a AI identifikuje, aký typ dokumentu to je, aplikuje vhodnú extrakčnú logiku pre daný typ a vráti štruktúrované údaje formátované špecificky pre obsah, ktorý daný dokument obsahuje. Faktúra sa vráti s názvom dodávateľa, číslom faktúry, riadkovými položkami, sumami daní a celkovým dlhom. Vizitka sa vráti s menom, titulom, spoločnosťou, telefónnymi číslami, e-mailom a webom. Lekársky predpis sa vráti s názvami liekov, dávkami, frekvenciami a predpisujúcim lekárom. Extrakcia je špecializovaná na každý typ dokumentu, ale pracovný postup je univerzálny: fotografovať, nahrať, prijať údaje.
Čo každý typ dokumentu vytvára a prečo je špecializovaná extrakcia dôležitá
Generický skener OCR pojednáva s každým dokumentom rovnakým spôsobom: číta text na stránke a vráti blok textu. Výstup skenovania vizitky cez generický OCR je reťazec slov a čísel, ktorý by vypadal niečo ako „John Smith Marketing Director Acme Corp 555-0123 [email protected]" bez naznačenia, ktorá časť je meno, ktorá je titulom, ktorá je telefónnym číslom a ktorá je e-mailom. Používateľ musí tento výstup manuálne analyzovať a umiestnite každú informáciu do správneho poľa svojho správcu kontaktov. Toto je marginálne lepšie ako zadávanie karty ručne, ale len marginálne.
Špecializovaná extrakcia úplne zmení rovnicu. AI nielen číta text na vizitke; chápe, že vizitka obsahuje špecifické typy informácií usporiadaných v predvídateľných vzoroch. Mená sa objavujú v hornej časti. Tituly sa objavujú pod menami. Telefónne čísla nasledujú rozpoznateľné vzory číslic. E-mailové adresy obsahujú symbol @. Webové stránky začínajú rozpoznateľnými predponami. Tým, že sa chápe sémantika vizitky namiesto iba znakov, extrakcia vytvára správne označené, správne oddelené polia, ktoré sa môžu priamo priezvať do databázy kontaktov bez akejkoľvek manuálnej analýzy. Rovnaký princíp platí pre každý typ dokumentu, ktorý skener spracovávaspráva, každý s vlastným sémantickým modelom a vlastnou extrakčnou logikou.
Faktúry sú pravdepodobne najzložitejším typom dokumentu, pretože kombinujú prvky rozprávania (názvy spoločností, adresy, podmienky platby, poznámky) s tabuľkovými prvkami (riadkové položky s opismi, množstvami, sadzbami a sumami) a vypočítanými prvkami (medzisoučty, sadzby daní, zľavy, spolu). Extrakcia musí zvládnuť všetky tri súčasne, analyzovať informácie o dodávateľovi z hlavičky, jednotlivé poplatky z tabuľky položiek a finančný súhrn z päty. Rôzne spoločnosti formátujú svoje faktúry rôzne, od minimalistických jednoslupcových rozložení až po zložité viacčastované dokumenty s logami, podmienkami a zmluvami a viacerými rozdeleniami sadzby daní. AI zvláda túto variáciu tým, že rozumie tomu, čo je faktúra, a nie tomu, ako vyzerá špecifická šablóna faktúry, čo znamená, že funguje s faktúrami z akéhokoľvek dodávateľa bez potreby vopred nakonfigurovaných šablón.
Lekárske predpisy predstavujú úplne iný problém. Lekárske predpisy používajú špecializovanú notáciu, ktorá má vážny životný vplyv. „500mg BID x 14d" znamená 500 miligramov dvakrát denne počas štyridsať dní a chybné čítanie niektorej časti tejto notácie má dôsledky oveľa vážnejšie ako chybné čítanie riadkovej položky na faktúre. Predpísaná extrakcia skenera je navrhnutá s touto citlivosťou na mysli, analyzovať nielen názov lieku a dávku, ale aj frekvenciu, trvanie, predpisujúceho lekára a akékoľvek špeciálne pokyny. Štruktúrovaný výstup umožňuje jednoducho udržiavať históriu osobnej medicíny, ktorá obsahuje nielen to, čo bolo predpísané, ale kedy, kým a v akej dávke, čo je presne typ informácií, ktoré sú cenné počas budúcich lekárskych konzultácií, ale takmer nikdy systematicky sledované pacientmi.
Bankové výpisy a potrubia finančných dokumentov
Bankové výpisy sa nachádzajú na križovatke finančného sledovania a skenovania dokumentov, pretože obsahujú presne ten druh štruktúrovaných, opakujúcich sa údajov, ktoré sú najúnavnejšie na manuálne zadávanie a najcennejšie po digitalizácii. Mesačný bankový výpis môže obsahovať päťdesiat, sto alebo niekoľko stoviek jednotlivých transakcií, každá s dátumom, popisom a sumou. Zadávanie týchto údajov do tabuľky alebo účtovného systému je cvičením v vytrvalosti, ktorému sa väčšina ľudí vyhýba úplne, čo znamená, že podrobné údaje na úrovni transakcií v bankových výpisoch sú nepoužívané väčšinou ľudí, ktorí ich dostávajú. Výpis sa pozrie, zaznamená sa celkový zostatok a papier sa položí do súboru, kde sa nikdy nepozerá.
Skenovanie bankového výpisu cez scan.yeb.to extrahuje každú transakciu ako štruktúrovaný záznam. Každý záznam obsahuje dátum, popis (ktorý zvyčajne obsahuje názov obchodného miesta alebo typ transakcie) a sumu. Zachytávajú sa úvodné a záverečné zostatky, ako aj všetky súhrnné časti, ktoré rozdeľujú aktivitu mesiaca podľa kategórie. Tento štruktúrovaný výstup je možné poskytnúť účtovnému softvéru, porovnať so záznamami v receipts.yeb.to na zhodu potvrdení alebo jednoducho použiť ako základ pre osobnú kontrolu výdajov, ktorá by bola nepraktická na vedenie z tlačeného výpisu.
Kombinácia skenovania potvrdení a skenovania bankových výpisov vytvárap obzvlášť výkonný finančný pracovný postup. Potvrdenia poskytujú podrobnosti: čo bolo zakúpené, položku po položke, u každého obchodného miesta. Bankové výpisy poskytujú úplnosť: každú transakciu, vrátane tých, ktoré neprodukovaly žiadne papierové potvrdenie. Spolu dávajú komplexný pohľad na výdaje, ktorý jednotlivo ani jeden neposkytuje. Potvrdenie ukazuje, že poplatok 47 eur v obchode s potravinami bol zložený z konkrétnych položiek za konkrétne ceny. Bankový výpis ukazuje, že poplatok 47 eur sa uskutočnil v utorok o 15:14 a že v ten istý deň popoludní bola tiež 12-eurová platba v kaviarni, ktorá neprodukovalapotvrdenie, ktoré by stálo za skenáre. Obe úrovne informácií sú užitočné a jednotný skener robí obe dostupné prostredníctvom rovnakého pracovného postupu.
Osem typov v praxi a výber kedy skenovať
Osem typov dokumentov, ktoré skener podporuje, sú potvrdenia, faktúry, lekárske predpisy, vizitky, bankové výpisy, výsledky laboratórnych testov, identifikačné dokumenty a všeobecné dokumenty. Každý má vlastný extrakčný model, ale vzorec použitia v rámci všetkých z nich sa nasleduje rovnaká krivka prijatia. Ľudia sa začínajú skenovaním typu dokumentu, ktorý rieši svoju najnaliehavejšiu potrebu. Pre nezávislého dodávateľa sú to zvyčajne faktúry. Pre niekoho spravujúceho svoje zdravie sú to výsledky laboratórnych testov a lekárske predpisy. Pre účastníka konferencie sú to vizitky. Akonáhle sa zformuje zvyk skenovania okolo jedného typu dokumentu, prirodzene sa rozširuje na ostatné, pretože pracovný postup je identický a prekážka na pridanie ďalšieho typu je nula.
Otázka kedy skenovať je v podstate otázka kedy sú štruktúrované údaje cennými ako fotografia. Pre potvrdenie z obchodného obedu, ktoré je potrebné zaradiť do správy o výdajoch, je odpoveď vždy: skenáre šetrí viac času, ako ho stojí. Pre náhodné potvrdenie z obchodu s potravinami bez daňových alebo sledovacích dôsledkov odpoveď závisí od toho, či je sledovanie výdajov súčasťou dennej rutiny. Pre bankový výpis odpoveď závisí od toho, či údaje o transakcii slúžia niekomu účelu nad tým, čo už poskytuje online portál banky. Skener nepredpisuje pracovný postup; umožňuje čo pracovný postup potrebuje používateľ, od komplexného skanujte-všetko dokumentácie až po cielené skenáre iba dokumentov, ktoré служi okamžitému účelu.
Všeobecný typ dokumentu slúži ako záchytný typ pre dokumenty, ktoré sa nezmestia úhľadne do ostatných siedmich kategórií. Zmluvy, listy, formuláre, oznámenia, certifikáty, povolenia a akýkoľvek iný papierový dokument, ktorý obsahuje text hodnú digitalizácie, je možné spracovať prostredníctvom všeobecného extrakčného potrubia. Výstup pre všeobecné dokumenty je obsah celého textu so zachovaným formátovaním štruktúry, čo je užitočné na archivovanie, vyhľadávanie a referenčné účely aj bez špecializovanej extrakcie poľa, ktorú vyhradené typy dokumentov poskytujú. To znamená, že skener nikdy neodmietne dokument, pretože sa nezhoduje so známym typom. Všetko je skenovateľné a všetko vytvára užitočný výstup, so špecializovanými typmi produkujúcimi obzvlášť užitočný štruktúrovaný výstup prispôsobený ich obsahu.
Často kladené otázky
Koľko typov dokumentov skener podporuje
Skener na scan.yeb.to podporuje osem typov dokumentov: potvrdenia, faktúry, lekárske predpisy, vizitky, bankové výpisy, výsledky laboratórnych testov, identifikačné dokumenty a všeobecné dokumenty. Každý typ má špecializovanú extrakčnú logiku, ktorá vytvára štruktúrované údaje formátované pre túto kategóriu dokumentov. Všeobecný typ dokumentu spracováva čokoľvek, čo sa nezmestí do špecializovaných kategórií.
Automaticky skener detekuje typ dokumentu
AI analyzuje nahraný obrázok a identifikuje typ dokumentu na základe jeho obsahu a štruktúry. Faktúra s riadkovými položkami a súčtami sa rozpozná ako faktúra. Vizitka s kontaktnými údajmi sa rozpozná ako vizitka. Táto automatická detekcia znamená, že používateľ nemusí špecifikovať typ dokumentu pred nahraním, hoci manuálny výber typu je tiež možnosť, keď je preferovaná presnosť.
Môžu byť skené faktúry exportované do účtovného softvéru
Skener vytvára štruktúrované údaje vrátane názvu dodávateľa, čísla faktúry, dátumu, riadkových položiek s opismi a sumami, výpočtov daní a spolu dlhu. Tento štruktúrovaný výstup je možné exportovať v formátoch kompatibilných so štandardným účtovným softvérom. Pre používateľov receipts.yeb.to sa údaje faktúry integrujú priamo do systému sledovania výdajov s automatickým párovacím a kategorizáciou dodávateľov.
Aké informácie sú extrahované z vizitiek
Extrakcia vizitiek vytvára jednotlivé polia pre meno, pracovnú pozíciu, názov spoločnosti, telefónne čísla (mobilný, kancelária, fax), e-mailovú adresu, webovú stránku a fyzickú adresu. Každé pole je označené a oddelené, pripravené na importovanie do systému správy kontaktov bez manuálnej analýzy. Extrakcia spracovávava rozličné rozloženia kariet, orientácie a štýly návrhu.
Je skener užitočný na sledovanie lekárskych predpisov
Áno. Skenování lekárskych predpisov extrahuje názvy liekov, dávky, frekvencie, trvanie, názov predpisujúceho lekára a špeciálne pokyny. Toto vytvára štruktúrovanú históriu liečby, ktorá je cenná počas lekárskych konzultácií, na účely poistenia a na osobné sledovanie zdravia. Digitálny záznam všetkých predpísaných liekov s dátumami a dávkami poskytuje kontext, ktorý papierové lekárske predpisy v zásuvke nemôžu.
Môžu byť bankové výpisy so stovkami transakcií skenované presne
Skener spracováva bankové výpisy s veľkým počtom transakcií tým, že spracováva dokument systematicky, extrahuje každú transakciu ako samostatný záznam s dátumom, popisom a sumou. Úvodné a záverečné zostatky sa zachytávajú spolu s jednotlivými transakciami. Presnosť zostáva vysoká bez ohľadu na počet transakcií a štruktúrovaný výstup umožňuje prakticky pracovať s údajmi výpisu, ktoré by boli nepraktické na zadávanie ručne.