Računi, Recepti, Vizitke i Izvodi iz Banke - Jedan Skener za Sve
Savremeni profesionalac obrađuje najmanje pola duzine različitih tipova dokumenata u bilo kojoj nedelji. Račun od dobavljača stigne i mora biti prijavljen u sistem računovodstva. Recept se preuzme iz apoteke i trebalo bi da bude zabeležen negde pouzdanije nego u fioku ispod sudopere. Vizitka se razmeni na konferenciji i detalji kontakta moraju biti uneti u telefon pre nego što se karticu izgubi u torbi laptopa. Izvod iz banke stiže i transakcije trebaju biti usklađene. Račun od poslovnog ručka trebada bude priložen izveštaju o troškovima. Rezultat analize iz godišnje provere trebalo bi da bude upoređen sa brojevima iz prošle godine. Svaki od ovih dokumenata postoji u drugačijem formatu sa drugačijim poljima i drugačitim svrhama, i do nedavno, svaki je zahtevao svoj tok rada za digitalizovanje.
Krajnji proizvod odražava ovu fragmentaciju. Postoji namenske aplikacije za skeniranje računa, namenske aplikacije za skeniranje vizitki, namenske alate za obradu računa, namenske čitače medicinskih dokumenata. Svaka radi svoju specifičnu funkciju razumno dobro ali kreira svoju podatkovnu silos, svoj nalog za održavanje, svoj interfejs za učenje, i svoju pretplatu za plaćanje. Kognitivna opterećenost održavanja šest specijalizovanih aplikacija za skeniranje za šest tipova dokumenata je značajna dovoljno da većina ljudi padne u put najmanje otpora: uzmite fotografiju telefonom, bacite je u folder, i nadajte se da je "fotografija dokumenata u foldeру" dovoljan sistem organizovanja. Nikada nije, ali alternativa korišćenja više specijalizovanih alata izgleda gore.
Skener na adresi scan.yeb.to pristupa temelje na drugačiji način. Jedan krajnje tačka obrađuje osam tipova dokumenata. Otpremite fotografiju bilo kog podržanog dokumenta, i AI prepoznaje koju vrstu dokumenta je, primenjuje odgovarajuću logiku ekstrakcije za taj tip, i vraća strukturirane podatke formirane posebno za sadržaj koji taj dokument sadrži. Račun dolazi sa nazivom dobavljača, brojem računa, stavkama reda, iznosi poreza, i ukupnim iznosom dugu. Vizitka dolazi sa imenom, funkcijom, компанијом, brojevима телефона, електронском пошултом, и веб месултом. Recept dolazi sa nazivima lekova, dozama, frekvencijama, i preskribujućim lekarom. Ekstrakcija je specijalizovana za svaki tip dokumenta, ali tok rada je univerzalan: fotografija, otpremanje, primanje podataka.
Šta Svaki Tip Dokumenta Proizvodi i Zašto Specijalizovana Ekstrakcija Važna
Generički OCR skener tretira svaki dokument na isti način: čita tekst na stranici i vraća blok teksta. Izlaz skeniranja vizitke kroz generički OCR je niz reči i brojeva koji mogu izgledati otprilike "John Smith Marketing Director Acme Corp 555-0123 [email protected]" bez naznake koji deo je ime, koji je funkcija, koji je broj telefona, i koji je e-pošta. Korisnik mora ručno da parsira taj izlaz i postavi svaki deo informacije na ispravno polje svog menadžera kontakata. Ovo je marginalno bolje nego kucanje kartice ručno, ali samo marginalno.
Specijalizovana ekstrakcija menja jednačinu potpuno. AI ne samo što čita tekst na vizitki; razume da vizitka sadrži specifične tipove informacija raspoređene u predvidivim šemama. Imena se pojavljuju blizu vrha. Funkcije se pojavljuju ispod imena. Brojevi telefona prate prepoznatljive obrasce cifara. E-adrese sadrže simbol @. Veб мјеста почињу са препознатљивим префиксима. Razumevanjem semantike vizitke umesto samo karaktera, ekstrakcija proizvodi pravilno označena, pravilno odvojena polja koja mogu direktno teći u bazu podataka kontakata bez ručnog parsiranja. Isti princip se primenjuje na svaki tip dokumenta koji skener obrađuje, svaki sa svojom semantičkom modelom i svojom logikom ekstrakcije.
Računi su verovatno najsloženiji tip dokumenta jer kombinuju narativne elemente (imena компанија, адресе, услови плаћања, напомене) са табеларним елементима (редови ставки са описима, количинама, стопама, и износима) и израчунатим елементима (међусуме, стопе пореза, попусти, укупни износи). Ekstrakcija mora da obradi sva tri simultano, parsira informacije dobavljača iz zaglavlja, pojedinačne naknade iz tabele stavki, i finantijski rezime iz noge. Različite компаније форматирају своје рачуне другачије, од минималиста једну колону распореда до еласборирајућих вишеделни докумената са логоима, условима и уговорима, и вишеструким разбиткима пореске стопе. AI obrađuje ovu varijaciju razumevanjem šta je račun umesto kako određeni šablon računa izgleda, što znači da radi sa računima od bilo kog dobavljača bez zahtevanja unapred konfigurisanih šablona.
Recepti predstavljaju potpuno drugačiji izazov. Medicinski recepti koriste specijalizovanu notaciju koja nosi značaj koji utiče na život. "500mg BID x 14d" znači 500 miligrama dva puta dnevno tokom četrnaest dana, i pogrešno čitanje bilo kog dela te notacije ima posledice daleko ozbiljnije nego pogrešno čitanje rednog stavke na računu. Ekstrakcija receptaa od skenera je dizajnirana sa tom osetljivošću na umu, parsira ne samo naziv leka i dozu ali i frekvenciju, trajanje, imena preskribujućeg lekara, i sve posebne instrukcije. Strukturovani izlaz čini direktnim da se održava licna medicinska istorija koja uključuje ne samo šta je prepisano ali kada, od koga, i na kojoj dozi, što je tačno vrsta informacije koja je dragocena tokom budućih medicinskih konzultacija ali skoro nikada nije sistematski praćena od strane pacijenata.
Izvodi iz Banke i Pipeline Finansijskog Dokumenta
Izvodi iz banke sede na preseku finansijskog praćenja i skeniranja dokumenata jer sadrže tačno vrstu strukturiranih, ponavljajućih podataka koji su najtežeci da se ručno unesu i najosnažniji kada su digitalizovani. Izvod mesečne banke može da sadrži pedeset, sto, ili nekoliko stotina pojedinačnih transakcija, svaku sa datumom, opisom, i iznosom. Kucanje u tabelu ili sistem računovodstva je vežba izdržljivosti koju većina ljudi u potpunosti izbjava, što znači da detaljnih podataka na nivou transakcije u izvodima iz banke ostaje nekorišćen od velike većine ljudi koji ih primaju. Izvod se brzo posmatra, ukupan saldo je zabeležen, i papir ide u folder gde nikada neće biti pogledano ponovo.
Skeniranje izvoda iz banke kroz scan.yeb.to ekstrahuje svaku transakciju kao strukturovan zapis. Svaki zapis sadrži datum, opis (koji obično uključuje naziv trgovca ili vrstu transakcije), i iznos. Otvarajući i zatvarajući saldosi su hvaćeni, kao i bilo koji rezimovani odeljci koji razlažu aktivnost meseca po kategoriji. Ovaj strukturovani izlaz može biti hranjen u softver računovodstva, porađen sa zapis u receipts.yeb.to za podudaranje računa, ili jednostavno korišćen kao osnova za ličnu pregled rashoda koji bi bio nepraktičan da se sprovede od štampanog izvoda.
Kombinacija skeniranja računa i skeniranja izvoda iz banke stvara posebno moćan finansijski tok rada. Računi pružaju detalje: šta je kupljeno, stavka za stavkom, kod svakog trgovca. Izvodi iz banke pružaju cjelovitost: svaka transakcija, uključujući one koje nisu proizvedle papirni račun. Zajedno, daju sveobuhvatan pregled rashoda koji nijedan od njih sam ne pruža. Račun pokazuje da je naplaćivanje od 47 evra u prodavnici namirnica bilo sastavljeno od specifičnih stavki po specifičnim cenama. Izvod iz banke pokazuje da se naplaćivanje od 47 evra desilo u utorak u 3:14 pm i da je bilo i naplaćivanja od 12 evra u kafeu isti dan u podne koji nije proizveće račun vrednog skeniranja. Oba sloja informacije su korisna, i objedinjeni skener čini oba dostupnom kroz isti tok rada.
Osam Tipova u Praksi i Izbor Kada Skenirati
Osam tipova dokumenata koje skener podržava su računi, računi, recepti, vizitke, izvodi iz banke, rezultati laboratorije, dokumenta identifikacije, i opšti dokumenti. Svaki ima svoju ekstrakcijsku model, ali obrazac korišćenja preko svih njih sledi iste krivu adopcije. Ljudi počinju skeniranjem tipa dokumenta koji se obrađuje njihove najneposrednije potrebe. Za slobodnjaka, to je obično računi. Za nekoga ko upravlja svojom zdravljem, to su rezultati laboratorije i recepti. Za redovnog učesnika konferencije, to su vizitke. Čim se navika skeniranja formira oko jednog tipa dokumenta, prirodno se proširuje na druge jer je tok rada identičan i barijera za dodavanje drugog tipa je nula.
Pitanje kada treba skenirati je u suštini pitanje kada su strukturirani podaci vredniji od fotografije. Za račun od poslovnog ručka koji trebada ide na izveštaj o troškovima, odgovor je uvek: skeniranje štedi više vremena nego što ga koštava. Za slučajan račun iz prodavnice sa nema poreska ili pracenje implikacije, odgovor zavisi od toga da li je praćenje troškova deo dnevne rutine. Za izvod iz banke, odgovor zavisi od toga da li se podaci transakcije koriste u svrhu izvan ono što portal banke već pruža. Skener ne preskribuje tok rada; omogućava bilo koji tok rada koji korisnik trebada, od sveobuhvatnog skeniranja-sve dokumentacije do ciljanog skeniranja samo dokumenata koji služe neposrednoj svrsi.
Opšti tip dokumenta služi kao hvatač-sve za dokumente koji se ne uklapaju čistoće u druge sedam kategorije. Ugovori, pisma, obrasce, napomene, sertifikate, dozvole, i bilo koji drugi papirni dokument koji sadrži tekst vredan digitalizovanja može biti obrađen kroz opštu ekstrakcijsku navodnik. Izlaz za opšte dokumente je sve tekstualnih sadržaj sa strukturnom formatiranjem sačuvanom, što čini je korisna za arhiviranje, pretragu, i referentne svrhe čak bez specijalizovane ekstrakcije polja koje namenjeni tipovi dokumenata pružaju. To znači da skener nikada ne odbija dokument jer ne odgovara poznatoj vrsti. Sve je skenabilno, i sve proizvodи korisnom izlazu, sa specijalizovanim tipovima koji proizvode posebno korisnom strukturirane izlazе prilagođene njihovom sadržaju.
Često Postavljena Pitanja
Koliko tipova dokumenata skener podržava
Skener na adresi scan.yeb.to podržava osam tipova dokumenata: računi, računi, recepti, vizitke, izvodi iz banke, rezultati laboratorije, dokumenta identifikacije, i opšti dokumenti. Svaki tip ima specijalizovanu logiku ekstrakcije koja proizvodi strukturirane podatke formirane za tu kategoriju dokumenata. Opšti tip dokumenta obrađuje bilo šta što ne odgovara specijalizovanim kategorijama.
Da li skener automatski prepozna tip dokumenta
AI analizira otpremljenu sliku i prepoznaje tip dokumenta na osnovu njegovog sadržaja i strukture. Račun sa redovima stavki i ukupnim iznosima je prepoznat kao račun. Vizitka sa detaljima kontakta je prepoznata kao vizitka. Ova automatska detekcija znači da korisnik ne trebada da određuje tip dokumenta pre otpremanja, iako je izbor tipa ručno također mogućnost kada je preciznost preferovana.
Mogu li skenirani računi biti izvezeni u softver računovodstva
Skener proizvodi strukturirane podatke uključujući naziv dobavljača, broj računa, datum, redove stavki sa opisima i износима, калкулације пореза, и укупан износ дугован. Ovaj strukturovani izlaz može biti izvezen u formate kompatibilne sa standardnim softverom računovodstva. Za korisnike receipts.yeb.to, podaci računa se integriše direktno u sistem praćenja rashoda sa automatskim podudaranjem dobavljača i kategorizacijom.
Koja informacija se ekstrahuje iz vizitki
Ekstrakcija vizitke proizvodi pojedinačna polja za ime, funkciju, naziv kompаnije, brojeve telefona (mobilni, kancelarijski, faks), e-adresu, veб мјесто, и физичку адресу. Svako polje je označeno i odvojeno, spremno da bude uvozeno u sistem upravljanja kontaktima bez ručnog parsiranja. Ekstrakcija obrađuje različite rasporeде карбија, оријентације, и стилове дизајна.
Da li je skener koristan za praćenje recepte
Da. Ekstrakcija recepta ekstrahuje nazive lekova, doze, frekvencije, trajanja, imena preskribujućeg lekara, i posebne instrukcije. Ovo stvara strukturovanu medicinsku istoriju koja je dragocena tokom medicinskih konzultacija, za osiguranja svrhe, i za ličko zdravstveno praćenje. Imajući digitalni zapis svih prepisanih lekova sa datumima i dozama pruža kontekst koji recepti papira u fioku ne može.
Mogu li izvodi iz banke sa stotinama transakcija biti skenirani tačno
Skener obrađuje izvode iz banke sa velikim brojem transakcija obradom dokumenta sistematski, ekstrahujući svaku transakciju kao odvojen zapis sa datumom, opisom, i iznosom. Otvarajući i zatvarajući saldosi su uhvaćeni zajedno sa pojedinačnim transakcijama. Tačnost ostaje visoka bez obzira na broj transakcije, i strukturovani izlaz čini praktičnim da se radi sa podacima izvoda koji bi bili nepraktični da se unese ručno.