Számlák Receptek Névjegykártyák és Bankkivonat és Egy Szkenner Mindenehez

A modern szakember legalább tucatnyi dokumentumtípussal foglalkozik bármely adott héten. Egy szállítótól érkező számla bekerül a számviteli rendszerbe. A gyógyszertárban felvett recept valahová megbízhatóbban kerülne, mint a konyhai fiók. Egy konferencián cserélt névjegykártya elég információt ad ahhoz, hogy a telefonba kerüljenek az adatok, mielőtt a kártya a laptoptáskában elveszne. Egy bankkivonat érkezik, és az értékesítéseket egyeztetni kell. Egy üzleti ebéd nyugtája mellékletként csatolandó. Az éves vizsgálat laboratóriumi eredménye össze kell hasonlítani az elmúlt év számadataival. Mindegyik dokumentum más formátumban, más mezőkkel és más célokkal létezik, és mindaddig, amíg nem hosszú ideig, mindegyikhez saját munkafolyamat volt szükséges a digitalizáláshoz.

Az alkalmazás-tájkép ezt a fragmentációt tükrözi. Vannak dedikált nyugtaszkennerek, dedikált névjegykártya szkennerek, dedikált számlafeldolgozó eszközök, dedikált orvosi dokumentumolvasók. Mindegyik nagyjából jól teljesíti a specifikus feladatát, de saját adatbázist hoz létre, saját számlát kell fenntartani, saját felületet kell megtanulni, és saját előfizetést kell fizetni. Hat szespecializált szkenneralkalmazás fenntartásának kognitív terhe olyan jelentős, hogy a legtöbb ember az ellenállás legkisebb útjára vál: készít egy fotót a telefon kamerájával, bedobja egy mappába, és abban reménykedzik, hogy "dokumentumfotó mappában" elegendő szervezettség. Soha nem az, de a több speciális eszköz használatának alternatívája rosszabbnak tűnik.

A szkenner a scan.yeb.to webhelyén alapvetően más megközelítést alkalmaz. Egy végpont nyolc dokumentumtípust kezel. Töltse fel bármilyen támogatott dokumentum fényképét, és a mesterséges intelligencia azonosítja a dokumentum típusát, alkalmazza a megfelelő kinyerési logikát, és strukturált adatokat ad vissza, amelyek az adott dokumentum tartalma számára speciális formátumúak. A szám a szállító nevével, számlaszámmal, sorrelemekkel, adóösszegekkel és a teljes ársúlytal kerül vissza. Az üzletikártya név, beosztás, vállalat, telefonszám, e-mail és webhely alapján kerül vissza. A recept a gyógyszer nevei, adagolásuval, frekvenciájával és az írónnal visszakerül. A kinyerés minden dokumentumtípusra speciális, de a munkafolyamat univerzális: fényképez, feltölt, adatokat kap.

Mit Termel Minden Dokumentumtípus és Miért Számít a Speciális Kinyerés

Egy általános OCR szkenner minden dokumentumot azonos módon kezel: elolvassa az oldal szövegét, és visszaad egy szövegtörzset. Egy névjegykártya általános OCR-on keresztüli beszkennelése olyan szövegsor, amely valahogy így nézhet ki: "John Smith Marketing Director Acme Corp 555-0123 [email protected]" anélkül, hogy jelezné, melyik rész a név, melyik a beosztás, melyik a telefonszám, és melyik az e-mail. A felhasználónak kézzel kell elemezni ezt a kimenetet, és minden információt a kapcsolattartási menedzser megfelelő mezőjébe helyeznie. Ez csak kicsit jobb, mint kézzel gépelni a kártyát, de csak kicsit.

A speciális kinyerés teljesen megváltoztatja az egyenletet. A mesterséges intelligencia nemcsak elolvassa a szöveget a névjegykártyáról, hanem megérti, hogy a névjegykártya speciális típusú információkat tartalmaz, amelyek kiszámítható mintákban vannak rendezve. A nevek az oldal teteje közelében jelennek meg. A beosztások a nevek alatt jelennek meg. A telefonszámok felismerhető számjegymintákat követnek. Az e-mail címek a @ szimbólumot tartalmazzák. A webhelyek felismerhető előtagokkal kezdődnek. A névjegykártya karakterei helyett a szemantikájának megértésével a kinyerés megfelelően címkézett, megfelelően elválasztott mezőket hoz létre, amelyek közvetlenül a kapcsolattartási adatbázisba kerülhetnek kézi elemzés nélkül. Ugyanez az elv vonatkozik minden dokumentumtípusra, amely a szkennerhez használ, mindegyik a maga szemantikai modelljével és a maga kinyerési logikájával.

A számlák gyakorlatilag a legösszetettebb dokumentumtípus, mert elbeszélő elemeket (vállalat nevét, címét, fizetési feltételeket, megjegyzéseket) egyesítenek táblázatos elemekkel (a leírásokkal, mennyiségekkel, arányokkal és összegekkel rendelkező sorelemek) és számított elemekkel (részösszegek, adókulcsok, kedvezmények, végösszegek). A kinyerésnek az összes három elemét egyidejűleg kezelnie kell, az értékesítő adatait az élőfejből, az egyes díjakat az elem táblázatából és a pénzügyi összefoglalót a láblécből kell elemezni. Különböző cégek másképp formázzák számláikat, az egyszerű egyoszlopos elrendezésektől az összetett többszakaszes dokumentumokig, logókkal, kifejezésekkel és feltételekekkel, valamint több adókulcs-lebontásával. A mesterséges intelligencia ezt a variációt úgy kezeli, hogy megérti, mi is a számla, nem pedig azt, hogy egy konkrét számlasablon mi, amely azt jelenti, hogy bármely szállítóból érkező számlákal működik előre konfigurált sablonok nélkül.

A receptek teljesen más kihívást jelentenek. Az orvosi receptek speciális jelöléseket használnak, amelyek élet-befolyásolóan jelentőséggel bírnak. Az "500mg BID x 14d" azt jelenti, hogy napi kétszer 500 milligramm, tizennégy napig, és ennek a jelölésnek bármely részének félremagyarázása olyan következményekkel jár, amelyek sokkal komolyabbak, mint egy értékesítési tétel félreolvasása egy számlán. A szkenner receptkinyerése ezt az érzékenységet tartja szem előtt, nem csak a gyógyszer nevét és adagolásuval elemzi, hanem a frekvenciát, az időtartamot, az orvost és az esetleges speciális utasításokat is. A strukturált kimenet egyértelműen lehetővé teszi a személyes gyógymódtörténet fenntartását, amely nemcsak azt tartalmazza, mit írtak fel, hanem mikor, kivel és milyen adagoláson, amely pontosan az a típusú információ, amely értékes a későbbi orvosi konzultációk során, de szinte soha nem követi szisztematikusan a betegek.

Bankkivonatok és a Pénzügyi Dokumentum Feldolgozási Terv

A bankkivonatok a pénzügyi nyomkövetés és a dokumentumszkenelés metszéspontjában helyezkednek el, mivel pontosan olyan strukturált, ismétlődő adatokat tartalmaznak, amelyek kézzel legfárasztóbb a beírás, és a legértékesebb az digitalizálás után. Egy havi bankkivonat ötven, száz vagy több száz egyedi tranzakciót tartalmazhat, mindegyik dátummal, leírással és összeggel. Ezeknek a táblázatkezelőbe vagy számviteli rendszerbe való beírása az ellenállás gyakorlata, amelyet a legtöbb ember teljesen elkerül, amely azt jelenti, hogy a bankkivonatok részletes tranzakciószintű adatai kihasználatlanok maradnak a nagy többség számára, aki megkapja őket. Az utasítást egy pillantásra nézik meg, az egyenlegi egyenleg megjegyeztetik, és a papír egy olyan fájlba kerül, ahol soha nem lesz újra megnézve.

A bankkivonat szkenelése a scan.yeb.to webhelyén minden tranzakciót strukturált rekordként kinyerje. Minden rekord tartalmazza a dátumot, a leírást (amely általában az kereskedő nevét vagy a tranzakció típusát tartalmazza) és az összeget. A nyitási és záró egyenlegek rögzítésre kerülnek, valamint az összes összefoglaló szakasz, amely az hó tevékenységét kategóriák szerint lebontja. Ez a strukturált kimenet táplálható lehet a számviteli szoftverbe, összehasonlítható az receipts.yeb.to rekordjaival a nyugta egyeztetéséhez, vagy egyszerűen egy személyes költségvetési felülvizsgálathoz használható, amely nyomtatott kijelentésből nem lenne praktikus.

A nyugta-szkenelés és a bankkivonat-szkenelés kombinációja egy különösen erős pénzügyi munkafolyamatot hoz létre. A nyugták a részleteket adják: mit vásároltak, cikkenként, minden kereskedőnél. A bankkivonatok a teljességet adják: minden tranzakció, beleértve azokat, amelyek nem hoztak létre papír nyugtát. Együtt átfogó képet adnak a költségvetésről, amely egyik egyedül nem nyújt. A nyugta azt mutatja, hogy a 47 eurós bevásárlás specifikus cikkekből állt meghatározott árakon. A bankkivonat azt mutatja, hogy a 47 eurós díj kedden volt 3:14-kor, és ugyanazon a nap délután egy 12 eurós kávézóban is volt egy díj, amely nem hozott létre nyugtát, amelyet szkenelni érdemelt. A két információ szint egyaránt hasznos, és az egységes szkenner mindkettőt elérhetővé teszi ugyanazon a munkafolyamaton keresztül.

A Nyolc Típus Gyakorlatban és Választás a Szkeneléskor

A szkenner által támogatott nyolc dokumentumtípus: nyugták, számlák, receptek, névjegykártyák, bankkivonatok, laboratóriumi eredmények, identitásdokumentumok és általános dokumentumok. Mindegyiknek a maga kinyerési modellje van, de az összes közötti használati minta követi ugyanazt az elfogadás görbét. Az emberek azzal a dokumentumtípussal kezdenek szkenelni, amely az azonnali igényüket kezeli. Egy szabadúszónak általában számlák. Valaki, aki az egészségét kezeli, a laboratóriumi eredmények és receptek. Egy konferencia résztvevő, névjegykártyák. Amint a szkenelési szokás egy dokumentumtípus körül jól kialakul, természetesen más típusokra is kiterjed, mert a munkafolyamat azonos, és a másik típus hozzáadásának korlátja nulla.

A szkenelés időpontjáról szóló kérdés lényegében a kérdés, hogy mikor értékesebb a strukturált adat a fotónál. Az üzleti ebéd nyugtájáért, amely egy költségvetési kijelentésbe kerül, a válasz mindig: a szkenelés több időt takarít meg, mint amennyibe kerül. Egy általános produk-nyugtáért, amely nincs adózási vagy nyomkövetési következménye, a válasz attól függ, hogy a költségvetési nyomkövetés része-e a napi rutin. Egy bankkivonathoz a válasz attól függ, hogy a tranzakciós adat célja túlmegy-e az a banki online portál már nyújt. A szkenner nem ír elő munkafolyamatot; lehetővé teszi, amit a felhasználó szükségletei igényelnek, az umfassend scan-mindent dokumentáció a célzott szkenelésig csak azok a dokumentumok, amelyek azonnali célt szolgálnak.

Az általános dokumentumtípus a dokumentumok számára egy befogadó, amely nem illeszkedik tisztán a másik hét kategóriába. Szerződések, levelek, formák, értesítések, tanúsítványok, engedélyek és bármilyen egyéb papír dokumentum, amely szövegkövetelés digitalizálást végezhet az általános kinyerési terven. Az általános dokumentumok kimenete a teljes szöveges tartalom strukturális formázással megőrzve, amely archiválási, keresési és referenciacélokra hasznos, még akkor is, ha a speciális dokumentumtípusok által nyújtott speciális mező kinyerés nélkül. Ez azt jelenti, hogy a szkenner soha nem utasít vissza egy dokumentumot, mert nem felel meg az ismert típusnak. Minden szkenelhető, és mindegyik hasznos kimenetet termel, a speciális típusok különösen hasznos, a tartalomhoz igazított strukturált kimenetet termelnek.

Gyakran Feltett Kérdések

Hány dokumentumtípust támogat a szkenner

A szkenner a scan.yeb.to webhelyén nyolc dokumentumtípust támogat: nyugták, számlák, receptek, névjegykártyák, bankkivonatok, laboratóriumi eredmények, identitásdokumentumok és általános dokumentumok. Minden típusnak speciális kinyerési logikája van, amely strukturált adatokat termel, amelyek az adott dokumentumkategóriához formázottak. Az általános dokumentumtípus bármit kezel, amely nem illeszkedik a speciális kategóriákba.

A szkenner automatikusan azonosítja-e a dokumentum típusát

A mesterséges intelligencia elemzi a feltöltött képet, és azonosítja a dokumentum típusát annak tartalma és szerkezete alapján. Egy sor és összeggel rendelkező számla számlának ismerhető fel. Egy névjegykártya, amely kapcsolatfelvételi adatokat tartalmaz, névjegykártyaként ismerhető fel. Ez az automatikus felismerés azt jelenti, hogy a felhasználónak nem kell megadnia a dokumentum típusát feltöltés előtt, bár a típus kézi kiválasztása akkor is lehetséges, ha a pontosság előnyben van.

Az észkannázott számlák exportálhatók-e számviteli szoftverbe

A szkenner strukturált adatokat termel, beleértve a szállító nevét, számlaszámát, dátumát, leírásokkal és összeggel rendelkező sorelemet, adókalkulációkat és a teljes ársúlyot. Ez a strukturált kimenet olyan formátumokba exportálható, amelyek kompatibilisek a szabványos számviteli szoftverrel. Az receipts.yeb.to felhasználók számára a számlaadat közvetlenül az automatikus szállító egyeztetésével és kategorizálásával integrálódik a költségvetési nyomkövetési rendszerbe.

Mi az információ kinyerése az üzletikártyákból

Az üzletyikártya kinyerése egyedi mezőket termel a név, a beosztás, a vállalat neve, a telefonszámok (mobil, irodai, fax), az e-mail cím, a webhely és a fizikai cím számára. Minden mező címkézett és elválasztott, készen áll a kapcsolattartási menedzsment rendszerbe való importálásra kézi elemzés nélkül. A kinyerés különböző kártya-elrendezéseket, orientációkat és kialakítási stílusokat kezeli.

Hasznos-e a szkenner a receptek nyomkövetéséhez

Igen. A receptszkenelés kinyerje a gyógyszer neveit, adagolásuval, frekvenciájával, időtartamával, az írónnal nevét és az esetleges speciális utasításokat. Ez egy strukturált gyógymódtörténetet hoz létre, amely értékes az orvosi konzultációk során, biztosítási célokra és személyes egészség nyomkövetésére. Egy digitális nyomvonal az összes felírt gyógyszerről dátumokkal és adagolásakkal kontextust nyújt, amelyet a papír receptek a fiókban nem tudnak.

Az száz tranzakciót tartalmazó bankkivonatok pontosan szkenelhetők-e

A szkenner kezeli a nagy számú tranzakciót tartalmazó bankkivonatokat a dokumentum szisztematikus feldolgozásával, és minden tranzakciót külön rekordként kinyerje a dátummal, leírással és összeggel. A nyitási és záró egyenlegek rögzítésre kerülnek az egyes tranzakciókon kívül. A pontosság magas marad a tranzakciós szám függetlenül, és a strukturált kimenet praktikussá teszi az olyan utasítások adatainak dolgozásával, amely kézzel gépelni nem lenne praktikus.