Τιμολόγια Συνταγές Επαγγελματικές Κάρτες και Τραπεζικές Δηλώσεις και Ένας Σαρωτής για Όλα
Ο σύγχρονος επαγγελματίας χειρίζεται τουλάχιστον μισή δωδεκάδα τύπων εγγράφων σε οποιαδήποτε εβδομάδα. Ένα τιμολόγιο φτάνει από έναν προμηθευτή και πρέπει να καταχωρηθεί στο σύστημα λογιστικής. Μια συνταγή παίρνεται από τη φαρμακευτική και πρέπει να καταγραφεί κάπου πιο αξιόπιστα από ένα συρόμενο κουτί κουζίνας. Μια επαγγελματική κάρτα ανταλλάσσεται σε μια διάσκεψη και τα στοιχεία επικοινωνίας πρέπει να καταχωρηθούν στο τηλέφωνο πριν η κάρτα χαθεί σε μια τσάντα φορητού υπολογιστή. Μια τραπεζική δήλωση φτάνει και οι συναλλαγές πρέπει να συμφωνηθούν. Μια απόδειξη από ένα επαγγελματικό γεύμα πρέπει να επισυναφθεί σε μια αναφορά δαπανών. Ένα αποτέλεσμα εργαστηρίου από έναν ετήσιο έλεγχο θα πρέπει να συγκριθεί με τα στοιχεία του περασμένου έτους. Καθένα από αυτά τα έγγραφα υπάρχει σε διαφορετική μορφή με διαφορετικά πεδία και διαφορετικούς σκοπούς, και έως πρόσφατα, καθένα απαιτούσε τη δική του ροή εργασίας για ψηφιοποίηση.
Το τοπίο εφαρμογών αντικατοπτρίζει αυτή τη διάσπαση. Υπάρχουν αποκλειστικοί σαρωτές αποδείξεων, αποκλειστικοί σαρωτές επαγγελματικών καρτών, αποκλειστικά εργαλεία επεξεργασίας τιμολογίων, αποκλειστικές συσκευές ανάγνωσης ιατρικών εγγράφων. Καθένα κάνει το δικό του συγκεκριμένο έργο αρκετά καλά, αλλά δημιουργεί το δικό του σιλό δεδομένων, το δικό του λογαριασμό για διαχείριση, το δικό του περιβάλλον για να μάθει και το δικό του περιεχόμενο για να πληρώσει. Η γνωστική επιβάρυνση της διαχείρισης έξι ειδικευμένων εφαρμογών σάρωσης για έξι τύπους εγγράφων είναι σημαντική αρκετή ώστε οι περισσότεροι άνθρωποι να καταλήγουν στη διαδρομή της ελάχιστης αντίστασης: πάρτε μια φωτογραφία με τη φωτογραφική μηχανή του τηλεφώνου, ρίξτε την σε έναν φάκελο και ελπίστε ότι η "φωτογραφία του εγγράφου σε έναν φάκελο" είναι ένα αρκετά καλό σύστημα οργάνωσης. Δεν είναι ποτέ, αλλά η εναλλακτική χρήση πολλών ειδικευμένων εργαλείων φαίνεται χειρότερη.
Ο σαρωτής στο scan.yeb.to ακολουθεί μια θεμελιακά διαφορετική προσέγγιση. Ένα τελικό σημείο χειρίζεται οκτώ τύπους εγγράφων. Ανεβάστε μια φωτογραφία οποιουδήποτε υποστηριζόμενου εγγράφου και η AI προσδιορίζει τι είδους έγγραφο είναι, εφαρμόζει την κατάλληλη λογική εξαγωγής για αυτόν τον τύπο και επιστρέφει δομημένα δεδομένα μορφοποιημένα ειδικά για το περιεχόμενο που περιέχει αυτό το έγγραφο. Ένα τιμολόγιο έρχεται πίσω με όνομα προμηθευτή, αριθμό τιμολογίου, στοιχεία γραμμής, ποσά φόρου και συνολικό χρέος. Μια επαγγελματική κάρτα έρχεται πίσω με όνομα, τίτλο, εταιρεία, αριθμούς τηλεφώνου, email και ιστότοπο. Μια συνταγή έρχεται πίσω με ονόματα φαρμάκων, δοσολογίες, συχνότητες και ιστορικό γιατρού. Η εξαγωγή είναι ειδική για κάθε τύπο εγγράφου, αλλά η ροή εργασίας είναι καθολική: φωτογραφήστε, ανεβάστε, λάβετε δεδομένα.
Τι Παράγει Κάθε Τύπος Εγγράφου και Γιατί Η Εξειδικευμένη Εξαγωγή Σημαντική
Ένας γενικός σαρωτής OCR αντιμετωπίζει κάθε έγγραφο με τον ίδιο τρόπο: διαβάζει το κείμενο στη σελίδα και επιστρέφει ένα μπλοκ κειμένου. Το αποτέλεσμα της σάρωσης μιας επαγγελματικής κάρτας μέσω γενικού OCR είναι μια σειρά λέξεων και αριθμών που μπορεί να μοιάζει κάπως "John Smith Marketing Director Acme Corp 555-0123 [email protected]" χωρίς καμία ένδειξη ποια μέρη είναι το όνομα, ποια είναι ο τίτλος, ποια είναι ο αριθμός τηλεφώνου και ποια είναι η διεύθυνση ηλεκτρονικού ταχυδρομείου. Ο χρήστης πρέπει να αναλύσει αυτό το αποτέλεσμα χειροκίνητα και να τοποθετήσει κάθε πληροφορία στο σωστό πεδίο του διαχειριστή επαφών τους. Αυτό είναι οριακά καλύτερο από την εισαγωγή της κάρτας χειροκίνητα, αλλά μόνο οριακά.
Η εξειδικευμένη εξαγωγή αλλάζει εντελώς την εξίσωση. Η AI δεν απλώς διαβάζει το κείμενο σε μια επαγγελματική κάρτα. κατανοεί ότι μια επαγγελματική κάρτα περιέχει συγκεκριμένους τύπους πληροφοριών διατεταγμένους σε προβλέψιμα μοτίβα. Τα ονόματα εμφανίζονται κοντά στην κορυφή. Οι τίτλοι εμφανίζονται κάτω από τα ονόματα. Οι αριθμοί τηλεφώνου ακολουθούν αναγνωρίσιμα μοτίβα ψηφίων. Οι διευθύνσεις ηλεκτρονικού ταχυδρομείου περιέχουν το σύμβολο @. Οι ιστότοποι ξεκινούν με αναγνωρίσιμα προθέματα. Με την κατανόηση της σημασιολογίας μιας επαγγελματικής κάρτας αντί απλώς των χαρακτήρων, η εξαγωγή παράγει σωστά επισημασμένα, σωστά χωρισμένα πεδία που μπορούν να ρέουν απευθείας σε μια βάση δεδομένων επαφών χωρίς καμία χειροκίνητη ανάλυση. Η ίδια αρχή ισχύει για κάθε τύπο εγγράφου που χειρίζεται ο σαρωτής, καθένας με το δικό του σημασιολογικό μοντέλο και τη δική του λογική εξαγωγής.
Τα τιμολόγια είναι ενδεχομένως ο πιο πολύπλοκος τύπος εγγράφου, επειδή συνδυάζουν αφηγηματικά στοιχεία (ονόματα εταιρειών, διευθύνσεις, όροι πληρωμής, σημειώσεις) με πίνακα στοιχείων (γραμμές με περιγραφές, ποσότητες, τιμές και ποσά) και υπολογιστικά στοιχεία (ενδιάμεσα σύνολα, συντελεστές φόρου, εκπτώσεις, σύνολα). Η εξαγωγή πρέπει να χειρίζεται και τα τρία ταυτόχρονα, αναλύοντας τις πληροφορίες του προμηθευτή από την κεφαλίδα, τις επιμέρους χρεώσεις από τον πίνακα στοιχείων και την οικονομική περίληψη από το υποσέλιδο. Διαφορετικές εταιρείες μορφοποιούν τα τιμολόγια τους διαφορετικά, από ελάχιστες μονοστήλες διατάξεις έως εκλαμβάνονται πολυτμηματικά έγγραφα με λογότυπα, όρους και προϋποθέσεις και πολλαπλές αναλύσεις φορολογικών συντελεστών. Η AI χειρίζεται αυτή τη διακύμανση με την κατανόηση του τι είναι ένα τιμολόγιο αντί για το τι μοιάζει ένα συγκεκριμένο πρότυπο τιμολογίου, πράγμα που σημαίνει ότι λειτουργεί με τιμολόγια από οποιονδήποτε προμηθευτή χωρίς να απαιτούνται προ-διαμορφωμένα πρότυπα.
Οι συνταγές παρουσιάζουν μια εντελώς διαφορετική πρόκληση. Οι ιατρικές συνταγές χρησιμοποιούν εξειδικευμένη σημειογραφία που φέρει σημασία που επηρεάζει τη ζωή. "500mg BID x 14d" σημαίνει 500 χιλιοστόγραμμα δύο φορές την ημέρα για δεκατέσσερις ημέρες και η εσφαλμένη ανάγνωση οποιουδήποτε μέρους αυτής της σημειογραφίας έχει συνέπειες πολύ πιο σοβαρές από τη λάθος ανάγνωση ενός στοιχείου γραμμής σε ένα τιμολόγιο. Η εξαγωγή συνταγής του σαρωτή έχει σχεδιαστεί με αυτή την ευαισθησία, αναλύοντας όχι μόνο το όνομα του φαρμάκου και τη δοσολογία αλλά και τη συχνότητα, τη διάρκεια, το όνομα του ιατρού που κάνει την ταγγελία και τυχόν ειδικές οδηγίες. Η δομημένη έξοδος κάνει απλό να διατηρήσετε ένα προσωπικό ιστορικό φαρμάκων που περιλαμβάνει όχι μόνο τι συνταγογραφήθηκε αλλά πότε, από ποιον και σε ποια δοσολογία, η οποία είναι ακριβώς το είδος των πληροφοριών που είναι πολύτιμο κατά τη διάρκεια μελλοντικών ιατρικών συμβουλών αλλά σχεδόν ποτέ δεν παρακολουθείται συστηματικά από τους ασθενείς.
Τραπεζικές Δηλώσεις και το Χρηματοοικονομικό Παθός Εγγράφων
Οι τραπεζικές δηλώσεις κάθονται στην τομή της χρηματοοικονομικής παρακολούθησης και της σάρωσης εγγράφων, διότι περιέχουν ακριβώς το είδος των δομημένων, επαναλαμβανόμενων δεδομένων που είναι πιο κουραστικό να εισάγετε χειροκίνητα και πιο πολύτιμο μόλις ψηφιοποιηθεί. Μια μηνιαία τραπεζική δήλωση μπορεί να περιέχει πενήντα, εκατό ή πολλές εκατοντάδες μεμονωμένες συναλλαγές, καθεμία με ημερομηνία, περιγραφή και ποσό. Η εισαγωγή αυτών σε ένα υπολογιστικό φύλλο ή σύστημα λογιστικής είναι μια άσκηση αντοχής που περισσότεροι άνθρωποι αποφεύγουν εντελώς, πράγμα που σημαίνει ότι τα δεδομένα σε επίπεδο συναλλαγής σε τραπεζικές δηλώσεις παραμένουν αχρησιμοποίητα από τη συντριπτική πλειοψηφία των ανθρώπων που τις λαμβάνουν. Η δήλωση κοιτάζεται, το συνολικό υπόλοιπο σημειώνεται και το χαρτί πηγαίνει σε ένα αρχείο όπου δεν θα κοιταχτεί ποτέ ξανά.
Η σάρωση μιας τραπεζικής δήλωσης μέσω scan.yeb.to εξάγει κάθε συναλλαγή ως δομημένη εγγραφή. Κάθε εγγραφή περιέχει την ημερομηνία, την περιγραφή (η οποία τυπικά περιλαμβάνει το όνομα του εμπόρου ή τον τύπο συναλλαγής) και το ποσό. Τα αρχικά και τελικά υπόλοιπα συλλέγονται, όπως και τυχόν περιληπτικά τμήματα που καταλύουν τη δραστηριότητα του μήνα κατά κατηγορία. Αυτή η δομημένη έξοδος μπορεί να τροφοδοθεί σε λογιστικό λογισμικό, να συγκριθεί με εγγραφές στο receipts.yeb.to για αντιστοίχιση αποδείξεων ή απλώς να χρησιμοποιηθεί ως βάση για ένα προσωπικό έκθεμα δαπανών που θα ήταν ανέφικτο να διεξάγει από την έντυπη δήλωση μόνο του.
Ο συνδυασμός σάρωσης αποδείξεων και σάρωσης τραπεζικών δηλώσεων δημιουργεί ένα ιδιαίτερα ισχυρό χρηματοοικονομικό ροή εργασίας. Οι αποδείξεις παρέχουν τη λεπτομέρεια: τι αγοράστηκε, στοιχείο κατά στοιχείο, σε κάθε έμπορο. Οι τραπεζικές δηλώσεις παρέχουν την πληρότητα: κάθε συναλλαγή, συμπεριλαμβανομένων εκείνων που δεν παρήγαγαν έντυπη απόδειξη. Μαζί, δίνουν μια περιεκτική άποψη των δαπανών που ούτε το ένα ούτε το άλλο παρέχει μόνο του. Η απόδειξη δείχνει ότι η χρέωση 47 ευρώ στο παντοπωλείο αποτελούνταν από συγκεκριμένα είδη σε συγκεκριμένες τιμές. Η τραπεζική δήλωση δείχνει ότι η χρέωση 47 ευρώ συνέβη την Τρίτη στις 3:14 π.μ. και ότι ήταν επίσης μια χρέωση 12 ευρώ σε ένα cafe το ίδιο απόγευμα που δεν παρήγαγε απόδειξη που αξίζει σάρωσης. Και τα δύο στρώματα πληροφοριών είναι χρήσιμα και ο ενοποιημένος σαρωτής κάνει και τα δύο διαθέσιμα μέσω της ίδιας ροής εργασίας.
Οι Οκτώ Τύποι στην Πράξη και Επιλογή Πότε να Σαρώσετε
Οι οκτώ τύποι εγγράφων που υποστηρίζει ο σαρωτής είναι αποδείξεις, τιμολόγια, συνταγές, επαγγελματικές κάρτες, τραπεζικές δηλώσεις, αποτελέσματα εργαστηρίου, έγγραφα ταυτότητας και γενικά έγγραφα. Καθένα έχει το δικό του μοντέλο εξαγωγής, αλλά το μοτίβο χρήσης σε όλα αυτά ακολουθεί την ίδια καμπύλη υιοθέτησης. Οι άνθρωποι αρχίζουν να σαρώνουν τον τύπο εγγράφου που αντιμετωπίζει την πιο άμεση ανάγκη τους. Για ένα freelancer, αυτό είναι συνήθως τιμολόγια. Για κάποιον που διαχειρίζεται την υγεία του, είναι αποτελέσματα εργαστηρίου και συνταγές. Για έναν συμμετέχοντα σε συνέδριο, είναι επαγγελματικές κάρτες. Μόλις η συνήθεια σάρωσης σχηματιστεί γύρω από ένα τύπο εγγράφου, επεκτείνεται φυσικά σε άλλα, διότι η ροή εργασίας είναι ίδια και το εμπόδιο για την προσθήκη ενός άλλου τύπου είναι μηδέν.
Το ερώτημα του πότε να σαρώσετε είναι ουσιαστικά το ερώτημα του πότε τα δομημένα δεδομένα είναι πιο πολύτιμα από μια φωτογραφία. Για μια απόδειξη από ένα επαγγελματικό γεύμα που πρέπει να πάει σε ένα έκθεμα δαπανών, η απάντηση είναι πάντα: η σάρωση εξοικονομεί περισσότερο χρόνο από το κόστος του. Για μια τυχαία απόδειξη παντοπωλείου χωρίς φόρο ή συνέπειες παρακολούθησης, η απάντηση εξαρτάται από το εάν η παρακολούθηση δαπανών είναι μέρος της καθημερινής ρουτίνας. Για μια τραπεζική δήλωση, η απάντηση εξαρτάται από το εάν τα δεδομένα συναλλαγής εξυπηρετούν ένα σκοπό πέρα από ό, τι παρέχει ήδη το διαδικτυακό πορτάλ της τράπεζας. Ο σαρωτής δεν υπαγορεύει μια ροή εργασίας. δημιουργεί όποια ροή εργασίας χρειάζεται ο χρήστης, από περιεκτική σάρωση-τα-πάντα τεκμηρίωση σε στοχευμένη σάρωση μόνο των εγγράφων που εξυπηρετούν ένα άμεσο σκοπό.
Ο γενικός τύπος εγγράφου χρησιμεύει ως ένα σχήμα αναζήτησης για έγγραφα που δεν ταιριάζουν καλά με τους άλλους επτά κατηγορίες. Συμβάσεις, γράμματα, φόρμες, ειδοποιήσεις, πιστοποιητικά, άδειες και οποιοδήποτε άλλο έγγραφο χαρτιού που περιέχει κείμενο που αξίζει ψηφιοποίησης μπορεί να επεξεργαστεί μέσω του γενικού αγωγού εξαγωγής. Η έξοδος για γενικά έγγραφα είναι το πλήρες περιεχόμενο κειμένου με την δομική μορφοποίηση διατηρημένη, η οποία το καθιστά χρήσιμο για σκοπούς αρχειοθέτησης, αναζήτησης και αναφοράς ακόμη και χωρίς την εξειδικευμένη εξαγωγή πεδίου που παρέχουν οι αφιερωμένοι τύποι εγγράφων. Αυτό σημαίνει ότι ο σαρωτής δεν αρνείται ποτέ ένα έγγραφο, διότι δεν ταιριάζει σε γνωστό τύπο. Όλα είναι σαρώσιμα και όλα παράγουν χρήσιμη έξοδο, με τους εξειδικευμένους τύπους που παράγουν ιδιαίτερα χρήσιμη δομημένη έξοδο προσαρμοσμένη στο περιεχόμενό τους.
Συχνές Ερωτήσεις
Πόσους τύπους εγγράφων υποστηρίζει ο σαρωτής
Ο σαρωτής στο scan.yeb.to υποστηρίζει οκτώ τύπους εγγράφων: αποδείξεις, τιμολόγια, συνταγές, επαγγελματικές κάρτες, τραπεζικές δηλώσεις, αποτελέσματα εργαστηρίου, έγγραφα ταυτότητας και γενικά έγγραφα. Καθένα έχει εξειδικευμένη λογική εξαγωγής που παράγει δομημένα δεδομένα μορφοποιημένα για εκείνη την κατηγορία εγγράφων. Ένας γενικός τύπος εγγράφου χειρίζεται οτιδήποτε δεν ταιριάζει στις εξειδικευμένες κατηγορίες.
Ο σαρωτής ανιχνεύει αυτόματα τον τύπο εγγράφου
Η AI αναλύει την ανεβασμένη εικόνα και προσδιορίζει τον τύπο εγγράφου με βάση το περιεχόμενο και τη δομή του. Ένα τιμολόγιο με στοιχεία γραμμής και σύνολα αναγνωρίζεται ως τιμολόγιο. Μια επαγγελματική κάρτα με στοιχεία επικοινωνίας αναγνωρίζεται ως επαγγελματική κάρτα. Αυτή η αυτόματη ανίχνευση σημαίνει ότι ο χρήστης δεν χρειάζεται να καθορίσει τον τύπο εγγράφου πριν από την ανέβασμα, αν και η επιλογή του τύπου χειροκίνητα είναι επίσης μια επιλογή όταν η ακρίβεια προτιμάται.
Μπορούν τα σαρωμένα τιμολόγια να εξαχθούν σε λογιστικό λογισμικό
Ο σαρωτής παράγει δομημένα δεδομένα συμπεριλαμβανομένου του ονόματος προμηθευτή, αριθμού τιμολογίου, ημερομηνίας, γραμμών με περιγραφές και ποσά, υπολογισμούς φόρου και συνολικό χρέος. Αυτή η δομημένη έξοδος μπορεί να εξαχθεί σε μορφές συμβατές με τυποποιημένο λογιστικό λογισμικό. Για χρήστες του receipts.yeb.to, τα δεδομένα τιμολογίου ενσωματώνονται απευθείας στο σύστημα παρακολούθησης δαπανών με αυτόματη αντιστοίχιση προμηθευτή και κατηγοριοποίηση.
Ποια πληροφορία εξάγεται από τις επαγγελματικές κάρτες
Η εξαγωγή επαγγελματικής κάρτας παράγει μεμονωμένα πεδία για όνομα, τίτλο θέσης, όνομα εταιρείας, αριθμούς τηλεφώνου (κινητό, γραφείο, fax), διεύθυνση ηλεκτρονικού ταχυδρομείου, ιστότοπο και φυσική διεύθυνση. Κάθε πεδίο είναι επισημασμένο και χωρισμένο, έτοιμο να εισαχθεί σε ένα σύστημα διαχείρισης επαφών χωρίς χειροκίνητη ανάλυση. Η εξαγωγή χειρίζεται διάφορες διατάξεις καρτών, προσανατολισμούς και στυλ σχεδίασης.
Είναι χρήσιμος ο σαρωτής για παρακολούθηση συνταγών
Ναι. Η σάρωση συνταγής εξάγει ονόματα φαρμάκων, δοσολογίες, συχνότητες, διάρκειες, όνομα γιατρού που κάνει την ταγγελία και ειδικές οδηγίες. Αυτό δημιουργεί ένα δομημένο ιστορικό φαρμάκων που είναι πολύτιμο κατά τη διάρκεια ιατρικών συμβουλών, για σκοπούς ασφάλισης και για προσωπική παρακολούθηση υγείας. Η χρήση ψηφιακής εγγραφής όλων των συνταγογραφημένων φαρμάκων με ημερομηνίες και δοσολογίες παρέχει περιεχόμενο που οι έντυπες συνταγές σε ένα συρόμενο κουτί δεν μπορούν να.
Μπορούν οι τραπεζικές δηλώσεις με εκατοντάδες συναλλαγές να σαρωθούν με ακρίβεια
Ο σαρωτής χειρίζεται τραπεζικές δηλώσεις με μεγάλο αριθμό συναλλαγών χρησιμοποιώντας συστηματικά την επεξεργασία του εγγράφου, εξάγοντας κάθε συναλλαγή ως χωριστή εγγραφή με ημερομηνία, περιγραφή και ποσό. Τα αρχικά και τελικά υπόλοιπα συλλέγονται μαζί με τυχόν περιληπτικά τμήματα. Η ακρίβεια παραμένει υψηλή ανεξάρτητα από τον αριθμό συναλλαγών και η δομημένη έξοδος κάνει πρακτικό να εργαστείτε με δεδομένα δήλωσης που θα ήταν ανέφικτο να πληκτρολογήσετε χειροκίνητα.