חשבוניות, מרשמים, כרטיסי ביקור, דפי חשבון בנק - סורק אחד לכל דבר
הלוא עובדו המודרני התומך לפחות חצי תריסר סוגי מסמכים בכל שבוע נתון. חשבונית מגיעה מספק והיא צריכה להיות מתועדת במערכת החשבונאות. מרשם נלקח מבית המרקחת וכנראה צריך להיות מתועד במקום יותר אמין מתיקיית מטבח. כרטיס ביקור מחליף בכנס ופרטי ההתקשרות צריכים להגיע לטלפון לפני שהכרטיס יאבד בתיק של מחשב נייד. דף חשבון בנק מגיע והעסקאות צריכות להיות מתאומות. קבלה מארוחת ביזנס צריכה להיות מצורפת לדוח הוצאות. תוצאת מעבדה מבדיקת בריאות שנתית צריכה להיות מושווה למספרים של השנה שעברה. כל אחד מהמסמכים האלה קיים בפורמט אחר עם שדות שונים ומטרות שונות, והעד לאחרונה, כל אחד דרש את זרימת העבודה שלו כדי לדיגיטליזציה.
נוף האפליקציה משקף את הפיצול הזה. יש סורקי קבלה ייעודיים, סורקי כרטיסי ביקור ייעודיים, כלי עיבוד חשבוניות ייעודיות, קוראות מסמכים רפואיות ייעודיות. כל אחד עושה את העבודה הספציפית שלו סביר מאוד אך יוצר את הסילו הנתונים שלו, את חשבונו שלו כדי לשמור, את הממשק שלו כדי ללמוד, ואת המנוי שלו כדי לשלם. העומס הקוגניטיבי של שימור שש אפליקציות סריקה מיוחדות לשישה סוגי מסמכים משמעותי מספיק שרוב האנשים מתגברים על נתיב הפחות התנגדות: לקחת תמונה עם מצלמת הטלפון, למלא אותה בתיקיה, ותקוו שהתמונה של המסמך בתיקיה "היא מערכת ארגון מספקת. זה אף פעם לא, אבל החלופה לשימוש בכלים מיוחדים רבים נראית גרועה יותר.
הסורק בscan.yeb.to לוקח גישה שונה מהותית. נקודת קצה אחת מטפלת בשמונה סוגי מסמכים. העלה תמונה של כל מסמך נתמך, והבינה המלאכותית מזהה איזה סוג של מסמך זה, מיישמת את ההגיון של תמצות הנכון לסוג זה, והחזירה נתונים מובנים מעוצבים במיוחד לתוכן הזה המסמך מכיל. חשבונית חוזרת עם שם ספק, מספר חשבונית, פריטי שורה, סכומי מס, וסה"כ חייב. כרטיס ביקור חוזר עם שם, כותרת, חברה, מספרי טלפון, דוא"ל, ואתר אינטרנט. מרשם חוזר עם שמות תרופות, מינונים, תדרים, ורופא מרשם. התמצות מתמחה לכל סוג מסמך, אך זרימת העבודה אוניברסלית: צילום, העלאה, נתונים קבלה.
מה כל סוג מסמך מייצר ולמה תמצות מיוחדת חשובה
סורק OCR ג'נרי מטפל בכל מסמך באותה דרך: הוא קורא את הטקסט בעמוד ומחזיר בלוק של טקסט. הפלט של סריקת כרטיס ביקור דרך OCR ג'נרי הוא מחרוזת של מילים ומספרים שעשויים להיראות בערך כמו "ג'ון סמית קודמת משנה מנהל אקמה קורפ 555-0123 [email protected]" ללא עדות איזה חלק הוא השם, איזה הוא הכותרת, איזה הוא מספר הטלפון, ואיזה הוא הדוא"ל. המשתמש צריך לנתח את הפלט הזה באופן ידני ולהציב כל פיסת מידע לשדה הנכון של מנהל ההתקשרות שלהם. זה שוב עדיף מהקלדת הכרטיס ביד, אך רק בקצת.
תמצות מיוחדת משנה את המשוואה לחלוטין. הבינה המלאכותית לא רק קוראת את הטקסט בכרטיס ביקור; היא מבינה שכרטיס ביקור מכיל סוגים ספציפיים של מידע מסודרים בדפוסים צפויים. שמות מופיעים ליד החלק העליון. כותרות מופיעות מתחת לשמות. מספרי טלפון עוקבים אחר דפוסי ספרות הניתנים להכרה. כתובות דוא"ל מכילות את הסמל @. אתרי אינטרנט מתחילים בקידומות שניתן להכיר. על ידי הבנת הסמנטיקה של כרטיס ביקור ולא רק התווים, התמצות מייצרת שדות תוויות כראוי, מפוצלים כראוי שיכולים לזרום ישירות למסד נתונים של התקשרות ללא שום ניתוח ידני. אותו עיקרון חל על כל סוג מסמך שהסורק מטפל בו, כל אחד עם המודל הסמנטי שלו וההיגיון של תמצות שלו.
חשבוניות הן כנראה סוג המסמך המורכב ביותר מכיוון שהם משלבים אלמנטים נרטיביים (שמות חברות, כתובות, תנאי תשלום, הערות) עם אלמנטים טבעיים (פריטי שורה עם תיאורים, כמויות, שיעורים, וסכומים) ואלמנטים מחושבים (סכומי ביניים, שיעורי מס, הנחות, סה"כ). התמצות צריכה להתמודד עם שלושתם בו זמנית, ניתוח מידע הספק מהכותרת, החיובים הבודדים מטבלת הפריט, והסיכום הפיננסי מהעלון. חברות שונות עוצבות את החשבוניות שלהם בצורה שונה, מפריסות בעמודה אחת מינימליסטית לעד מסמכים רב-חלקים אלבורטיים עם לוגואים, תנאים וכשרויות, ושהעברות שיעורי מס מרובים. הבינה המלאכותית מתמודדת עם וריאציה זו על ידי הבנה מה חשבונית היא ולא אילו תבנית חשבונית ספציפית נראית, מה שאומר שזה עובד עם חשבוניות מכל ספק ללא דורש תבניות מוגדרות מראש.
מרשמים מציגים אתגר שונה לחלוטין. מרשמים רפואיים משתמשים בציון מיוחד שנושא משמעות בעלת השפעה חיים. "500mg BID x 14d" פירושו 500 מיליגרם פעמיים ביום לארבעה עשר ימים, וקריאת חוזרת של כל חלק של הציון הזה יש השלכות הרבה יותר רציניות מאשר קריאה חוזרת של פריט שורה בחשבונית. סריקת תמצות המרשם שלך מעוצבת עם הרגישות הזו בחשבון, ניתוח לא רק שם התרופה ומינון אלא גם התדירות, משך הזמן, שם הרופא המרשם, והנחיות מיוחדות. הפלט המובנה עושה זאת פשוט להשמור על רשימת תרופות אישית ומובנה הכוללת לא רק מה נקבע אלא מתי, על ידי מי, ובאיזה מינון, שזה בדיוק הסוג של מידע שהוא בעל ערך במהלך התייעצויות רפואיות עתידיות אך כמעט לעולם לא עוקב באופן שיטתי על ידי חולים.
דפי חשבון בנק והצינור של המסמך הפיננסי
דפי חשבון בנק יושבים בצומת של עקיבה פיננסית וסריקת מסמכים מכיוון שהם מכילים בדיוק את סוג הנתונים המובנים, חוזרים שהם החרדים ביותר כדי להיכנס ביד ורב הערך ברגע שדיגיטליזציה. דף חשבון בנק חודשי עשוי להכיל חמישים, מאה, או כמה מאות עסקאות בודדות, כל אחת עם תאריך, תיאור, וסכום. הקלדה של אלה לתוך גיליון או מערכת חשבונאות היא תרגיל בסבלנות שרוב האנשים נמנעים לחלוטין, מה שאומר שהנתונים בעברים לרמה העסקה בדפי חשבון יוצא משומש על ידי הרוב המכריע של אנשים שמקבלים אותם. הדף מטופל בעין, הסה"כ של הסיכום מסומן, והנייר יוצא לתיקיה שם זה לעולם לא להיסתכל בו שוב.
סריקה דף חשבון בנק דרך scan.yeb.to חילזום כל עסקה כרשומה מובנית. כל רשומה מכילה את התאריך, התיאור (שבדרך כלל כולל את שם הסוחר או סוג העסקה), וסה"כ. המאזנים הפותחים וסגירת הם תפוסים, כגם כל חלקי סיכום שמפרקים את הפעילות של החודש לפי קטגוריה. פלט מובנה זה יכול להיזרם לתוך תוכנת חשבונאות, בהשוואה נגד רשומות בreceipts.yeb.to לתאימות קבלה, או פשוט משמש כבסיס בעבור סקירה של הוצאות אישיות שתהיה בלתי מעשית מנהל מן הדפוס בלבד.
השילוב של סריקת קבלה וסריקת דף חשבון בנק יוצר זרימת עבודה פיננסית במיוחד חזקה. קבלות לספק את הפרטים: מה הוא נקנה, פריט לפי פריט, בכל סוחר. דפי חשבון בנק לספק את השלמות: כל עסקה, כולל אלה שלא ייצרו קבלת נייר ראוי סריקה. יחד, הם לתת מראה מקיף של הוצאות שלא אחד מספק לבדו. הקבלה מראה כי 47 יורו תשלום בחנות קניות היה מורכב של פריטים ספציפיים בתמחורים ספציפיים. דף חשבון בנק מראה כי 47 יורו תשלום קרה ביום שלישי ב-3:14 PM וכי היה גם תשלום 12 יורו בקפה באותו אחר הצהריים שלא ייצר קבלה ראוי סריקה. שתי שכבות של מידע הם שימושי, וסורק מאוחד עושה שניהם זמינים דרך את זרימת העבודה בדיוק.
שמונה סוגים בפועל ובחירה מתי לסרוק
שמונה סוגי מסמכים סורק תומך בקבלות, חשבוניות, מרשמים, כרטיסי ביקור, דפי חשבון בנק, תוצאות מעבדה, מסמכי זהות, ומסמכים כלליים. כל אחד יש לו מודל תמצות שלו בעצמו, אך דפוס השימוש בכל הם עוקב אחרי את אותה עקומת קבלה. אנשים להתחיל על ידי סריקה סוג המסמך שמטפל בצרכים הדחופים שלהם ביותר. לעבור חופשי, שהוא בדרך כלל חשבוניות. למישהו ניהול בריאותם, זה הוא תוצאות מעבדה ומרשמים. לעובד כנס, זה הוא כרטיסי ביקור. ברגע סריקה הרגל צורות סביב סוג המסמך אחד, זה באופן טבעי משתרע לאחרים מכיוון זרימת העבודה הוא זהה והגדר בפני הוספת סוג אחר הוא אפס.
השאלה של מתי לסרוק הוא בעצם השאלה של מתי נתונים מובנים הוא יותר בעל ערך מאשר תמונה. לקבלה מארוחת ביזנס שצריך להגיע על דוח הוצאות, התשובה היא תמיד: סריקה מחסוך יותר זמן מאשר עלויות זה. לקבלה חנות קניות אקראית ללא מס או עקיבות השלכות, התשובה תלויה בין אם עקיבות הוצאות היא חלק מהשגרה היומית. לדף חשבון בנק, התשובה תלויה בין אם נתוני העסקה משמש מטרה מעבר לזה שהפורטל המקוון של הבנק כבר מספק. סורק לא גובה זרימת עבודה; זה מאפשר איזו זרימת עבודה המשתמש צריכים, מתיעוד סריקה-הכל מקיף לסריקה מוקדשת של רק המסמכים שמשמשים מטרה דחופה.
סוג המסמך הכללי משמש כ-catch-all במסמכים שלא מתאימים בצורה נקייה לשבע הקטגוריות האחרות. חוזים, מכתבים, טפסים, הודעות, תעודות, היתרים, וכל מסמך נייר אחר שמכיל טקסט שווה דיגיטליזציה יכול להיות מעובד דרך צינור תמצות כללי. הפלט למסמכים כלליים הוא הטקסט תוכן מלא עם עיצוב מובנה שמור, אשר עושה את זה שימושי של ארכיון, חיפוש, ויעוץ מטרה גם ללא תמצות שדה מיוחדת שהסוגים ייעודיים לספק. זה אומר סורק לעולם מסרב מסמך מכיוון שזה לא משחק סוג ידוע. כל דבר ניתן לסריקה, וכל דבר מייצר פלט שימושי, עם סוגים מיוחדים מייצר במיוחד פלט מובנה שימושי בהתאם לתוכן שלהם.
שאלות נשאלות בתדירות גבוהה
כמה סוגי מסמכים הסורק תומך בתוך
סורק בscan.yeb.to תומך בשמונה סוגי מסמכים: קבלות, חשבוניות, מרשמים, כרטיסי ביקור, דפי חשבון בנק, תוצאות מעבדה, מסמכי זהות, ומסמכים כלליים. לכל סוג יש היגיון תמצות מיוחד שמייצר נתונים מובנים מעוצבים לקטגוריית המסמך הזה. סוג מסמך כללי מטפל בכל דבר שלא משחק הקטגוריות המיוחדות.
האם הסורק באופן אוטומטי מזהה סוג המסמך
הבינה המלאכותית מנתחת את התמונה שהועלתה מזהה סוג המסמך בהתבסס על התוכן והמבנה שלה. חשבונית עם פריטי שורה וסה"כ מוכרת כחשבונית. כרטיס ביקור עם פרטי התקשרות מוכר ככרטיס ביקור. הגילוי האוטומטי הזה אומר המשתמש לא צריך לציין את סוג המסמך לפני העלאה, אף כי בחירת הסוג באופן ידני היא גם אפשרות מתי דיוק עדיף.
יכול חשבוניות סרוקות להיות מיוצאות לתוכנת חשבונאות
סורק מייצר נתונים מובנים לרבות שם ספק, מספר חשבונית, תאריך, פריטי שורה עם תיאורים וסכומים, חישובי מס, וסה"כ חייב. פלט מובנה זה יכול להיות מיוצא בפורמטים תואמים לתוכנת חשבונאות סטנדרטית. עבור משתמשים של receipts.yeb.to, נתוני החשבונית משולבים ישירות למערכת עקיבות הוצאות עם התאמת ספק אוטומטית וקטיגוריזציה.
אילו מידע הוא חילזום מכרטיסי ביקור
תמצות כרטיסי ביקור מייצר שדות בודדים לשם, כותרת עבודה, שם חברה, מספרי טלפון (נייד, משרד, פקס), כתובת דוא"ל, אתר אינטרנט, וכתובת פיזית. כל שדה הוא תווית ומפוצל, מוכן להיות מיובא למערכת ניהול התקשרות ללא ניתוח ידני. התמצות מטפל בפריסות כרטיסים שונות, כיווני, וסגנונות עיצוב.
האם סורק שימושי לעקיבות מרשם
כן. סריקת מרשם תמצות שמות תרופות, מינונים, תדרים, משכי זמן, שם הרופא המרשם, והנחיות מיוחדות. זה יוצר רשימת תרופות מובנית ההיסטוריה שיש ערך במהלך ייעוץ רפואי, עבור מטרות ביטוח, וביעקיבות בריאות אישית. בעל רשומה דיגיטלית של כל התרופות שנקבעו עם תאריכים ומינונים מספק הקשר שמרשמים נייר בתיקיה לא יכול.
יכול דפי חשבון בנק עם מאות עסקאות להיות סרוקות בדיוק
סורק מטפל בדפי חשבון בנק עם מספרים גדולים של עסקאות על ידי עיבוד המסמך בצורה שיטתית, חילזום כל עסקה כרשומה נפרדת עם תאריך, תיאור, וסה"כ. פתיחה וסגירת מאזנים הם תפוסים בצד העסקאות הבודדות. דיוק נשאר גבוה ללא קשר לספור עסקה, והפלט המובנה עושה זה מעשי לעבוד עם נתוני הצהרה שתהיה בלתי מעשית להקליד באופן ידני.