Рахунки, рецепти, візитні картки та виписки - один сканер для всього
Сучасний професіонал має справу щонайменше з половиною дюжини типів документів на будь-якому тижні. Рахунок від постачальника потребує логування в бухгалтерську систему. Рецепт потрібно записати кудись надійнішим чином, ніж ящик на кухні. Візитна картка від знайомства на конференції повинна потрапити в телефон перш, ніж її втратити. Виписка з банку потребує зіставлення транзакцій. Квитанція від ділового обіду повинна приєднатися до звіту про витрати. Результати аналізів потрібно порівняти з минулорічними цифрами. Кожен з цих документів існує в різному форматі з різними полями та різними цілями, і до недавна кожен потребував власного робочого процесу для цифровізації.
Екосистема додатків відображає цю фрагментованість. Існують спеціалізовані сканери квитанцій, сканери візитних карток, інструменти обробки рахунків, читачі медичних документів. Кожен розробник робить свою роботу досить добре, але створює власний силос даних, власний акаунт для обслуговування, власний інтерфейс для вивчення та власну передплату за оплату. Когнітивна перевантаженість обслуговування шести спеціалізованих сканерів для шести типів документів настільки значна, що більшість людей обирають простіший шлях: зробити фото на камеру телефону, скинути в папку й сподіватися, що "фото документа в папці" - достатня система організації. Це ніколи не спрацьовує, але альтернатива використання кількох спеціалізованих інструментів здається гіршою.
Сканер на scan.yeb.to використовує принципово інший підхід. Один API обробляє вісім типів документів. Завантажте фото будь-якого підтримуваного документа, і AI визначає, який тип документа це, застосовує відповідну логіку екстракції для цього типу та повертає структуровані дані, відформатовані спеціально для контенту цього документа. Рахунок повертається з іменем постачальника, номером рахунку, позиціями в рядках, сумами податку та загальною сумою до сплати. Візитна картка повертається з іменем, посадою, компанією, номерами телефонів, електронною поштою та веб-сайтом. Рецепт повертається з назвами ліків, дозуванням, частотою прийому та лікарем. Екстракція спеціалізована для кожного типу документа, але робочий процес універсальний: сфотографувати, завантажити, отримати дані.
Що створює кожен тип документу та чому спеціалізована екстракція має значення
Загальний OCR сканер обробляє кожен документ однаково: читає текст на сторінці та повертає блок тексту. Результат сканування візитної картки через загальний OCR виглядатиме приблизно так: "John Smith Marketing Director Acme Corp 555-0123 [email protected]" без будь-якого вказівки на те, яка частина - ім'я, яка - посада, яка - номер телефону, а яка - електронна пошта. Користувач повинен вручну розібрати цей результат та розмістити кожну інформацію в потрібному полі його менеджера контактів. Це лише трохи краще, ніж друкування картки вручну.
Спеціалізована екстракція змінює рівняння абсолютно. AI не просто читає текст на візитній картці; вона розуміє, що візитна картка містить певні типи інформації, розташовані в передбачуваних схемах. Імена з'являються ближче до верхівки. Посади з'являються під іменами. Номери телефонів мають впізнаваний формат цифр. Адреси електронної пошти містять символ @. Веб-сайти починаються з впізнаваних префіксів. Розуміючи семантику візитної картки, а не просто символи, екстракція дає правильно позначені, правильно розділені поля, які можуть прямо потрапити в базу даних контактів без будь-якого ручного аналізу. Той же принцип застосовується до кожного типу документа, який обробляє сканер, кожен з власною семантичною моделлю та власною логікою екстракції.
Рахунки, мабуть, найскладніший тип документа, тому що поєднують наративні елементи (назви компаній, адреси, умови платежу, примітки) з табличними елементами (позиції в рядках з описами, кількостями, курсами та сумами) та обчислюваними елементами (проміжні суми, ставки податків, знижки, всього). Екстракція повинна одночасно обробляти все три, розбираючи інформацію про постачальника із заголовка, окремі платежі з таблиці позицій та фінансове резюме із нижньої частини. Різні компанії форматують свої рахунки по-різному, від мініміалістичних однорядкових макетів до складних багаторазових документів з логотипами, умовами та кількома розбивками ставок податків. AI обробляє цю варіацію, розуміючи, що таке рахунок, а не як виглядає конкретна шаблон рахунку, тому вона працює з рахунками від будь-якого постачальника без необхідності попередньої конфігурації шаблонів.
Рецепти представляють зовсім іншу проблему. Медичні рецепти використовують спеціалізований запис, який має важливість, що впливає на життя. "500 мг BID x 14d" означає 500 міліграм два рази на день протягом чотирнадцяти днів, і неправильне читання будь-якої частини цього запису має наслідки набагато серйознішим, ніж неправильне читання позиції в рахунку. Екстракція рецептів сканера розроблена з урахуванням цієї чутливості, розбираючи не тільки назву ліку та дозування, але й частоту, тривалість, ім'я призначаючого лікаря та будь-які спеціальні інструкції. Структурований результат дає можливість легко вести особисту історію прийому ліків, яка включає не тільки те, що було призначено, але й коли, ким та в якому дозуванні, що саме того роду інформація, яка корисна під час майбутніх медичних консультацій, але майже ніколи не відслідковується систематично пацієнтами.
Банківські виписки та конвеєр фінансових документів
Банківські виписки перебувають на перехресті фінансового відстеження та сканування документів, тому що вони містять саме такого роду структуровані, повторювальні дані, які найнудніше вводити вручну та найцінніші після цифровізації. Щомісячна банківська виписка може містити п'ятдесят, сто або кілька сотень окремих транзакцій, кожна з датою, описом та сумою. Введення їх у електронну таблицю або бухгалтерську систему - це вправа на витримку, яку більшість людей повністю уникають, що означає, що детальні дані на рівні транзакцій у виписках залишаються невикористаними переважною більшістю людей, які їх отримують. Виписка переглядається, загальний залишок зазначається, а папір йде в папку, де він ніколи більше не буде розглянутий.
Сканування банківської виписки на scan.yeb.to екстрагує кожну транзакцію як структурований запис. Кожен запис містить дату, опис (яка зазвичай включає назву продавця або тип транзакції) та суму. Фіксуються вхідні та закриваючі залишки, а також будь-які розділи резюме, які розбивають діяльність місяця за категоріями. Цей структурований результат можна передати до бухгалтерського програмного забезпечення, порівняти з записами в receipts.yeb.to для зіставлення квитанцій або просто використати як основу для особистого огляду витрат, який був би непрактичним проводити з надрукованої виписки.
Поєднання сканування квитанцій та сканування банківських виписок створює особливо потужний фінансовий робочий процес. Квитанції надають деталі: що було куплено, позицію за позицією, у кожного продавця. Банківські виписки надають повноту: кожну транзакцію, включаючи ті, які не дали квитанції, гідної сканування. Разом вони дають комплексне уявлення про видатки, яке жодна з них окремо не надає. Квитанція показує, що платіж у 47 євро в продуктовому магазині складався з конкретних товарів за конкретними цінами. Банківська виписка показує, що платіж у 47 євро відбувся у вівторок о 15:14 та що було ще й платіж у 12 євро в кафе того ж дня, яке не дало квитанцію. Обидва шари інформації корисні, а уніфікований сканер робить обидва доступними через один робочий процес.
Восьмерка типів на практиці та вибір часу для сканування
Восьмерка типів документів, які підтримує сканер: квитанції, рахунки, рецепти, візитні картки, банківські виписки, результати аналізів, документи про особистість та загальні документи. Кожен має власну модель екстракції, але схема використання всіх них відповідає одній кривій адаптації. Люди починають зі сканування типу документа, який вирішує їхню найнагальнішу потребу. Для фрилансера це зазвичай рахунки. Для людини, яка керує своїм здоров'ям, це результати аналізів та рецепти. Для учасника конференції - це візитні картки. Як тільки звичка сканування формується навколо одного типу документа, вона природно розповсюджується на інші, тому що робочий процес однаковий та перешкода до додавання іншого типу дорівнює нулю.
Питання про те, коли сканувати - це по суті питання про те, коли структуровані дані цінніші за фотографію. Для квитанції від ділового обіду, яка потребує звіту про витрати, відповідь завжди: сканування заощаджує більше часу, ніж коштує. Для випадкової продуктової квитанції без податкових або відслідковуваних наслідків, відповідь залежить від того, чи є відслідковування витрат частиною щоденної процедури. Для банківської виписки, відповідь залежить від того, чи служать дані транзакцій цілі, окрім того, що вже надає онлайн портал банку. Сканер не назначає робочий процес; він дозволяє будь-якому робочому процесу, який потребує користувач, від комплексного сканування всього документування до цільового сканування лише документів, які служать негайній цілі.
Загальний тип документа служить "сватом" для документів, які не вписуються акуратно в інші сім категорій. Контракти, листи, форми, повідомлення, свідоцтва, дозволи та будь-який інший паперовий документ, який містить текст, гідний цифровізації, можуть оброблятися через конвеєр загальної екстракції. Результат для загальних документів - це повний текстовий контент зі збереженим структурним форматуванням, що робить його корисним для архівування, пошуку та довідкових цілей, навіть без спеціалізованої екстракції полів, яку надають спеціалізовані типи. Це означає, що сканер ніколи не відмовляється від документа, тому що він не відповідає відомому типу. Все сканується, і все створює корисний результат, зі спеціалізованими типами, що створюють особливо корисний структурований результат, адаптований до їх контенту.
Часто задавані питання
Скільки типів документів підтримує сканер
Сканер на scan.yeb.to підтримує вісім типів документів: квитанції, рахунки, рецепти, візитні картки, банківські виписки, результати аналізів, документи про особистість та загальні документи. Кожен тип має спеціалізовану логіку екстракції, яка дає структуровані дані, відформатовані для цієї категорії документа. Загальний тип документа обробляє все, що не вписується до спеціалізованих категорій.
Чи автоматично сканер визначає тип документа
AI аналізує завантажене зображення та визначає тип документа на основі його контенту та структури. Рахунок з позиціями рядків та сумами розпізнається як рахунок. Візитна картка з деталями контактів розпізнається як візитна картка. Це автоматичне визначення означає, що користувач не повинен вказувати тип документа перед завантаженням, хоча вибір типу вручну також є опцією, коли переважається точність.
Чи можуть скановані рахунки експортуватися до бухгалтерського програмного забезпечення
Сканер дає структуровані дані, включаючи ім'я постачальника, номер рахунку, дату, позиції в рядках з описами та сумами, розрахунки податків та загальну суму до сплати. Цей структурований результат можна експортувати в форматах, сумісних зі стандартним бухгалтерським програмним забезпеченням. Для користувачів receipts.yeb.to дані рахунку інтегруються безпосередньо в систему відслідковування витрат з автоматичним зіставленням постачальників та категоризацією.
Яка інформація екстрагується з візитних карток
Екстракція візитної картки дає окремі поля для імені, посади, назви компанії, номерів телефонів (мобільний, офіс, факс), адреси електронної пошти, веб-сайту та фізичної адреси. Кожне поле позначено та розділено, готово бути імпортованим у систему керування контактами без ручного аналізу. Екстракція обробляє різні макети карток, орієнтації та стилі дизайну.
Чи корисний сканер для відслідковування рецептів
Так. Сканування рецептів екстрагує назви ліків, дозування, частоти прийому, тривалості, ім'я лікаря та спеціальні інструкції. Це створює структуровану історію ліків, яка цінна під час медичних консультацій, для цілей страхування та особистого здоров'я. Розташування цифрового запису всіх призначених ліків з датами та дозуванням надає контекст, який папір не може.
Чи можуть банківські виписки зі сотнями транзакцій скануватися точно
Сканер обробляє банківські виписки з великою кількістю транзакцій систематично, екстрагуючи кожну транзакцію як окремий запис з датою, описом та сумою. Вхідні та закриваючі залишки фіксуються разом з окремими транзакціями. Точність залишається високою незалежно від кількості транзакцій, а структурований результат робить практичним роботу з даними виписки, яка була б непрактичною для введення вручну.