청구서, 처방전, 명함, 은행 거래명세서 - 모든 것을 위한 하나의 스캐너
현대의 전문가들은 한 주에 최소 6가지 이상의 문서 유형을 다룹니다. 공급업체로부터 청구서가 도착하여 회계 시스템에 입력해야 합니다. 약국에서 처방전을 받으면 부엌 서랍보다 안전한 곳에 기록해야 합니다. 컨퍼런스에서 명함을 받으면 연락처 정보를 휴대폰에 저장해야 합니다. 은행 거래명세서가 도착하면 거래를 확인해야 합니다. 업무 식사 영수증을 경비 보고서에 첨부해야 합니다. 정기 검진 검사 결과를 작년 수치와 비교해야 합니다. 각각의 문서는 서로 다른 형식, 서로 다른 필드, 서로 다른 목적을 가지고 있으며, 최근까지는 각각을 디지털화하기 위해 고유한 워크플로우가 필요했습니다.
앱 시장은 이러한 분화를 반영하고 있습니다. 전용 영수증 스캐너, 전용 명함 스캐너, 전용 청구서 처리 도구, 전용 의료 문서 판독기가 있습니다. 각 앱은 특정 업무를 합리적으로 잘 수행하지만, 자체 데이터 사일로, 유지 관리해야 할 자체 계정, 배워야 할 자체 인터페이스, 구독료를 만듭니다. 6가지 문서 유형에 맞춘 6개의 전문화된 스캐닝 앱을 유지 관리하는 인지 부담은 충분히 크므로, 대부분의 사람들은 저항이 가장 적은 경로로 기본값을 설정합니다: 휴대폰 카메라로 사진을 찍고, 폴더에 넣고, "폴더에 있는 문서 사진"이 충분한 조직화 시스템이기를 바랍니다. 하지만 그렇지 않으며, 여러 개의 전문화된 도구를 사용하는 것이 더 나쁜 것처럼 느껴집니다.
scan.yeb.to의 스캐너는 근본적으로 다른 접근 방식을 취합니다. 하나의 엔드포인트가 8가지 문서 유형을 처리합니다. 지원되는 문서의 사진을 업로드하면, AI가 어떤 종류의 문서인지 식별하고, 해당 유형에 적합한 추출 로직을 적용하고, 문서에 포함된 콘텐츠에 특별히 형식화된 구조화된 데이터를 반환합니다. 청구서는 공급업체명, 청구서번호, 명세항목, 세금액, 총 납부액과 함께 반환됩니다. 명함은 이름, 직책, 회사, 전화번호, 이메일, 웹사이트와 함께 반환됩니다. 처방전은 약물명, 복용량, 복용 빈도, 처방 의사와 함께 반환됩니다. 추출은 각 문서 유형에 특화되어 있지만, 워크플로우는 보편적입니다: 촬영, 업로드, 데이터 수신.
각 문서 유형이 생성하는 내용 및 전문 추출이 중요한 이유
일반 OCR 스캐너는 모든 문서를 동일하게 취급합니다: 페이지의 텍스트를 읽고 텍스트 블록을 반환합니다. 일반 OCR을 통해 명함을 스캔한 출력은 "John Smith Marketing Director Acme Corp 555-0123 [email protected]"처럼 보일 수 있는 단어와 숫자의 문자열이며, 어느 부분이 이름이고, 어느 부분이 직책이고, 어느 부분이 전화번호이고, 어느 부분이 이메일인지 표시가 없습니다. 사용자는 해당 출력을 수동으로 파싱하여 각 정보를 연락처 관리자의 올바른 필드에 배치해야 합니다. 이는 카드를 손으로 입력하는 것보다 약간 나을 뿐입니다.
전문 추출은 방정식을 완전히 바꿉니다. AI는 단순히 명함의 텍스트를 읽는 것이 아니라, 명함이 예측 가능한 패턴으로 배열된 특정 유형의 정보를 포함한다는 것을 이해합니다. 이름은 상단 근처에 나타납니다. 직책은 이름 아래에 나타납니다. 전화번호는 인식 가능한 숫자 패턴을 따릅니다. 이메일 주소에는 @ 기호가 포함됩니다. 웹사이트는 인식 가능한 접두사로 시작합니다. 단순히 문자가 아닌 명함의 의미를 이해함으로써, 추출은 수동 파싱 없이 연락처 데이터베이스로 직접 이동할 수 있는 적절하게 레이블이 지정되고 적절하게 분리된 필드를 생성합니다. 동일한 원칙은 스캐너가 처리하는 모든 문서 유형, 즉 각각의 고유한 의미론적 모델과 고유한 추출 로직에 적용됩니다.
청구서는 아마도 가장 복잡한 문서 유형일 것입니다. 왜냐하면 청구서는 서사 요소(회사명, 주소, 결제 조건, 주석)와 표 요소(설명, 수량, 요금 및 금액이 있는 명세항목)와 계산된 요소(소계, 세율, 할인, 총액)를 결합하기 때문입니다. 추출은 헤더에서 공급업체 정보를 파싱하고, 항목 테이블에서 개별 청구액을 파싱하고, 바닥글에서 금융 요약을 파싱하면서 세 가지 모두를 동시에 처리해야 합니다. 다양한 회사는 자신의 청구서를 다양하게 형식화합니다. 미니멀리스트 단일 열 레이아웃부터 로고, 약관, 여러 세율 분석이 있는 정교한 다중 섹션 문서까지 다양합니다. AI는 특정 청구서 템플릿이 무엇인지가 아닌 청구서가 무엇인지를 이해함으로써 이러한 변동에 대처하며, 이는 사전 구성된 템플릿을 요구하지 않고 모든 공급업체의 청구서와 함께 작동한다는 의미입니다.
처방전은 완전히 다른 문제를 제시합니다. 의료 처방전은 생명에 영향을 미치는 중요성을 갖는 전문화된 표기법을 사용합니다. "500mg BID x 14d"는 14일 동안 하루에 두 번 500밀리그램을 의미하며, 그 표기법의 어느 부분을 잘못 읽더라도 청구서의 명세항목을 잘못 읽는 것보다 훨씬 더 심각한 결과가 발생합니다. 스캐너의 처방전 추출은 이러한 민감성을 고려하여 설계되었으며, 약물명과 복용량뿐만 아니라 빈도, 기간, 처방 의사, 특별한 지시사항도 파싱합니다. 구조화된 출력은 처방 의사, 기간, 복용량을 포함하여 처방된 약물뿐만 아니라 언제, 누가, 어떤 복용량으로 처방했는지를 포함하는 개인 약물 이력을 유지하는 것을 간단하게 만들며, 이는 정확히 향후 의료 상담 중에 유용하지만 환자가 거의 체계적으로 추적하지 않는 정보입니다.
은행 거래명세서와 금융 문서 파이프라인
은행 거래명세서는 금융 추적과 문서 스캔의 교차점에 위치합니다. 왜냐하면 은행 거래명세서에는 수동 입력이 가장 지루하고 디지털화 후 가장 가치 있는 정확한 반복 데이터가 포함되어 있기 때문입니다. 월간 은행 거래명세서에는 50건, 100건 또는 몇 백 건의 개별 거래가 포함될 수 있으며, 각 거래에는 날짜, 설명, 금액이 있습니다. 이를 스프레드시트나 회계 시스템에 입력하는 것은 대부분의 사람들이 완전히 피하는 지구력의 연습입니다. 즉, 은행 거래명세서의 상세 거래 수준 데이터는 그것을 받는 대부분의 사람들이 사용하지 않습니다. 명세서는 대략적으로 검토되고, 총 잔액이 기록되고, 종이는 다시 보지 않을 파일로 들어갑니다.
scan.yeb.to를 통해 은행 거래명세서를 스캔하면 모든 거래가 구조화된 레코드로 추출됩니다. 각 레코드에는 날짜, 설명(일반적으로 가맹점명 또는 거래 유형 포함), 금액이 포함됩니다. 개시 및 마감 잔액이 캡처되고, 월간 활동을 범주별로 분석하는 요약 섹션도 마찬가지입니다. 이 구조화된 출력은 회계 소프트웨어에 제공되거나, receipts.yeb.to의 레코드와 비교되어 영수증 일치를 위해 사용되거나, 단순히 인쇄된 명세서에서 수행하기에 비실용적인 개인 지출 검토의 기초로 사용될 수 있습니다.
영수증 스캔과 은행 거래명세서 스캔의 결합은 특히 강력한 재무 워크플로우를 만듭니다. 영수증은 상세 정보를 제공합니다: 각 가맹점에서 항목 단위로 무엇을 구매했는지. 은행 거래명세서는 완전성을 제공합니다: 인쇄 영수증을 생성하지 않은 거래를 포함한 모든 거래. 함께, 그들은 둘 다 혼자서는 제공하지 않는 지출의 포괄적인 관점을 제공합니다. 영수증은 식료품점의 47유로 청구가 특정 항목과 특정 가격으로 구성되었음을 보여줍니다. 은행 거래명세서는 47유로 청구가 화요일 오후 3시 14분에 발생했고, 같은 오후에 스캔할 가치가 없는 카페에서 12유로 청구도 있었음을 보여줍니다. 두 정보 계층 모두 유용하며, 통합 스캐너는 동일한 워크플로우를 통해 둘 다 사용 가능하게 합니다.
8가지 유형의 실제 사용과 스캔 시기 선택
스캐너가 지원하는 8가지 문서 유형은 영수증, 청구서, 처방전, 명함, 은행 거래명세서, 검사 결과, 신분증, 일반 문서입니다. 각각은 자체 추출 모델을 가지고 있지만, 모든 사용 패턴은 채택 곡선을 따릅니다. 사람들은 가장 급박한 필요를 해결하는 문서 유형 스캔으로 시작합니다. 프리랜서의 경우 일반적으로 청구서입니다. 건강을 관리하는 사람의 경우 검사 결과와 처방전입니다. 컨퍼런스 참석자의 경우 명함입니다. 한 가지 문서 유형에 대한 스캔 습관이 형성되면, 워크플로우가 동일하고 다른 유형을 추가할 때의 장벽이 0이기 때문에 자연스럽게 다른 유형으로 확장됩니다.
언제 스캔할지에 대한 질문은 본질적으로 구조화된 데이터가 사진보다 더 가치 있을 때에 대한 질문입니다. 경비 보고서에 들어가야 하는 업무 식사 영수증의 경우 답은 항상 다음과 같습니다: 스캔은 비용보다 더 많은 시간을 절약합니다. 세금이나 추적 영향이 없는 임의의 식료품 영수증의 경우, 답은 경비 추적이 일일 루틴의 일부인지 여부에 따라 다릅니다. 은행 거래명세서의 경우, 답은 거래 데이터가 은행의 온라인 포털이 이미 제공하는 것 이상의 목적을 제공하는지 여부에 따라 다릅니다. 스캐너는 워크플로우를 처방하지 않습니다. 포괄적인 스캔-모든-것 문서화에서 즉시 목표를 달성하는 대상 스캔까지 사용자가 필요한 모든 워크플로우를 활성화합니다.
일반 문서 유형은 다른 7가지 범주에 깔끔하게 맞지 않는 문서의 포괄적인 분류입니다. 계약, 편지, 양식, 공지, 증명서, 허가, 그리고 디지털화할 가치가 있는 텍스트를 포함하는 다른 모든 종이 문서는 일반 추출 파이프라인을 통해 처리될 수 있습니다. 일반 문서의 출력은 구조적 형식이 보존된 전체 텍스트 콘텐츠이며, 이는 전용 문서 유형이 제공하는 전문화된 필드 추출 없이도 보관, 검색 및 참조 목적에 유용합니다. 이는 스캐너가 알려진 유형과 일치하지 않는다고 해서 문서를 거부하지 않는다는 의미입니다. 모든 것을 스캔할 수 있으며, 모든 것이 유용한 출력을 생성하며, 전문화된 유형은 특별히 유용한 구조화된 출력을 생성합니다.
자주 묻는 질문
스캐너는 몇 가지 문서 유형을 지원합니까?
scan.yeb.to의 스캐너는 8가지 문서 유형을 지원합니다: 영수증, 청구서, 처방전, 명함, 은행 거래명세서, 검사 결과, 신분증, 일반 문서. 각 유형에는 해당 문서 범주에 형식화된 구조화된 데이터를 생성하는 전문화된 추출 로직이 있습니다. 일반 문서 유형은 전문화된 범주에 맞지 않는 모든 것을 처리합니다.
스캐너가 자동으로 문서 유형을 감지합니까?
AI는 업로드된 이미지를 분석하고 콘텐츠와 구조를 기반으로 문서 유형을 식별합니다. 명세항목과 합계가 있는 청구서는 청구서로 인식됩니다. 연락처 세부사항이 있는 명함은 명함으로 인식됩니다. 이 자동 감지는 사용자가 업로드 전에 문서 유형을 지정할 필요가 없다는 의미이지만, 정확도를 선호할 때 수동으로 유형을 선택하는 것도 옵션입니다.
스캔된 청구서를 회계 소프트웨어로 내보낼 수 있습니까?
스캐너는 공급업체명, 청구서 번호, 날짜, 설명 및 금액이 있는 명세항목, 세금 계산, 총 납부액을 포함하는 구조화된 데이터를 생성합니다. 이 구조화된 출력은 표준 회계 소프트웨어와 호환되는 형식으로 내보낼 수 있습니다. receipts.yeb.to 사용자의 경우, 청구서 데이터는 자동 공급업체 일치 및 분류를 통해 경비 추적 시스템과 직접 통합됩니다.
명함에서 어떤 정보가 추출됩니까?
명함 추출은 이름, 직책, 회사명, 전화번호(휴대폰, 사무실, 팩스), 이메일 주소, 웹사이트, 물리적 주소에 대한 개별 필드를 생성합니다. 각 필드는 레이블이 지정되고 분리되어 수동 파싱 없이 연락처 관리 시스템으로 가져올 준비가 됩니다. 추출은 다양한 카드 레이아웃, 방향, 디자인 스타일을 처리합니다.
스캐너는 처방전 추적에 유용합니까?
네. 처방전 스캔은 약물명, 복용량, 빈도, 기간, 처방 의사명, 특별한 지시사항을 추출합니다. 이는 의료 상담, 보험 목적, 개인 건강 추적 중에 유용한 구조화된 약물 이력을 만듭니다. 날짜와 복용량을 포함한 모든 처방 약물의 디지털 레코드를 갖추면 서랍에 있는 종이 처방전이 제공할 수 없는 문맥을 제공합니다.
수백 개의 거래가 있는 은행 거래명세서를 정확하게 스캔할 수 있습니까?
스캐너는 문서를 체계적으로 처리하여 각 거래를 날짜, 설명, 금액이 있는 별도 레코드로 추출하여 많은 수의 거래가 있는 은행 거래명세서를 처리합니다. 개시 및 마감 잔액이 개별 거래와 함께 캡처됩니다. 거래 수에 관계없이 정확도는 높게 유지되며, 구조화된 출력은 수동 입력이 비실용적인 명세서 데이터로 작업하는 것을 실용적으로 만듭니다.