电脑桌面
添加蚂蚁七词文库到电脑桌面
安装后可以在桌面快捷访问

实践案例 | 自定义模板OCR:专注小众个性化单据的识别

来源:金蝶云社区作者:金蝶2024-09-2310

实践案例 | 自定义模板OCR:专注小众个性化单据的识别

小编推荐


贸易业务的处理流程中,常涉及到不少企业独有的、行业特性强的非结构化数据(pdf、图片、扫描影像)。若依赖人工去录入数据、核对关键信息是否正确,不仅耗费成本高,且在业务量大且有时效要求的情况下,容易出错。


对此,有什么解决方案可以替代人工,且高效完成上述需求呢?本期自定义模板OCR(智能识别)功能实践案例告诉你答案,再也不愁数据录入效率低~


撰稿人:金蝶-晓月




1 业务背景


客户C是一个多组织、多元化、跨地域经营的贸易公司,主营业务包括自营进口、代理进口、自营出口、代理出口、转口等业务。该公司的信息化目标是建立一体化信息平台,即选择一个具有强大底层平台和完善产品线的软件搭建企业信息系统,全面支撑集团管控意图的下达和经营管理结果的及时全面反馈,消除信息孤岛。


在贸易业务上,公司与全球81个国家和地区保持着经贸业务往来,每个月国际国内贸易业务笔数达1000多笔。在贸易业务的处理流程中,涉及到不少企业独有的、行业特性强的非结构化数据(pdf、图片、扫描影像),在系统上线之前,都依赖于人工去录入数据、核对关键信息是否正确。但人工操作在业务量大且有时效要求的情况下,容易出错


以客户主营业务之一——代理进口业务为例。在合同签订之后,系统通过合同关联生成到货明细单,再进一步关联生成进口报关单。但在关联生成时只能带过去少部分报关信息,剩余的信息需要通过pdf报关单文件进行补录。因此,客户希望能够用智能化技术将非结构化的pdf报关单文件数据及时、准确地录入贸易系统,无需人工补录


图1-客户主营业务之一


2 解决方案

2.1 方案整体思路


由于报关单是贸易企业特有的单据,市面上并没有针对报关单的识别模型。且考虑到报关单版式固定,具有清晰的“key-value”的结构,因此在解决方案中,选择利用苍穹AI服务云提供的自定义模板OCR能力,定制报关单的识别模板,将客户需要识别的字段框选起来,再与业务单据绑定识别字段映射关系


据此,业务操作人员在业务单据中新增报关单时,可以通过导入pdf或图片识别,将非结构化的信息录入到业务字段中。


2.2 关键配置步骤及效果展示


步骤一:定制识别模板


由实施人员在【视觉识别服务】→【自定义模板列表】中上传一张报关单的图片作为模板,框选待识别的字段后发布模板。在使用时,可根据实际需求灵活使用该功能:


  • 当业务上需要录入明细内容(例如商品明细、检查结果明细、行程明细等)时,可通过表格区域框选功能实现;

  • 当业务上需要对pdf图片中的一个字段拆分成多个字段再录入业务单据时,可通过识别后拆分文字内容功能来实现。


图2-定制识别模板操作示例


步骤二:模板关联业务单据


由实施人员在【视觉识别服务】→【业务关联方案】中新增一个方案,将发布的报关单识别模板与贸易系统中的业务单据(进口报关单)关联起来,对前面定义的待识别字段与进口报关单的业务字段进行一一映射


7
图3-板关联业务单据操作示例


步骤三:单据设计器中绑定OCR操作代码


实施人员打开进口报关单的单据设计器页面,在操作按钮栏上增加一个“识别录入”的按钮,在按钮属性区域的“操作代码”一行选择“ocr(智能识别)”。这样OCR能力就能轻易地嵌入到进口报关单中了,整个过程无需代码开发,操作无门槛,十分灵活简约


图4-单据设计器中绑

实践案例 | 自定义模板OCR:专注小众个性化单据的识别

小编推荐在贸易业务的处理流程中,常涉及到不少企业独有的、行业特性强的非结构化数据(pdf、图片、扫描影像)。若依赖人工去录入数据、核...
点击下载文档文档为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部
客服QQ
  • 客服QQ点击这里给我发消息
QQ群
  • 答案:my7c点击这里加入QQ群
支持邮箱
微信
  • 微信