标注多字段组合

1 应用场景
业务单据录入的过程中,有一种常见的情况:图像上待识别的文本内容需要拆分后才能填入电子表单对应的字段中。
比如客户业务系统中的报关单在设计时,“申报单位名称”和“申报单位信用代码”两个字段是分开填写的;但在实际的待识别报关单图片中,这两个字段是合在一起的。

业务系统中报关单里的“申报单位”字段

待识别报关单图片中的“申报单位”字段
同样,在整张报关单图片中,我们发现表格区域的“数量及单位”、“单价/总价/币制”这两个字段中的内容也是需要拆分后才能填入业务单据的。

业务系统中报关单的商品分录

待识别报关单图片中的商品明细
如果要将原本合在一起的字段自动拆分后填进去,就要用到视觉识别服务的多字段组合工具了。
2 拆分规则
多字段组合工具遵循一定的规则,将待识别的文本内容拆分成用户需要的多个部分。以下是可拆分的多字段示例。

第三步待识别字段标注时,用户可以在框选待识别字段后选择“多字段组合”,这样就可以添加多字段组合的拆分规则。规则包含两部分:
分隔符:系统中预置了9种常用的分隔符。用户也可以自己输入任意的符号。

字段名称和类型:用户想拆几个字段就要输入几个字段名称,并且每个字段名称都要选择对应的字段类型。字段名称的前后顺序决定了拆分内容的顺序。
当用户需要将例1中的申报单位拆分成两个字段,那么第一个字段名称是公司信用代码,这个字段是数字和英文组成的,所以字段类型应该选择“数字英文”;第二个字段是公司名称,系统字段类型中有“公司名称”,
标注多字段组合
1 应用场景业务单据录入的过程中,有一种常见的情况:图像上待识别的文本内容需要拆分后才能填入电子表单对应的字段中。比如客户业务系统...
点击下载文档文档为doc格式
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。
上一篇
已经是第一篇



