组合识别器:混合文件识别一次搞定

费用报销涉及的业务种类繁多,所需要的附件样式丰富,包括各种签字单、明细表、支付截图等类型的文件。这些附件的内容、格式不像发票一样规范统一,想要判断附件内容是否合规,大部分情况下依赖于人工,自动化程度相对较低。
我们知道处理非结构化的文件依赖AI算法,而一种算法服务只能识别一类文件,如银行回单识别服务只能识别图像或pdf格式的电子回单。要想在一个业务场景下识别多种企业个性化的文件,目前常见的做法是让单据开发者在一个识别按钮中接入多种算法服务,这样无疑会提高用户选择操作上的门槛,与苍穹注重用户体验的理念背道而驰。
有什么方案既能满足混合文件的识别,又能带来友好的用户体验呢?视觉识别服务应用最新推出“组合识别器”特性就能实现,本期文章为大家详细介绍!
适用版本
金蝶云·苍穹V6.0.1及以上
功能速览
“组合识别器”允许业务单据开发者从自定义模板和预置模板中选择两个以上的算法服务进行组合,得到一个可以自动分类识别的新服务。
“组合识别器”的分类能力依赖于每个模板配置的关键词,以及自定义模板本身标注的锚点信息。
开发配置的具体操作如下:
01 新增“组合识别器”
在【文字识别】菜单中找到“组合识别器”,可进入“组合识别器列表”,点击“新增”。

新增“组合识别器”
填写“组合识别器”的名称以及描述,说明“组合识别器”能够分类的图片种类。
再在“模板信息”中选择预置模板和自定义模板中对应的能力,比如“增值税发票识别”、“护照识别”、“银行卡识别”等。

基础资料列表
为了分类更加准确,建议为每个模板配置分类的关键词。
关键词配置的规则如下:
1. 关键词需要是待分类图片中存在的独有的文字内容,不可与该分类器中其他模板的关键词重复(完全不能重复)。
2. 请确保输入的关键词在该版式的所有图片中均有出现。
3. 可以不输入关键词,最多支持输入5个关键词,请用英文逗号隔开。
4. 关键词只能为中英文,不可输入符号、表情及logo。

分类关键词
如果自定义模版中没有客户需要的识别服务,可以新增自定义的识别模板后再进行选择。自定义模板操作见 零基础创建文字识别AI模型。
02 测试(建议步骤)
保存配置后,“组合识别器”的状态为“未发布”,此时可以上传文件测试组合识别器的分类识别效果。上传的图片或者文件要满足测试要求,且尽量覆盖到组合识别器包含的全部模板。

测试
如果上传图片未包含在“组合识别器”能够区分的类别之内,会被判定为“未知类别”,不会输出任何识别结果。
03 发布
如对测试的分类识别结果满意,可以选择发布模板,这样模板才能在低代码配置或微服务、openAPI中使用。
如果发布后有修改“组合识别器”的内容,“组合
组合识别器:混合文件识别一次搞定
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。



