数据对比方案介绍
1 简介
1.1 功能介绍
为了用户可以更直观地、更方便地对比数据集成过程中源数据和目标数据的差异信息,提供了“数据差异分析对比”功能。
此功能支持创建数据对比分析方案,选择数据集成方案,全量对比或自定义数据对比范围。通过方案的执行,实时展示源数据和目标数据之间的差异,并呈现分析结果。
目前支持“目标数据是否存在”、“目标数据是否更新”(可自定义时间戳属性和更新判断表达式)两种对比策略。
1.2 应用场景
目标单是否存在:对比分析源数据和目标数据,得到目标对象中“是否存在”源对象中的相应数据的结果
目标单是否更新:对比分析源数据和目标数据,得到源对象中的“最新数据”是否同步到目标对象的结果
1.3 系统路径
【集成管理】→【数据治理】→【数据对比方案】
1.4 字段/按钮说明
字段说明
字段名称 | 详细解释 |
数据集成方案 | F7选择一个需要进行数据对比的数据集成方案,则对比的对象为该集成方案中包含的源对象和目标对象 |
数据对比编码 | 默认根据所选数据集成方案自动带出,在数据集成编码加后缀“-DATACOMP”,可修改 |
数据对比名称 | 默认根据所选数据集成方案自动带出,在数据集成名称加后缀“-数据对比”,可修改 |
方案分类 | 通用方案分类用法 |
对比策略 |
|
源单时间戳属性 | 选择源对象中作为更新判断依据的字段 |
目标单时间戳属性 | 选择目标对象中作为更新判断依据的字段 |
判断表达式 | 用于描述判断更新的关系表达式,如果该表达式结果成立,则说明目标数据已经更新,否则未更新。默认生成的表达式仅供参考,可以手动修改满足判断是否更新的表达式,源字段前必须加“src.”目标字段前必须加“tar.”。 例如:src.a == tar.b, tar.b == 'X'等自定义满足条件的关系表达式 |
方案参数 | 用于【源单数据范围】字段中设置“比较值变量”参数。此处仅定义名称和类型等,变量值在对比方案执行时进行动态输入 |
源单数据范围 | 用于数据对比的范围控制条件的自定义,筛选满足条件的数据进行源数据和目标数据的对比 |
按钮说明
按钮名称 | 详细解释 |
新增 | 点击后新增数据对比方案新增页签,可以直接创建一个数据对比方案,选择一个数据集成方案,设置相应策略和条件进行对比分析 |
复制 | 在方案列表选择一个对比方案后,点击复制按钮,即可复制已有的数据对比方案,适用于在原方案基础上少量修改对比方案设置的场景 |
删除 | 删除数据对比方案,可多选批量删除多个条目,执行对比操作后存在对比结果的方案不能被删除 |
执行对比 | 在方案列表选择一个对比方案,点击执行对比按钮触发该对比方案的执行,实时对比数据差异 |
对比结果 | 在方案列表选择一个对比方案,点击对比结果按钮可展示该对比方案的所有历史对比记录 |
导出/导入方案 | 支持批量导出导入,默认导出.dts格式文件(导入仅支持该格式),可选择下拉框导出zip包 |
2 主要操作
2.1 新建数据对比方案
场景:对比EAS行政组织单元与苍穹行政组织单元数据的差异,查看EAS数据在苍穹是否存在,同时查看苍穹中已经存在的数据在与EAS是否同步更新。
【操作步骤】
步骤1:新增方案
进入【集成管理】→【数据治理】→【数据对比方案】功能,点击“新增”按钮进入数据对比方案页面。
步骤2:选择数据集成方案
选择预置的“EAS-苍穹”行政组织单元集成方案。
步骤3:选择对比策略
选择“目标单是否更新”策略,选择源单时间戳属性和目标单时间戳属性,带出默认的判断表达式(也可自定义)。
步骤4:高级设置-控制源单数据范围设置
例如:设置一个参数用于执行数据对比时筛选编码为某个值开头的行政组织单元。
首先在“高级设置-方案参数”页签,添加方案的参数信息。
然后在“高级设置-源单数据范围”页签,选择元数据属性「number」作为条件字段,并选择方案参数作为比较值变量。
2.2 执行数据对比方案
【操作步骤】
保存方案后,点击“执行对比”按钮,输入参数值,执行数据对比方案。
2.3 查看数据对比结果
执行完成后,可点击“对比结果”查看数据对比方案的执行结果详情。
3 数据对比方案典型使用场景介绍
3.1 对比EAS中币别是否在苍穹中存在
对比方案配置:
数据集成方案:“预置_币别(EAS-苍穹)”
对比策略:“目标单是否存在”
使用场景:
完全不匹配:
数据集成方案首次启动同步前,目标数据为空。执行对比方案后,目标单缺失行数等于源单行数,状态为「完全不匹配」,结论为“目标单缺失行数:xxx行,请及时同步”。
部分匹配:
数据集成方案启动同步若部分成功,执行对比方案后,目标单缺失行数小于源单行数,状态为「部分匹配」,结论为“目标单缺失行数:xxx行,请及时同步”,日志中可查看具体缺失数据的信息。
完全匹配:
数据集成方案同步全部成功,执行对比方案,结论为“目标单缺失行数为无”,状态为「完全匹配」。
3.2 对比EAS人员数据更新是否同步到苍穹中
对比方案配置:
数据集成方案:“预置_人员信息(EAS-苍穹)”
对比策略:“目标单是否更新”
源单时间戳属性:“lastUpdateTime”,此处选择“最后修改时间”字段作为时间戳,可以跟踪到EAS数据修改时间。
目标单时间戳属性:“modifytime”,此处选择“修改时间”字段作为时间戳,可以跟踪到苍穹数据修改时间。
判断表达式:“src.lastUpdateTime <= tar.modifytime”, 这里是默认带出来的时间属性比较的判断表达式,意思是EAS数据最后修改时间小于或等于苍穹数据修改时间,即EAS数据有更新后再同步到苍穹,符合数据更新判断条件定义,可以判断所有信息的更新状态。
注意:其他使用方式如:修改的仅是人员信息的生效时间,那么所选源单时间戳属性改为“生效时间EFFDT”,目标单属性改为“开始时间startdate”,判断表达式需要改为“src.EFFDT == tar.startdate”才是判断数据更新的条件。
使用场景:
目标单没有数据:
数据集成方案首次启动同步前,目标数据为空,执行对比方案,目标单缺失行数等于源单行数,目标单未更新行数为无,结论为“目标单缺失行数:xxx行,请及时同步"。
目标单部分更新:
数据集成方案启动同步若部分成功,执行对比方案,目标单缺失行数小于源单行数,目标单未更新行数为无,结论为“目标单缺失行数:xxx行,请及时同步”。
目标单全部更新:
数据集成方案同步全部成功,执行对比方案,结论为目标单缺失行数为无,目标单未更新行数为无,结论为“该对比策略下,源和目标数据一致”。
增量未更新:
EAS修改人员信息,未启动数据集成方案进行数据同步;执行对比方案,结论为目标单缺失行数为无,目标单未更新行数为1,结论为“目标单未更新行数:1行,请及时同步”,日志中可查看具体未更新数据的信息。
数据对比方案介绍
本文2024-09-23 00:49:15发表“云苍穹知识”栏目。
本文链接:https://wenku.my7c.com/article/kingdee-cangqiong-141953.html