【轻分析】操作手册
1 主题式轻分析
轻分析提供以下功能:
• 数据建模
利用数据建模工具完成对数据的抽取和转换,将来自各种数据源的数据转为轻分析可识别的数据以便进行分析。
• 数据分析
通过简单拖拽完成多维透视的图表呈现;提供丰富的数据可视化效果,更强大的数据交互功能、高级分析能力;支持发布到移动轻应用并分享。
要使用轻分析功能,首先需要进入主题管理页签。该页签的左半部分为业务主题分类的列表,您可以在这里新建、修改和删除分类;而右半部分为当前所选分类下的所有主题。
点击【新建业务主题】按钮,在弹出窗口中输入主题名称、描述等信息后,点击【确定】按钮保存。光标悬停在主题上方时,卡片右上角显示修改和删除图标,点击后可修改主题的名称和描述信息,或者删除主题。
而点击卡片右下角的“”图标时,可将主题移动到其它分类下。点击“”图标则会在所选分类下复制主题,并选择是否携带分析方案,如下图所示:
对于新建的主题,我们首先需要进行数据建模(点击“”图标进入),引入待分析的数据表后,才能针对数据进行数据分析(点击“”图标进入)。下面详细描述。
1.1 数据建模
点击“”图标打开数据建模页签,如下图所示。
在该页签中,用户可以新建数据表,然后创建数据表之间的关系,最后设置数据提取策略。
1.1.1 数据表
1.1.1.1 利用向导新建数据表
第一步,选择数据源。
数据源支持三种类型:业务实体、数据库、文件。
业务实体支持:EAS 实体、EAS Query、当前数据中心。
数据库支持十二种类型,分别为:SQL Server、Oracle、MySQL、Postgre SQL、DB2、Access、SQLite、HIVE、HANA、ODPS、Amazon Redshift、SYBASE。
文件支持三种类型,分别为:Excel、CSV、TXT。
下面以SQL Server数据库为例来说明如何新建数据表。如下图所示,选择<SQL Server>后,点击【下一步】按钮。
第二步,连接数据库服务器。
需要输入数据库的连接信息,包括服务器、端口及登录信息。点击【连接】按钮进行连接测试,连接成功可进行选数据库及类型的操作,连接失败则提示“数据库连接异常,请检查连接”。如下图所示:
第三步,选择表。
选择数据库后,若类型选择<表>,则点击【下一步】按钮后窗口如下图所示,左栏列出数据库中的所有表。勾选某个表后,可预览该表的数据,且“已选表”栏中显示该表的名称。在“已选栏”中,点击【全部清除】按钮清除所有已选表;而当光标悬停在某个已选表上方时显示“”图标,点击后删除该表。
第四步,选择字段。
如下图所示,可选择每个表的字段。对于每个表,默认选择所有字段,勾选了的字段才会进行抽取。可以对每个表逐一进行设置,任意表的字段不可以全部为反勾选状态,否则会在点击【完成】按钮时提示“请确保每个数据表都有选中字段”。
最后,点击【完成】按钮,完成数据表的新建,如下图所示。
在第二步中,若类型选择<自定义SQL >,则需要手动自定义SQL名称及查询语句。如下图所示。
在数据表页签中,对新建的数据表(图标为“”)/自定义SQL(图标为“”),可进行如下操作:修改连接、重命名、选择字段/编辑SQL、添加计算字段、删除。如下图所示。
下面详细描述。
1.1.1.2 修改数据源
点击〖数据源〗菜单后打开窗口显示对应数据库的连接信息,以及修改后的数据源是否同时作用于同一数据库的其它数据表。
1.1.1.3 选择字段/编辑SQL
选中数据表,点击〖选择字段〗菜单后打开选择字段窗口,可重新选择字段。
而对于自定义SQL,菜单名称为〖编辑SQL…〗,点击后打开编辑SQL窗口,可修改名称及查询语句。
1.1.1.4 新建计算字段
点击〖新建计算字段〗后打开公式编辑器窗口,可创建计算字段,如下图所示:
支持的函数包括:字符串函数、日期和时间函数、逻辑函数、数学与三角函数、类型转换函数。
保存后的计算字段如下图所示,字段名称显示为“(计算字段)”。可对计算字段进行编辑、删除、修改显示名称、数据类型、数字格式、在分析中隐藏操作。注意,此处添加的计算字段不能在分析中进行修改。
温馨提醒:这里的函数不包括聚合函数。
1.1.1.5 重命名/删除
点击〖重命名〗菜单后,当前数据表的名称将处于编辑状态。
点击〖删除〗菜单,用户确认后删除当前数据表。若该数据表已设置连接,则与其连接的关系也将一起删除。
1.1.1.6 字段设置和过滤
选中左栏的数据表后,右栏上方显示该表的数据,仅显示前10条。而在右栏下方的“字段”页签中,可对字段的<显示名称>、<数据类型>、<数字格式>、<在分析中隐藏>进行设置。
切换到“过滤”页签,可设置数据表的过滤条件,如下图所示。光标悬停在某行上方时,右侧会显示【插入】和【删除】按钮。点击【插入】按钮在当前行的上方插入一行,而点击【删除】按钮删除当前行。
选择字段、比较符号,并输入比较值。设置过滤条件之后,右栏上方置灰并显示“编辑完成后,点击此处刷新预览数据”,鼠标点击后显示根据过滤条件筛选后的前10条数据。
1.1.1.7 合并数据表
数据建模的合并数据表功能,可将不同来源、相同结构的多个数据表合并到一个数据表中进行分析。
合并数据表
(1)进入数据建模,选中要合并的数据表,将鼠标滑到数据表右侧会显示出“”图标,点击该图标在弹出的下拉菜单中选择【合并数据表】。
(2)在弹出的“合并数据表-选择数据源”窗口,选择一个数据库或者平面数据文件作为数据源,点击【下一步】。
(3)如果在上一步中选择的是数据库,请输入数据库连接信息。选择的是平面数据文件,请上传文件,完成后点击【下一步】。
(4)在弹出的“合并数据表-选择表”窗口,选择一个数据表,点击【下一步】。
(5)在弹出的“合并数据表-字段匹配”窗口,系统会根据字段名称自动将新增数据表和初始数据表中的字段匹配。点击新增数据表字段,会弹出数据表中所有字段,也可自行选择字段进行匹配,设置完成后点击【完成】。
(6)点击完成后,可在数据预览界面看到当前数据表的总行数信息,如果数据较少,也可看到新增的合并数据。(数据预览界面,只显示数据表中前10行数据)
修改合并状态
合并完数据表,如果想删除新增的数据表,或修改对应匹配字段。可以在数据建模中,选中该合并数据表,将鼠标滑到数据表右侧会显示出“”图标,点击该图标在弹出的下拉菜单中选择【修改合并状态】。
在弹出的“修改合并状态”窗口,点击数据表上的删除“ ”图标,可将数据表删除。点击字段右侧的“ ”图标,将弹出数据表中所有字段,可自行调整匹配的字段。
1.1.2 关系
关系页签呈现数据表间的关系,工具栏有【保存】及【新建关系】两个按钮。页签左边显示关系列表,右边显示数据表的关联情况。
点击【新建关系】按钮弹出新建关系窗口,如下图所示,可设置要关联的数据表及字段。两表间只能有一对关系,因此每个数据表只能选择一个字段进行关联。关系分为<一对一>、<一对多>和<多对一>三种,可根据实际业务场景确定采用哪种关系。点击【确定】按钮保存关系,此时在左栏的关系列表中新增一对关系,名称为〖数据表1-数据表2〗;同时右栏上方对应的数据表间会多出一条连接线,连接线两端通过1或*来标明两数据表间的关系;右栏下方显示关系的内容,可修改这对关系中关联的字段,但不能修改关联的两个数据表。
此外,当光标移动到关系名称上时出现删除图标,点击后可删除该关系。删除关系后数据表间的连接线被去除。
温馨提醒:“数据表”页签只有一个数据表或者无数据表时,在“关系”页签点击【新建关系】时会提示“两个以上的数据表才可以建立关系”。
1.1.3 设置
“设置”页签可设置数据提取策略,可选择<实时提取>及<定时预提取>策略,默认选择<实时提取>。
若选择<实时提取>,则每次打开分析页面时都会抽取最新的数据用于分析,这样打开轻分析页签前可能需要较长的数据准备时间。
若选择<定时预提取>,则可设置调度,打开轻分析页面时抽取的是最后一次调度生成的数据。调度周期可设为<每月>、<每周>、<每天>、<自定义>:
• 每月:可以选择每月的第几天或最后一天,并确定具体时间点。
• 每周:可以选择每周的星期几,可多选,并确定具体时间点。
• 每天:只需确定具体时间点。
• 自定义:可以自定义具体时间点。
最后,点击工具栏的【保存】按钮,提示“保存成功”后保存数据模型。
1.2 数据分析
点击“”图标后,首先进行数据准备,准备完成后将打开轻分析页签,如下图所示。
在轻分析页签中,左侧栏分成3部分:字段区域、功能区域和图表类型区域,默认是展开状态,也可以点击“”图标收起来。
左侧栏上方列出在数据建模中选择的所有字段,并按数据表名称进行分组。目前支持三种类型的字段,分别为:数值型()、日期型()、文本型()。
左侧栏中间显示筛选器、行、列、数值区域等功能区,可将字段拖到对应的功能区,并根据所选的图表类型,在右栏的数据视图中计算呈现相应的数据可视化结果。
左侧栏下方显示图表类型,目前支持9种图表类型,分别为:表格、柱形图、堆积柱形图、折线图、多系列折线图、面积图、饼图、热力图、树图。切换图标类型后,行、列、数值区域等功能区中的字段也会智能地调整,从而呈现最佳的数据可视化结果。
右栏的数据视图由表(字段标签、表头、数据可视单元、轴等)、图例、筛选条件构成。
定义:
• 字段标签:添加到行或列功能区的字段名称,用以说明该字段的成员。例如,“类别”字段包含以下3个成员:“家具”、“办公用品”和“技术”。
• 表头:字段的成员。
• 数据可视单元:表示数据视图中所包括的字段(维度和度量)交集的数据,例如饼图的扇形,柱形图的柱子,表格的单元格等。
• 轴:是在将度量(包含定量数值信息的字段)添加到数据视图时创建的。
• 图例:描述数据视图中的可视化内容的图例。例如,如果您使用堆积柱形图创建了一张数据分析,则图例区会描述每个柱子中各色块所代表的维度含义。
• 筛选条件:添加到筛选器功能区的字段会生成数据视图中的筛选条件。如果字段是日期型或文本型,则显示为多选框组;若为数值型,则显示为滑块。
操作前提:进入“轻分析”页签前,先要进行数据建模,否则会提示“该数据分析没有对应数据,请先进行设置”。
1.2.1 可视化分析
1.2.1.1 拖拽分析
用户在选择图表类型后,只需要将一个或多个字段拖到筛选器、行、列、数值区域/值展现方式等功能区,即可开始数据分析工作。或者您也可以在选中多个字段(方法:按下[CTRL]快捷键,然后鼠标点击选择字段)后,再点击选中某个图表类型,也可智能地快速生成数据视图。
举例:要生成一张按地区、细分、年对销售额进行统计的数据分析,方法如下:
(1)选择图表类型:表格()。
(2)拖拽字段:将[地区]、[细分]字段拖到行功能区,将[订单日期]拖到列功能区(在下拉菜单中选择〖维度 → 年〗),将[销售额]字段拖到数值区域,度量方式默认为“求和”。
(3)保存为分析方案,名称为“销售金额统计(按地区、细分、年)”。
生成的数据分析可视化效果如下图所示:
温馨提醒:不同的图表,可操作性的功能区、功能区的名称及提示、值展现方式也有区别。
1.2.1.2 添加小计
在行、列功能区存在多个维度字段时,可对外层分组字段添加小计。
举例:对数据分析“销售金额统计(按地区、细分、年)”的“地区”维度添加小计,如下图所示:
1.2.1.3 添加总计
所有数据分析均可添加行、列总计,方法为:点击工具栏〖分析 → 合计 → 显示行总计/显示列总计〗。
举例:对数据分析“销售金额统计(按地区、细分、年)”添加行总计和列总计,效果如下图所示:
1.2.1.4 高级分析:环比、去年同期
对于环比增长率和同比增长率,可以利用轻分析提供的“环比”、“去年同期”功能快速完成计算,方法如下:
(1)维度中存在日期字段(同比:“年”、“年月”或“年月日”;环比:不为“精确值”)。
(2)选中数值区域中的度量字段,点击下拉菜单〖计算 → 环比/去年同期〗。
举例:下图所示数据分析展示各细分市场销售额的季度环比、同比增长率。
1.2.1.5 汇总计算方式:跟随度量、求和
度量字段的汇总计算方式默认为“跟随度量”(备注:这里的“汇总”指的是“小计”和“总计”),意思是汇总计算方式采用跟度量方式一样的方式进行计算。
举例:要统计EAS Cloud费用报销单的分录本位核定金额和分录本位报销金额,则将这两个字段的度量方式均设为“求和”,而汇总计算方式均设为“跟随度量”即可,意思就是小计值和总计值也是采用求和的方式进行计算的。若度量方式设为“最大值”,则汇总计算方式为“跟随度量”时表明小计和总计值也是通过求最大值的方式进行计算的。如下图所示:
但是在某些场景下,例如,单据存在多条分录和单头度量字段时,此汇总计算方式的结果不可靠。
举例:EAS Cloud中的费用报销单,除了在分录中存在度量字段(如“分录本位核定金额”、“分录本位报销金额”)外,在单头中也存在度量字段(如“付现金额”)。因此,单据有多条分录时,对单头度量字段采取默认的度量方式或者汇总计算方式,会导致结果不正确。下图截图所示为基础数据源的部分数据:
其中,单据“HQbx20141203051”的付现金额为2000¥,它有两条分录。
轻分析提供了三种度量方式(“最大值”、“最小值”、“平均值”)和汇总计算方式(求和“”)支持对多分录单据的单头度量字段进行统计,方法如下:
(1)将单头度量字段拖到数值区域,度量方式设为“最大值”。
(2)将单头度量字段的汇总计算方式设置为“求和”。
1.2.1.6 筛选器
日期类型的字段拖到筛选器区域时,用户需要选择对日期字段的什么值进行筛选,包括:<年>、<季度>、<月>、<日>、<年月>、<年月日>。点击【确定】按钮后,在数据视图的右侧显示为多选框组。如下图所示:
而数值型字段(非聚合字段)拖到筛选器区域时,用户需要选择对数值型字段的什么值进行筛选,包括:<原始值>、<求和>、<平均值>、<计数>、<最大值>、<最小值>、<去重计数>。例如,选择<求和>后,点击【确定】按钮,将会在数据视图的右侧显示一个滑块筛选器。如下图所示:
文本型字段则可以直接拖到筛选器区域中,在数据视图的右侧显示为多选框组。
筛选器功能区存在多个字段时,可设置联动。
举例:在下图所示的数据分析中,将[类别]、[子类别]这两个文本型字段拖到筛选器功能区中,然后在数据视图的“子类别”的下拉菜单中选择〖备选值仅为相关值〗,则当类别选择“技术”时,子类别的备选值仅显示技术的子类别,而不是全部值。
1.2.1.7 图表设置
当图表类型选择除了表格外的其他图表时,还可设置是否显示图表标签,方法为:点击工具栏〖分析→ 显示图表标签〗菜单。
特别地,对于饼图,还可通过“图表设置”功能进行更多设置:
(1)显示前N项,其余项显示为“其它”。
(2)当显示图表标签时,可选择展现<名称>、<数值>或者<百分比>。
(3)当数据为负值时,可选择<负值不显示>,或<负值使用绝对值>。
举例:下图所示为各细分市场每年的子类别的销售额占比,仅显示前3项,其余项显示为“其它”,且图表标签仅显示“名称”。效果如下图所示:
1.2.1.8 查看数据
光标悬停在数据视图中的数据可视单元上时,例如表格中的单元格、柱形图的柱子、堆积柱形图的柱子中的每个色块、饼图的扇形区域、折线图中的点等,会显示行列方向上对应的维度成员和聚合度量值。而点击选中数据可视单元时,还可以查看明细数据。
举例:下图所示为各细分市场子类别的热力图分析,颜色的深浅表示利润的大小,而色块的面积大小表示销售额的大小。
点击某个数据可视单元,在提示面板中点击【查看数据】按钮,弹出窗口如下图所示。反勾选<显示所有字段>,则仅显示与当前数据可视单元相关的行、列、数值区域/值展现方式区域中的字段及未聚合的明细数据。另外,可将当前窗口中的数据导出到Excel。
1.2.1.9 其它:行列置换/撤销/重做/清除、排序、调整行高和列宽、数字格式
行列置换功能可以帮助用户快速的交换行功能区和列功能区的字段。
通过【撤销】按钮,可以一步一步地撤销之前的操作,而点击【重做】按钮后则可恢复已撤销的操作。
点击【清除】按钮,则会将当前页面恢复至初始状态。
而通过点击数据视图中的排序图标,可以对行、列功能区上的维度字段的成员进行升序或降序排列。如下图所示:
光标悬停在行表头或列表头的边框上时,形状变为“”,此时可以手动调整表格的行高或列宽,如下图所示:
对于数值型字段,可设置其数字格式,如下图所示:
设置完成后,将字段拖到功能区,可以看到数据视图中字段的数字格式:
或者,您也可以先将数值型字段拖到功能区,然后在下拉菜单中点击〖数字格式…〗,如下图所示,在弹出的窗口中设置数字格式。设置完成后,点击弹出窗口工具栏的【应用】按钮,则会将新的数字格式立即应用于数据视图。
1.2.2 创建计算字段
如果基础数据未包括用户所需的所有字段,则可以在轻分析中通过公式编辑器使用标准函数和运算符定义一个基于现有字段和其他计算字段的公式,然后保存为计算字段。
若要打开公式编辑器,则需要选择一个数据表或者该表下的某个字段(假设该数据表为Table1),然后点击“”,在下拉菜单中点击〖创建计算字段…〗。在打开的窗口中,用户可以按类别选择函数,也可以在“输入搜索文本”区域中输入关键字以便查找匹配的函数,或者查看所选函数的说明。用户输入计算字段名称和表达式后,点击【确定】按钮将计算字段保存至Table1分组下。计算字段的数据类型图标前会显示“=”。
输入表达式时,系统会自动进行语法校验。“”表示校验通过,未检验到语法错误;“”表示校验不通过,并提示错误原因。
目前共支持64个函数,包括:字符串函数、日期和时间函数、逻辑函数、数学与三角函数、类型转换函数、聚合函数。详见附录。
• 创建聚合计算
当表达式包含一个或多个聚合函数(目前支持的聚合函数有:AVG、COUNT、COUNTD、MAX、MIN、SUM)时,称其为聚合计算。当将聚合计算放在功能区上时,它的前面会显示“聚合”二字。
当创建聚合计算时,无法再进行其他聚合计算。因此,将聚合字段拖动到行、列或数值区域等功能区后,下拉菜单中不会显示〖度量〗菜单。
聚合计算适用的规则是:
• 任何聚合计算中不得同时包括聚合值和非聚合值。例如,SUM([单价])*[数量] 不是有效表达式,原因是 SUM([单价]) 是聚合的,而[数量]则不是。不过,SUM([单价]* [数量]) 和 SUM([单价])*SUM([数量]) 都有效。
• 表达式中的常量可根据情况充当聚合值或非聚合值。例如:例如:SUM([单价]*7) 和 SUM([单价])*7 都是有效表达式。
• 所有函数都可用聚合值进行计算。但是,任何给定函数的参数必须或者全部聚合,或者全部不聚合。例如:MAX(SUM([销售额]),[利润]) 不是有效表达式,原因是[销售额]是聚合的,而[利润]则不是。不过,MAX(SUM([销售额]),SUM([利润])) 是有效表达式。
例如,对销售额进行颜色编码,使超过100000的销售额显示为绿色,低于100000的销售额显示为红色。
在“数值区域”功能区中,将该字段的值展现方式设置为< 颜色>,则效果如下图所示:
【轻分析】操作手册
本文2024-09-22 18:11:42发表“eas cloud知识”栏目。
本文链接:https://wenku.my7c.com/article/kingdee-eas-99223.html