电脑桌面
添加蚂蚁七词文库到电脑桌面
安装后可以在桌面快捷访问

浅谈我所见识的数据治理项目

来源:金蝶云社区作者:金蝶2024-09-163

浅谈我所见识的数据治理项目

22.webp

开篇一张图 分享给大家


大家好,我是志明。


今天写点别人很少写的东西,本文主要根据自身经历,结合切身心得体悟,浅谈我所见识的数据治理项目,本文不谈理论不讲体系,文中不客观的事实还请各位看官多多担待,所有言论谨代表本人观点,与所在公司与客户无关


01、写在前面


熟悉笔者的朋友可能知道,笔者之前做的并非纯数据相关工作(产品或项目),笔者属于半路出家的数据人,之前也几乎没有直接接触过数据仓库、数据中台、数据平台等产品或项目,与数据库是一直打交道。要说真正与数据结缘,那得从16年8月起说起,当时因公司某些产品基于传统关系型数据库与一些开源数据仓库产品(如InfoBright)跑一些功能遇到了瓶颈——实在是跑不动。


当年临时从外地出差项目组抽调回北京公司总部,从0基础开始研究开源Hadoop+Hive+Spark[-SQL]+ES集群环境的搭建,到与产品进行整合,最后就是用一些淘汰的PC服务器和精简的Hadoop相关套件搭建起集群解决了当时跑不了、跑不动、跑不完痛点,也算是小有成就。


期间,遇过不少难题,走过不少弯路,掉进过不少坑,感谢这次机会,让笔者与数据结缘,之后所做之事就没离开过数据,路虽难,行则至;事虽难,做则成!



02、现状描述


早些年的数据项目大多数是以“XXX数据质量校验”、“XXX数据分析平台”、“XXX大数据项目”等常见的名称进行立项,而近些年多以“XXX数据治理项目”进行立项,叫啥不重要其实所做之事基本上与前面的差不多,无非就是数据采集、数据清洗、数据加工、数据质量、数据建模、数据挖掘、数据分析、数据共享、数据应用、数据展现(可视化、BI、报表、大屏),几乎都是短平快的项目,几乎也都是基于理想化的前提下进行项目实施,而最具价值的交付成果往往是“大屏”,其实项目目标也是实现了的,也算是MVP,但从长远角度考虑,还是远远不够的,后续可能会有很多推倒重来冲动,而又会顾虑前期的“工作成果”而不停妥协



受限于资源与成本(预算),很难有精力去考虑或沉下心规划更高、更深层次的东西,诸如:数据管理战略、数据管理框架、数据管理文化、数据管理组织、数据生命周期,及元数据管理、主数据管理、参考数据管理、数据安全管理等……学过DAMA-DMBOK2知识体系的都知道,万变不离其宗,基本市面上绝大多数与数据治理相关的产品都是基于其知识体系所构思和设计研发的,但是上一套这类系统是否就能彻底解决数据治理相关的问题了呢?

3.webp


DAMA-DMBOK2数据管理框架(DAMA车轮图)

4.webp

DAMA车轮图演变

或许大家都有思考,但是基本上思考这些问题的人往往只有IT部门+外包服务厂商的人员,业务部门的人员参与较少,也缺乏强有力的“一把手”牵头,部门墙、数据孤岛、数据烟囱该存在还是存在。



03、现状问题



一、从数据来源方面看
有数据标准却很难执行,无数据标准则更是头疼

大部分数据来源于外部(下级机构、平行部门、其他第三方),源头不可控,源头数据质量很难提前预判


二、从数据处理方面看
缺乏数据处理基准、标准、原则和流程,摸着石头过河,偶尔搬起石头手滑也会砸到自己脚,这些都是常态

数据处理过程中,通常很难提前知道数据质量的问题,大部分是做一点冒一点,发现一个反馈一个,发现问题的反馈路径和流程过于繁琐,或上游也很难在短期内改正,甚

浅谈我所见识的数据治理项目

开篇一张图 分享给大家大家好,我是志明。今天写点别人很少写的东西,本文主要根据自身经历,结合切身心得体悟,浅谈我所见识的数据治理项...
点击下载文档文档为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

已经是第一篇
确认删除?
回到顶部
客服QQ
  • 客服QQ点击这里给我发消息
QQ群
  • 答案:my7c点击这里加入QQ群
支持邮箱
微信
  • 微信