1主数据管理(MDM)
主数据管理是指通过一组规则、一些技术手段和一系列解决方案的实施,确保主数据的统一,保证业务数据在整个企业范围内的唯一性、完整性、关联性和准确性。主数据管理可以通过科学的整理和整合手段,实现企业范围内的主数据协同统一。主数据管理帮助企业对既有数据进行梳理、分类,并归并冗余,从分散的业务系统中将最重要的、共享频率高的业务主数据,集中进行数据清洗整理、转换,并加以丰富,然后再将这些标准、准确、完整的主数据反馈分发到各应用系统。主数据管理的实现,关键在于“管理”。主数据管理提供了一种提炼、共享主数据的方法,使企业能够对分散存储在各应用系统中的数据进行有效管理。通过有效的主数据管理,可以建立一个企业级数据标准,通过加强对各业务系统中比较共性的数据实体和模型进行管理,避免因业务概念出现较大偏差造成的数据信息谬误,从而降低企业内信息孤岛出现的几率,确保各应用系统之间能实现数据的逻辑关联和共享。进而更有效的加强各系统在企业层面的互动,在提高数据质量、信息集成的同时,提高企业的运营效益。实现主数据管理的重要意义在于:1)从企业业务层面来看,企业搭建了一个拥有统一访问接口的主数据规则库;拥有集中统一的、准确干净的集成数据中心;为企业各业务部门提供一致完整的、可信赖的共享数据信息交互平台;广义上讲,也为业务管理和经营决策层提供了可靠的支撑载体。2)从IT建设层面来看,实现主数据管理,构建覆盖全企业的数据管理基础和相应的数据管理规范,增强了IT架构的灵活性,有助于实时应对企业业务需求的变化,同时在一定程度上降低数据接口成本和管理维护成本。以某企业系统架构中主数据管理为例,主数据和各应用系统之间信息流交换流向及原理见图1,主要包括以下四个过程:1)业务系统数据信息的变更触发对企业主数据的变更;2)主数据管理系统将整合后统一、完整、精确的主数据反馈给所有关联应用系统(不仅是业务数据改变的系统);3)主数据管理系统通过创建数据字典实现对企业数据集成的要素定义;4)主数据管理系统为整个企业数据仓库系统提供准确有效的信息依据。
2国内外主数据管理发展现状
目前,业界市场已经涌现出一些成熟的主数据管理软件产品,如OracleMDM、SAPMDM主数据管理组件、IBMWebSphere的数据整合平台等,这些产品提供从咨询、建设、实施到培训等一系列服务,一定程度上为某些企业提供了主数据管理解决方案[2]。但是这些成熟的企业软件或组件并不能完全满足国内各类企业的具体业务需求,而且这些组件的实施需要很多其他软件的支撑,价格昂贵、实现周期长。因此,如何根据自身企业的业务需求和当前业务数据的存储现状,研究一套符合企业特色的主数据管理解决方案显得尤为重要。
3实例解决方案探索
通过研究国内外主数据管理产品,不难发现当前的主数据管理(MDM)产品主要功能大同小异,基本上都是进行数据分析、清理、整合、再进行发布利用。这也是本文探索适合自身企业的主数据管理解决方案时,可以沿用的一个思路。
3.1某科研院所应用系统数据管理主要存在的问题
1)数据信息不完整:例如,工号位数不标准,部分姓名前后有空格,历时数据保留期限不一致等;2)关联业务系统数据不同步:某员工工号在一个系统已删除,另一个系统还保留;3)数据冗余:例如一个员工在系统中以拼音和工号为员工ID分别进入了系统,产生同一员工的重复记录。由于数据源存于异构应用系统中,没有建立数据的统一服务机制,数据更新没有实时联动,也没有数据的清洗、去重机制,造成越来越多的数据错误。
3.2主数据管理的解决方案的思考
1)分析企业业务主数据来源,初步整理:了解分析主数据的来源和现状,产生不同数据源和应用环境下的数据集成的方案,获取业务主数据源;分析探究数据内容、结构的合理性,分析关联数据的冲突和问题,对各应用系统的相同数据条目进行识别、去重、整合,形成初步的主数据。2)建立企业主数据编码规范和数据字典:数据集成是企业应用系统集成的基础,对信息实统一标识是数据集成的前提。依据稳定性和完备性、继承性和扩展性的原则构造信息编码结构[3],通过信息编码来消除数据冗余。通过比对数据项的几个关键属性是否已经存在于主数据中,没有则视为全新数据,并为全新的数据项赋予按照预定义规则产生的唯一标识。建立统一的数据字典,建立标准的数据编码体系,构建企业编码数据库,从而形成企业的基础数据平台,为应用系统数据集成提供更有效的前提。3)建立企业业务主数据模型:建立适合本企业应用管理模式的MDM业务及数据模型,可以更方便有效地适应各种需求变化的挑战,数据建模也是大多数成熟的企业信息化管理的必经之路。4)数据一致性比对整理:对于各系统的数据出现不一致的定义及使用方式时,需要解决错误和矛盾之处,形成映射关系表,创建正确、完整的主数据系统。5)主数据的发布和使用:通过归纳整理,对企业各业务管理的主数据形成唯一的数据库,数据来源唯一,通过企业SOA架构将之发布为WebService服务,以供企业其他需要使用这些数据的业务系统调用。数据使用者对主数据中的元数据部分只能进行读取查看操作,对其扩展属性可增加和修改,但所有数据的来源必须保证是唯一的。以上五个步骤是一个循环往复的过程,主数据管理对数据治理的过程贯穿于整个生命周期,不断地识别、整理、整合形成准确、统一、完备的主数据共享给每个应用系统。
4结论
本文主要阐述了主数据和主数据管理的定义及分析,并对其解决方案提出了探索思路。主数据管理不是一次性工程,而是一个持续性项目,需要分阶段、分步骤开展工作。而科研院所的主数据管理更是处于一个探索的初级阶段,有待于各方面包括业务数据的整合、提炼和工具软件的引进相结合等等,这些工作循序渐进地开展,建立完善的主数据管理是一个任重道远的长期项目,需要持续地探索前进。
作者:陈亚杰 董俊 郑芳霖 王洋 单位:中国船舶重工集团第七〇四研究所