1、概述
高校作为知识密集型组织,具有大量的知识资本,其承担了创造知识、传播知识、使用知识、优化知识等职责。其拥有大量高层次人才和海量信息资源,在相关政策、科研环境方面有着独特的优势,为知识管理的执行提供了可行性。知识管理正在逐渐被各高校所接受,成为了高校改革中的重要组成部分。知识管理既是对人的管理,也是对信息的管理。通过知识管理,将信息技术对信息的处理能力与人的创新能力相结合,能为组织带来巨大的竞争力。数据挖掘技术作为一项新兴的信息技术,可对海量数据进行分析、处理,得出数据中的潜在信息。数据挖掘为知识管理的执行提供了支持,提高了知识管理的效率,有助于组织对知识的获取和共享。
2、国内外文献综述
挑选中国知网数据库,以“知识管理”为主题关键词进行精确检索,共找到 31,324 篇文献,其中 2004 年至2014 年间共发表文献 24,895 篇,近十年是知识管理领域研究的高峰期。以“高校知识管理”或“大学知识管理”为主题关键字进行精确检索,得到 248 篇相关文献,可发现针对高校的知识管理研究较少。针对结果进行二次检索,增加主题关键词“数据挖掘”得到相关文献 3 篇,表明对高校知识管理与数据挖掘技术结合的研究较少,所得文献主要观点包括:1.数据挖掘技术可用于高校知识发现;2.数据挖掘对知识管理体系建设有推动作用;3. 高校知识管理成果可通过数据挖掘技术进行评价。对国外学者的研究情况进行分析,挑选 Web ofScience 数据库。以“knowledge management”为主题关键字进行检索,共得到 62,474 篇文献,以“knowledgemanagement of college”为主题关键字检索,得到 647篇文献,再结合关键词“Data mining”,共得到文献 5 篇。由此可见,国外相关研究比国内多出近一倍,并且研究的程度深、范围广。但关于高校知识管理与具体信息技术结合应用的文献仍较少,且发表日期多为 2010 年后。
3、知识管理与数据挖掘结合的软件要求
知识管理与数据挖掘技术的结合运用对高校相关设备提出了一定的要求,包括对服务器、客户端计算机的硬件要求以及对知识管理平台、数据挖掘工具的软件要求,本文中将重点叙述软件要求。
知识管理平台要求
知识管理平台是高校知识管理的实施基础,它为高校人员提供了可视化的操作界面,其应实现的基本功能包括:1.数据接口;2.工具接口;3.数据挖掘(内置或外接);4.知识仓库;5.知识索引、推荐;6.信息检索;7.组织内交流;8. 管理评价。一个知识管理平台应分为:表现层、服务层、处理层、存储层。表现层是面向用户的可视化界面,用于人机交互,接受用户的任务;服务层对任务进行调度、处理,直接执行无需数据挖掘的任务并反馈至表现层,调度需要数据挖掘的任务至处理层;处理层负责数据预处理、数据挖掘、知识发现等功能;存储层包括校方数据库及知识仓库。具体层次如图 1 所示。根据高校组织的特征,知识管理平台应在实现基本功能的前提下具有以下特点:1. 接口质量高。高校集行政、科研、社会服务等任务于一体,需要处理海量数据,应提供接口以使用专业处理工具处理复杂任务,保证数据处理的效率与深度;2. 内置数据挖掘功能。高校所含数据种类多、范围广,对结构简单、数据量小的数据可直接使用内置数据挖掘功能处理,节省时间;3. 交流功能强。高校为知识密集型组织,其学科、职能间存在交叉,优秀的交流功能保证了知识的共享及创新。4. 完善的激励体系。激励体系不仅体现在平台的评价功能中,更体现在管理人员的管理中,通过提高人员的积极性促进知识管理进程的实施。
数据挖掘工具要求
高校所含知识从相关对象分类可分为两类:1. 管理知识,指高校各部门(教学、后勤部门等)用于高校管理的知识;2. 科研知识,指各学科的专业知识。前者主要与高校行政、管理人员相关,后者则与高校学者、教授关系更大。针对不同的用户,知识管理与数据挖掘的结合运用对数据挖掘软件提出了不同的要求。高校行政、管理人员所面对的数据多来自高校各类信息系统的记录,如:校园卡消费信息、机房上机信息,具有量大、范围广、结构一致等特点。用于该类数据挖掘的挖掘工具可内置于知识管理平台中,便于数据存取,提高挖掘速度。常用功能为预测、分类、评价三项,主要方法可选用回归分析、趋势外推、特征分类、层次分析、模糊综合评价法等。结合使用者特点,该类挖掘工具应提供独立的、具有既定模式的工作界面,减少用户与算法的接触,挖掘结果应具有较强可视性,提供图、表界面,以便用户理解。高校科研知识主要来自于学者、教授的科学研究,包括:实验数据、主观推测描述等,具有专业性强、层次深、结构复杂等特点。针对挖掘要求较低的数据,可使用知识管理平台中的内置挖掘工具,而针对挖掘要求高的数据,可选用专业数据挖掘软件,如:Intelligent Miner、QUEST 等,通过知识管理平台的接口进行对接。
4、知识管理与数据挖掘结合的具体策略
知识管理的基本职能可概括为外化、内化、中介、认知四大部分,其中前三项职能对信息技术的依赖较强,可用数据挖掘技术进行辅助。数据挖掘的过程分为条件匹配、选择、激活、应用四部分,即对数据进行预处理后,选择相关数据记录,根据用户要求选择相应技术进行数据挖掘,得出并解释数据挖掘结果,最终将这些记录应用于实践中。两者的具体结合策略如下:
辅助知识管理体系建设
知识管理本质是一个周期性管理过程,在这一过程中实现组织知识共享、创新等,最终提升组织综合实力,其中知识管理体系建设是实现知识管理的宏观条件。知识管理体系建设是一个系统、全面的工程,包括组织结构调整、确定激励制度、知识管理文化培养、成效评估等任务。数据挖掘技术,可以为知识管理体系建设提供依据,保证相关决策的科学性。数据挖掘对知识管理体系建设的帮助主要体现在以知识主管为主的知识管理部门对高校的管理、决策当中。知识管理部门收集并预处理外校、本校知识管理体系建设的相关数据,完成辅助决策的数据仓库的建设。管理人员可根据要求,从数据仓库中选择数据,利用对应模型完成挖掘,通过挖掘结果对决策做出帮助。以制定激励制度为例,管理人员选择与高校人员喜好相关的数据,如至少包含“部门”、“喜好”、“性别”字段,利用关联算法对其进行计算,即可得出各部门工作人员的喜好,以此为据制定相应激励制度。
知识外化
知识外化是指组织从组织外部获取与本组织相关的知识、发现归集组织内部存在的知识并进行存储以备用的过程。完成知识外化的关键即知识发现,其较为常用的方法包括主观归纳、隐性知识外显等。目前学界中较为认可、使用较普遍的方法即数据知识发现(KnowledgeDiscovery in Database, KDD),指从数据集中识别出表明一定模式的、有效的、潜在的信息归纳为知识的过程。这是数据挖掘与知识管理结合应用的最重要部分。同时,数据挖掘技术只给定挖掘目标,不给出假设、前提,因此在使用数据挖掘的过程中可获取一些计划外的知识,为知识管理提供一个可靠的知识源。此处存在两个前提:第一,知识发现不能仅仅依靠信息技术,更需要人员对挖掘结果进行主观归纳,解释其语义以完成知识的推理;第二,挖掘对象需进行预处理,并转化成逻辑数据。利用数据挖掘技术进行知识发现有多种可用方法:利用分类和聚类分析可提供知识索引和发现特殊情况下的离群值和孤立点,知识索引可细化知识所属领域和确定挖掘范围,离群值和孤立点可为挖掘人员提供归纳的线索,若其存在一定规律则可得出模型、规则;使用模糊技术、统计方法可得出对高校决策的评测分析,判断方案的有效性,并得出模式,用于同类决策处理;使用粗糙集和主成份分析法定义知识发现中的主要特征,结合已有知识库对不确定、不精准的知识进行细化;使用关联规则发现大量数据集各字段中潜在的联系。以关联规则的使用为例,选择 Apriori 算法,挖掘目的是发现学生学习情况中的潜在知识。首先从数据仓库中选出与学生课程成绩相关的数据集,包括姓名、院系、性别、课程号、课程类别、成绩等字段,进行预处理,将字段中的取值转化为逻辑值,代表不同语义,如:性别字段,男设值 1,女设值 2。操作人员设置最小支持度、置信度,通过数据挖掘工具进行挖掘,得出关联规则并进行解释。若结果显示 XX 院系、男生、A 类别 => 成绩优秀构成管理规则,则表示XX院系的男生对于A类别科目较感兴趣,学习成绩优秀,可在归纳后存入知识仓库。
知识内化、中介
知识内化是发现特定人员知识需求,并为其提供相应知识的过程,内化的关键是对知识的聚类、对人员的兴趣挖掘。知识中介是指组织中存在一定量无法编码储存的知识,针对这些知识,通过一定手段,将知识的需求者与知识来源进行匹配,为两者提供交流的途径。数据挖掘在知识内化、中介中所起的作用主要是对高校人员特征的挖掘。在利用数据挖掘技术发现知识后,通过知识管理平台进行分类存储、添加索引,作为备选。对高校人员数据库中数据进行挖掘,可利用聚类分析、预测模型等,得出特定人员的特长领域、兴趣爱好,从而根据先前设置的知识索引为其提供信息。若定期对人员特征数据进行挖掘,并根据结果为高校人员推送相关知识、信息,即可实现个性化推送,其推送内容由人员特征数据决定。高校组织中拥有大量教授、学者,其所拥有的知识是一笔巨大财富,加强相关领域间人员的交流、沟通,可以促进知识共享、创新,提升组织综合实力,这正是知识管理中介职能的作用。通过上文中相同的挖掘方法,在对教授、学者特征进行挖掘后,对他们的研究方向进行聚类分析,由挖掘结果,为相关人员提供合适的建议、利用知识管理平台为特征相似或同一聚类中的教授、学者提供交流的途径,进而促进知识的共享。
数据挖掘技术推动图书馆管理
图书馆是高校组织中的特殊资源,含有大量精确或模糊、成型或不成型的知识,是一种实体的知识仓库。对图书馆的有效管理有助于高校知识管理的实施。目前,已有不少图书馆专家将数据挖掘技术引入图书馆管理,提出了针对图书馆的数据挖掘应用理论。图书馆数据挖掘对象主要包括三个:1.图书信息;2.读者信息 3. 读者借阅信息。通过对三者挖掘结果的综合,可为图书馆资源建设、读者服务、个性化服务提供帮助。根据挖掘结果分析,可做到客观、合理引入资源,做到让数据说话而不是让管理人员说话,减少了管理人员个体的主观影响,使高校图书馆经费发挥最大效用;提升读者服务质量,在读者进行检索时减少等待时间,改变以往被动检索的情况,通过用户数据挖掘为用户提供主动的信息推送;提供个性化服务,以挖掘结果为依据,针对不同用户提供不同服务,比如不同的图书馆系统管理界面。
充分发挥管理职能
知识管理是一个系统工程,包含平台开发、体系构建、文化培养等,其在实践中设计大量的数据操作。数据挖掘技术可在知识管理的实践过程中为各项信息处理工作提供支撑,从而为操作人员提供便利,间接缩短知识管理的周期时间。将高校知识管理与数据挖掘技术相结合可有效促进知识管理具体操作中的工作效率。两者的结合对高校人员管理具有积极作用,数据挖掘与知识管理在实践中相互影响,提升操作人员素养。数据挖掘需要专业人员进行操作,操作人员的综合素养将决定挖掘成果的质量。知识管理可有效促进数据挖掘人员对知识的认知,使操作人员对不同要求所对应的挖掘技术、模型的选择更为准确,提升挖掘成果的质量,使知识更加清晰、独立、可接受。
5、总结
目前,越来越多的国内外学者开始着手研究知识管理、数据挖掘在高校中的运用,提高了高校运作效率,但同时我们也应看到所存在的问题,如:高校缺少专业素养优秀的操作人员、数据挖掘无法全面支持知识管理等。相信在逐一解决相关问题后,高校知识管理与数据挖掘的结合将为高校发展带来巨大的进步。
作者:郭少卿 单位:安徽大学管理学院