1系统架构
数据挖掘系统是以管理信息系统为基础建立的,是管理系统发展的升级,同时也是进行决策分析的基础条件,其中除了一小部分数据来自外部环境,大多数数据来自相关联管理系统的各级组织。所以,数据挖掘系统的建立应以完善的信息系统为基础。经过了大量的调查与了解,最终分析归纳出了在原有的学生学籍管理系统中存在的几个问题。(1)在许多学校中,学生的学籍管理工作多数采用手工填写的办法,这种方式不仅易于出现问题,而且其效率也是比较低下的。(2)在现有的管理方法中,学生的某些相关资料、数据都分散在各个部门中,他们的存储、管理都是不尽相同的,因此,这便造成了数据分散,难以共享的难题。(3)由于数据分散存放,而且格式还往往不一致,给管理工作带来很大的不便。由于学生学籍管理系统的现状,因此设计了基于数据挖掘技术的管理系统,对原有的以及现行的操作数据与大量数据实现了有效的管理。通过分析系统的流程与业务数据需求,构建起由学生学籍管理、成绩管理、奖惩管理以及毕业生毕业管理等结构模块组成的数据挖掘学籍管理系统,其系统功能结构图如图1所示。其中,对于学籍管理模块而言,主要对学生学籍进行管理,主要包括学生基本信息输入、查询、输出等功能,同时记录与处理学生学籍的变动情况等。同时,其还可以维护管理学生的某些其他参数,比如管理宿舍信息、班级信息等。奖惩模块的功能主要集中于对奖惩数据进行管理,主要包括奖惩项目输入、查询、输出等功能。成绩管理模块主要是对学生课程成绩加以管理,内容主要涵盖基础课程维护、设置、查询等,在成绩管理功能方面主要体现在成绩的录入、查询、修改与输出。对于毕业生毕业管理模块而言,主要对学生毕业信息加以管理,具体内容包括毕业生基本信息的录入、修改、编辑、查询及维护。为了能使该系统得以更好的维护,还需要增设维护模块,实现用户的添加、授权、删除等功能,同时可以导入、导出系统数据,对其他相关参数加以设置与维护。
2系统设计与实现
随着经济与技术的不断发展进步,计算机已经在各个行业得以应用与普及,人们在享受其所带来高效办公效率的同时,也被大量的数据所困扰。对数据加以简单处理的数据分析与管理模式已远不能满足人们的日常生活与工作需求,而需要对其进行深层次分析处理,从中找出相应的模式与规律,从而更好地进行数据研究与数据决策,使之成为对决策有价值的信息资源,这才是人们目前最为需要的一门技术。数据仓库正是针对上面的问题,而产生的一种新型的技术方案。
2.1数据仓库
上文已经提到,数据仓库是以数据库信息系统为基础而加以开发的,它的功能性主要体现于对数据加以有效的抽取、集成、综合与挖掘,为企业高层领导决策提供科学的数据支持与服务。而对于数据仓库系统的设计而言,是一个动态反馈与循环过程。首先,数据仓库信息能够用来辅以理解用户们的分析需求,从而向用户提供更为准确、更为有价值的决策信息。其次,对于数据仓库的数据内容、粒度、结构、分割以及其他的物理设计而言,都是对用户所返回的信息加以调整与完善,并以此来增强系统的性能与效率的。数据库的设计、数据加载策略的确定以及数据分析工具的建立,这3个部分组成了数据仓库的整个设计阶段。能否成功构造数据仓库,关键在于数据库的设计与创建。在对数据库系统的核心数据进行设计时,与传统的OLTP数据库设计一样,应经历概念模型、逻辑模型以及物理数据模型的设计3个阶段。而对于新型的数据仓库系统而言,可采用一种信息打包的方式对数据库进行设计,包含星形模型设计、信息包图设计和物理数据模型设计3个层次,如图2所示。学籍管理系统仅仅是数据仓库技术在教育领域的一个初步尝试,通过学籍管理系统功能实现,能够对数据库基础创建步骤、实施策略和相关关键技术加以清楚描述。
2.2数据挖掘
数据挖掘技术作为一种新型的数据分析技术,已经从一开始的只面向应用向面向多个行业转变,尤其是在银行、保险、电信、零售领域的应用较为广泛。但是,数据挖掘技术在教育领域的应用尚处于初级阶段,在信息化教育理念不断深入渗透的趋势下,将数据挖掘技术应用到教育领域势必会收到良好的效果。对于数据挖掘技术的定义有许多种,其中一种认可度较高,定义是:数据挖掘技术就是从庞大的数据库数据中提取出人们必要感兴趣、有价值的数据信息的技术处理方式,这些信息多是具有一定潜在价值的信息,可用其来表示一定的概念、规则与规律;这种定义方式将数据挖掘对象定义为数据库,而从广义的角度讲,数据挖掘技术是通过观察分析,或从事实数据的集合中,寻求一种模式的决策过程,其对象可以是数据库,也可以是其他事物,如文件系统等,同时也可是其他任意的数据集合。数据挖掘技术一般有包含以下几项功能:(1)描述功能:该功能首先是要找到描述数据的理解模式,其方法包括簇聚、概括、构造依赖模式、模式发现、路径发现数据分类、回归分析、变化和偏差分析等。(2)预测、验证功能:该种功能主要是利用数据库中的一些已知字段去预测验证其他未知字段值。其中,预测的方法可以有关联规则、统计分析方法、决策树预测方法、回归树预测方法等。对于常用的数据挖掘方法而言,包含模糊论方法、概念树方法,遗传算法、公式发现、神经网络方法等。数据挖掘技术主要有以下几个特点:(1)其处理的数据规模是十分巨大的,由于其主要是以一个大样本的统计规律为依据,因此其规则并不一定适用于所有数据;(2)因部分数据更新变化频率较高,很有可能会较快过时,这就需要对这些动态数据做出及时的反应,以此提供相应决策支持;(3)对于其查询功能而言,多是随机的,通常情况下是由用户提出的,很难形成精确的查询要求。
3结语
通过对“基于数据挖掘的学籍管理系统的设计与实现”课题的研究,不仅从理论上,而且还从实践上,为在学校中学籍管理系统全面运用数据挖掘技术、数据仓库技术、联机分析技术的开发与研究,提供了一整套较为有效的工具与方法。构建学籍管理系统,不仅极大地提高了学校信息管理数据的利用率,而且还增强了管理决策的科学性与合理性,还同时检验了数据挖掘技术应用到教育行业的可能性。
作者:余可春 单位:惠州商贸旅游高级职业技术学校