3.2数据处理
本课题抽取2008级毕业生的人文科学分院语文教育专业的学生成绩信息,毕业信息和学籍信息。针对这些信息进行了数据清理、数据转换、数据加载的功能编程设计。从毕业生数据库中提取的基本信息表中,有少数学生已经退学或转专业以及中途参军入伍的学生信息将从列表中去除。使用SQL server2008的Analysis Services服务器建立多维数据表。七个维度分别是外汉语成绩、专业课成绩、实践能力、是否学生干部、单位性质。外汉语成绩大于等于85为优秀,介于60至85之间为合格,小于60为不合格。论文发表www.400qikan.com专业课成绩大于85为优秀,小于85为一般,教师口语、计算机基础、见习等列为实践能力成绩,大于85为优秀,小于85为一般。
将工作单位单位性质分为五类:教育机构包括中小学、幼儿园和培训中心的就业的学生,单位性质编码39;企业公司包括自主创业择业的学生,单位性质编码70;暂缓就业包括专升本或者成人本科的学生,单位性质编码为71;特岗教师包括考取地州县教师岗位的学生,单位性质编码为50;公职人员包括考取公务员的学生,单位性质编码为51。
3.3数据分类
根据决策树算法的信息增益理论,设计数据挖掘分析器,分析计算得出就业实例集增益值得柱形图。此页面可以对决策树的算法进行选择,并且对提取的就业实例集的数据根据信息增益率的计算公式进行分析计算,在分析图表中显示民族、性别、外汉语水平、专业成绩、实践能力各个属性的增益率,并用柱形图进行表示。选出最大属性的增益率后,复位后,重新计算下一个节点属性增益率的计算,只到遇到所有属性的增益率全部计算完毕停止计算。
由于属性“专业水平”具有最大信息增值率值,故而选择该属性作为决策树的根节点。对于每一个分枝,重复上述步骤。
3.4生成分类规则
数据挖掘分析器得出分类规则:
1) IF专业成绩=优秀+外汉语成绩=优秀+实践能力=优秀+民族=民THEN就业单位=50
2)IF专业成绩=优秀+外汉语成绩=优秀+实践能力=一般THEN就业单位=71
3) IF专业成绩=优秀+外汉语成绩=合格+实践能力=优秀+民族=汉 THEN就业单位=39
4) IF专业成绩=一般+外汉语成绩=合格+实践能力=一般 THEN就业单位=70
5) IF专业成绩=优秀+外汉语成绩=优秀+实践能力=一般+民族=汉THEN就业单位=51
6) IF专业成绩=优秀+外汉语成绩=优秀+实践能力=优秀+民族=汉THEN就业单位=71
3.5情况分析及建议
有(1)说明专业素质好,外汉语水平高,实践能力强的少数民族考取特岗的教师的可能性大。由(2)可知我校毕业学生学历为专科层次,在校期间专业成绩和外汉语成绩较好的学生都会通过复习通过专升本或成人高考提高学历。由(3)可知实践能力强的学生适合教育机构的需要,符合我校面向小学、学前教育培养教师的目标。另外,汉语水平相对较好的少数民族毕业生就业机会较大。在校期间少数民族学生如果担任学生干部,汉语水平相对较高。
由就业决策树图可知:专业成绩、外汉语成绩和实践能力是大学生提高就业率的重要因素,每一类就业单位都需要实践能力强的毕业生。
综上所述,提出两点建议:
1) 加强实践教学技能课程的设置。
2) 重视外汉语的教学,提高教学质量。
4 结论
本系统使用dephi2000和SQL server 2008开发,SQL server在开发数据库方面具有强大的功能,dephi能方便快捷的进行B/S模式下学生信息管理系统的界面和功能开发,用它实现数据库离散化,C4.5算法生成决策树以及分类规则,提供学生就业指导决策服务。
参考文献:
[1] 刘幸东.高校学生就业信息的决策支持系统的应用研究[D].广州:中山大学,2006.
[2] 李海琼.数据挖掘技术在辽宁大学就业辅助决策分析系统中的研究与应用[D].沈阳:沈阳工业大学,2009.
[3] 刘鹏,姚正,尹俊杰.一种有效的C4.5改进模型[J].清华大学学报,2006(46):996-997.
[4] 刘佳,王新伟.一种改进的C4.5算法及实验分析[J].计算机应用与软件,2008(12):260-262.
相关专题: 《电脑知识与技术》相关期刊
推荐期刊: