1数据挖掘技术简介
所谓的数据挖掘技术,顾名思义就是指在大量混乱的数据资源中找到自己所需要的信息数据,进而促使这些数据资源能够为自身的工作做出应有的贡献,充分实现数据信息的价值,具体来说,这种数据挖掘技术的应用主要包括了对于数据信息的分类、聚类以及差别分析等,进而便能够找出这些数据信息中的有用信息,避免无用信息的干扰,针对其具体的应用流程来说,主要包括了四个基本的环节,首先,针对所有的数据资源信息进行相应的选择,即初步选择出可能被使用的一些数据信息;其次,针对这些被选择出来的数据资源进行简单的预处理,进而把这些选择的数据信息转化为格式化的数据,以便能够进一步的被利用;再次,针对格式化的数据进行相应的挖掘,依据实际的数据内容需求进行恰当的处理,进而也就能够找出有用的一些数据信息资源;最后,针对这些挖掘出来的数据进行吸收使用,转化为可以被直接运用的各种信息,为具体的工作服务。具体到软件工程项目中来看,其中蕴含的信息量也是比较庞大的,这就给相应的软件工程人员带来了较大的麻烦,较大程度上增加了工作量,因此,应用数据挖掘技术也就显得极为必要,恰当的应用这种数据挖掘技术必然就能够在较大程度上提升软件工程中的数据处理效率,简化软件工程工作量。软件工程中数据挖掘技术的应用主要涉及到了分析、聚类、预测和统计等几个重要的技术应用,经过这几步也就能够在较大程度上提升软件工程数据处理的水平,为具体的工作提供较大的便利。
2软件工程中数据挖掘技术的应用
对于当前我国现阶段的软件工程项目来说,其涉及到的内容越来越复杂,工作的难度也正在不断增加,尤其是随着软件工程中数据信息量的增多,这种工作的难度也得到了进一步的加强,针对这一点来说,应用数据挖掘技术也就显得极为必要,就我国软件工程项目的发展来看,其对于数据挖掘技术的应用已经有了20多年的历史,并且也逐步的提升了其应用的范围和价值,在当前的软件工程中,其主要的应用价值表现在以下几个方面:
2.1数据挖掘技术在开源软件开发中的应用
对于具体的软件工程项目来说,开源软件的开发是极为重要的一个方面,所谓的开源软件其实也就是源代码,在针对源代码进行开发的过程中,必然会涉及到大量数据信息的参与,因此,在这一环节中,充分的应用数据挖掘技术就能够降低开源软件开发的难度,提升其开发的效率,并且对于最终的开源软件开发质量也具备较为理想的提升效果,此外,开源软件最为典型的一个特点就是其应用的范围比较广,并且大部分还都是免费试用的,因此,这也就给相应的开发管理带来了难度,在这一方面,数据挖掘技术的应用也具备着一定的应用价值,对于使用效率和使用质量的提升是极为有效的。
2.2数据挖掘技术在软件工程管理中的应用
在软件工程项目中,其相应的管理工作也是极为关键的,这种管理工作不仅仅对于软件工程项目中的相关组织人员的管理具备着极强的应用价值,还涉及到了很多软件版本的管理问题,在这两者的管理过程中,必然也就会涉及到大量的数据信息处理和使用,基于此,合理的应用数据挖掘技术也就显得极为必要,并且数据挖掘技术在这两方面都能够体现出自身的价值和作用。一方面,对于整个软件工程项目中的组织人员管理来说,其针对相应的人力资源进行有效的分析和调配本身其实就是一种数据的挖掘和处理,尤其是对于一些大型的软件工程项目而言,这种人员的组织构成更是极为繁琐,更需要应用相关的数据挖掘技术进行处理和分析;另外一方面,对于软件工程项目中相关版本信息的管理来说,因为其版本更新和修订的数据信息也是比较复杂的,因此,也就更需要进行相应的控制和管理和提升其效率,数据挖掘技术的使用在该方面也就体现出了较强的应用价值。
2.3数据挖掘技术在软件故障检测中的应用
在软件工程项目中,针对软件故障进行检测也是必不可少的一个关键环节,对于这一环节来说,充分的应用数据挖掘技术也是极为必要的,这种数据挖掘技术的应用确实能够提升软件故障检测的准确性和高效性,尤其是对于软件中故障的定位具备着较为理想的效果,比如序谱抽象表示出程序的执行轨迹这一方式的应用就是比较有效的。
3结束语
综上所述,在软件工程项目中合理的应用数据挖掘技术确实具备着极强的应用价值,对于软件工程项目的发展和提升来说意义重大,并且根据其具体的应用过程来看,其涉及到的应用内容和应用环节也是比较多的,这也进一步体现出了数据挖掘技术的巨大应用价值,值得相应的研究人员在今后针对这种数据挖掘技术及其在软件工程项目中的应用进行深入的研究和探讨,进一步的提升其自身的水平及其应用的价值。
作者:许文杰 单位:同济大学