1大数据时代下的软件工程服务工程和群体软件工程
在软件工程的发挥在那中,近几年来面向服务的软件工程越来越多,即软件服务工程。以服务为建设的基本原则,根据实际需要进行变化,通过分布式的应用和互操作性虚拟化管理对对软件工程进行维护。通过这种方式,能够有效将网络中的软件虚拟化,强调互操作性,解决分布、动态变化情境下和异构环境下数据,解决的系统集成和协作的问题。在多个新兴领域中得到广泛的应用,例如云计算、移动互联网、大数据等。随着网络化、服务化的大环境,软件开发也逐渐变得开放,通过信息共享、学术交流,进行协同开发合作,在用户评价的基础上建设性价比较高的软件。其中,开源软件是目前较为成功的软件习作模式。因此,开源社区中的合作模式、结构等,也是学术界的研究重点。但是,常规的研究方法并没有较大的突破,一些学者开始使用社会网的方法对数据进行分析。发现在一些规模较大的项目中,开发组的结构逐渐从核心成员趋向外围开发者,并产生了更多模块化的特征。除了开源软件具备一定的典型性之外,群体软件工程中更提倡的是建立在众包基础上的开发方式。众包是一种分布式的解决方式和生产模式,无论是开源软件还是其他的商业软件都可以通过网络进行责任分配、提出创意或解决问题等。因此,在进行软件设计时,无论哪个阶段,都可以通过众包的方式对重难点问题进行分析。
2众包软件服务工程中的大数据
在软件服务工程中会产生大量的密集型数据,包括历史密集型数据和流式密集型数据。目前国际上已经有很多学者在关注众包软件服务工程中出现的密集型数据和流式数据,尤其是在线服务。如何将密集型数据的分析、价值、平台、基础设施等作为服务,是目前大数据时代背景下软件服务工程的核心问题。从众包软件服务工程来看,不管是服务消费方、众包服务开发提供方,还是平台管理和运营方,都有着离线密集型数据和在线的流式密集型数据。这些数据的传输直接决定了软件的服务寿命,和众包软件能否进行良好的开发协作、正常运行管理有着重要的关系。这些密集型数据,本质上仅仅对内容的数量进行了描述,但是并没有标注出内容的特点,缺少语义化单位矢量。因此在对密集型数据进行分析时,不仅仅要对原生数据进行分析,还要对密集型数据的主体——数据所属领域的专家进行分析。以知识为核心,对密集型数据进行分析,保证软件服务的寿命。
3密集型数据科研第四范式
在2007年,吉姆•葛雷提出了数据密集型科研发现“第四范式”的愿景。提出在进行密集数据的研究时,要建立统一的理论和研究方法,强调了大数据存储在计算机发展中的重要性。在实践研究中,传统的一、二、三范式的研究方法难以对密集型数据进行有效的分析,目前大多数的软件也无法在短时间内将这些信息进行有效的存储、管理为有效的服务信息。我国有学者在2012年,在进行大数据方面的研究时,不能仅仅局限在计算机模拟,即第三范式中。要建立独立的科研第四范式对密集型数据进行研究。其主要原因是密集型数据所需的研究方式和传统的研究方式有较大的区别,不仅要在研究方式上进行转变,还要转变思维模式。在进行研究时,首先要建立科学、完整的第四范式,当有了完整、统一的理论体系之后再逐步转变为第三范式。因此,在进行大数据的研究时,首先要确认第四范式的方法以及结构,并对存在的关键性问题进行分析。在对第四范式进行研究建设时,首先要对大数据整合驱动的软件服务价值进行分析。在对密集型数据进分析时,传统的数据生命期信息学流程已经难以适用,无法对大数据进行有效的模拟。要由原本的数据、信息、模型、模拟推演的过程逐渐转变为数据、信息、知识、价值服务、策略意义的第四范式模型。在全新的研究模式中,要对数据整合驱动、需求度量价值、情境约束等进行分析。其中,知识及价值服务是整个研究的基础和重点,要针对密集型数据整合服务领域,对密集型数据将的处理、管理、分析、应用等多个方面进行研究,建立统一的理论体系和研究方法,提高密集型数据生命期信息学流程驱动软件的服务生命期,对目前第四范式建立存在的问题进行针对性的解决,适应大数据时代的发展。
4结语
在大数据时代下,软件工程的发展涉及到多个领域,需要具备高度的专业性和实践性。在软件工程中,要在实践中进行研究,而不是在研究中进行实践,核心在于如何对传统的软件理论进行创新突破。在其中就涉及到有关大数据第四范式的理论和研究方法的问题,如何将其和第一、二、三范式的理论、算法、技术标准等进行融合。大数据在最初提出时具备三种特征:体量、增速和多样。随着时代的不断发展,大数据的特征也越来越多,如价值、真伪性、可证性、可变性等,对软件工程的发展有着重要的影响。在软件工程的研究中,要不断的创新传统的软件技术,解决限制软件工程发展的客观条件,结合互联网的发展,对大数据时代下的密集型数据进行有效的处理,促进行业发展。
作者:王符伟 单位:内蒙古鄂尔多斯市符尔锡科技信息有限公司