摘要:近年来,随着科学技术的迅猛发展,社会数据信息迅速膨胀,其中,农作物病虫害多源遥感数据呈指数级增长为农作物病虫害的监测带来了相当的困难。本文基于数据挖掘理论以及云计算技术,针对农作物病虫害多源遥感信息提出了一种基于云计算的数据挖掘架构。与传统数据挖掘架构相比,该架构在可扩展性和海量数据处理能力等方面具有更好的性能,可有效解决传统农作物病虫害多源遥感数据挖掘框架计算能力不足的问题。
关键字:云计算;农作物病虫害;多源遥感;数据挖掘
引言
近年来,随着科学技术的迅猛发展,我国在各领域、各方面都取得了长足的进步,农业也不例外,已实现了连续十一年增长。另一方面,由于我国人口众多,同时受气候特点、作物品种、种植习惯以及防治情况[1]等影响,我国农作物产量就人均量而言并不乐观。据联合国粮农组织估计,世界粮食产量常年因病害损失14%,虫害损失10%[2]。同样在我国,农作物病虫害也是影响农作物产量的重要原因之一。由于农田生态系统具有生态脆弱性,害虫的群落很容易对农田生态系统造成干扰,若不及时加以诊治,最终往往会导致爆发和流行病虫害的严重后果。随着全球气候逐渐变暖,病虫害对农田生态系统的威胁也会日益加重。我国作为农业大国,预防农作物病虫害、提高农作物产量、保证国内粮食安全形势依然严峻,有效应对农作物病虫害刻不容缓。然而,我国目前在农作物病虫害监测方面还有待加强,现有的应对方法依然十分落后,如人工抽样、农田调查等方式,这些方法准确性及稳定性较强,但是耗费了大量人力和财力,且存在代表性、时效性差和主观性强等弊端,已难以适应目前大范围的病虫害实时监测和预报的需求[3]。由于遥感技术可以在很大的范围内快速、准确地获得相关地貌信息,因此通过引入遥感技术,就可以达到有效改变传统农业管理模式的目的,起到对农作物病虫害的监测、农作物品质预报、农作物产量估计的作用。尤其是近年来随着世界范围精密仪器制造技术、测试控制技术的高速发展,遥感数据种类不断增多,这些数据为农作物病虫害提供了更多的数据依据,为农作物病虫害更准确、更快速的监测提供了宝贵的发展空间。
1农作物病虫害遥感数据挖掘分析
遥感的基本依据是获取来自地物的反射或发射的电磁波能量[4]。农作物病虫害遥感数据的基本信息来自于地物的反射以及捕获的电磁波能量阁,这种数据类型是由绿色农作物所散发出的光谱的变化趋势所决定的。一般情况下,光谱由蓝光波段到红外波段的反射率呈现递增的趋势,即光谱波长在450nm时反射率最小,当波长达到1300nm时其反射率最大。对同一种农作物来说,其叶片的结构是相对固定不变的,然而在不同的发育期,叶片的叶绿素含量将会呈现出规律的变化。当农作物受到病虫害等侵袭后,叶片的颜色就会出现相对复杂且无规律的变化,当受灾严重时,甚至叶片的结构、外形外观都会发生改变,这些过程都会伴随着叶片反射光谱的改变。因此通过对叶片颜色、结构、外形等遥感信息的捕获、挖掘与分析对于农作物长势的监测无疑是十分有利的。然而大量遥感信息积累而有用信息却相对匮乏的局面[5]决定了必须对其进行数据挖掘才能加以合理的利用。所谓数据挖掘就是从大量的、不完备的、模糊且随机的数据信息中识别有效的、实用的信息,并根据这些信息做出决策。在社会数据信息迅速膨胀、各种事业蓬勃发展的今天,无论从范围上还是从规模上,数据的增长都是显而易见的,其涵盖了社会生活及生产的许多领域,有来自普通应用领域的生活卡使用、商业信息、通信记录等,也有来自特殊应用行业的天文图像、生物分子信息等。这些信息资源,必须经过分析、挖掘、提炼等操作后,才能变成对人们有用的知识。通过对数据的分析,从海量信息资源中捕获规律,再以人们容易理解的方式表示出来,从而获得有价值的信息,这就是数据挖掘的过程。因此,作为数据信息的一种,农作物病虫害遥感数据信息挖掘与分析[6]也要经过类似其他遥感大数据[7]的分析流程:农作物目标确定、病虫害遥感数据准备、遥感数据挖掘以及结果分析,这些工作都是为了对农作物病虫害遥感数据进行处理而进行的。有效的数据挖掘与分析不仅可以大大减少不必要的资源浪费,而且还能够有效提高农作物质量以及产量。
2基于云计算的多源遥感数据挖掘方法分析
云计算概念的提出可以追溯到1983年,Sun公司首次提出了“网络就是计算机”的理论。之后的2006年,云计算这一理论性概念由Google正式提出并应用到实际项目中[8]。关于云计算目前尚没有明确的定义,它的实现并不是依赖于本地计算机或者远程服务器,而是将计算过程分布在大量的分布式计算机上,从而使计算能力可以像“煤气”一样通过互联网进行运输。如何利用云计算的相关成果促进国计民生行业的发展,已成为国家发展战略的重要组成部分[9]。云计算具有以下特点:(1)超大数据规模。云计算借助拥有的强大的服务器规模,可以处理超大规模的数据,且具有超乎想象的运行速度,每秒钟的运算能达到10万亿次以上。(2)运算虚拟化。云计算的整个运算过程是在云端进行的,它对于用户而言是透明的,但支持用户在任意位置、使用任意终端获得运算结果。(3)有偿性。云计算是一种付费式服务模式,它是通过提供的服务向用户收取费用。(4)通用性及可扩展性。云计算不针对具体应用,并可动态伸缩来满足不同用户的需要。遥感数据库有别于一般的关系型数据库,数据库中包含这大量时间和空间信息。随着遥感技术的发展,海量的遥感数据信息对之前简单数据服务模式提出了挑战。针对遥感技术发展带来的海量数据存储和处理需求[10],基于云计算的多源遥感数据挖掘分析算法应运而生。基于云计算的多源遥感数据挖掘过程主要包括以下几个方面:明确问题定义;提取多源遥感数据信息;数据预处理及过滤;多源遥感数据挖掘引擎;多源遥感数据算法;算法具体实施;执行结果评估;数据简化;实际应用。
3基于云计算的农作物病虫害多源遥感数据挖掘
为了顺应当前农作物病虫害监测技术发展的趋势,在一定程度上解决农作物病虫害遥感数据挖掘在实际操作中遇到的种种问题,从而有效提高农作物产量和质量,本文基于云计算以及遥感数据挖掘理论,针对农作物微型遥感数据的特点,提出了一种适用于云计算的农作物病虫害多源遥感数据挖掘系统架构,如图1所示。图1为多源遥感数据挖掘系统框架。首先将农作物病虫害多源遥感数据进行分类,然后再对分类后的遥感数据进行数据选择从而得到目标数据,经过信息处理、模式识别、信息解释等处理后得到有价值的知识,最终为农作物病虫害的监测提供数据依据。如图2为基于云计算的农作物病虫害多源遥感数据挖掘系统的构架。此系统构架采用分层设计的思想,自下而上主要包括云计算支撑平台、农作物病虫害遥感数据挖掘能力层、农作物病虫害遥感数据挖掘云服务层三个部分。其中,云计算支撑平台的主要功能是为整个系统提供分布式文件存储、数据库存储以及计算等功能,而数据挖掘能力层主要是为数据挖掘提供算法以及支撑,能力层主要包括算法服务管理、调度引擎、数据并行处理能部分;数据挖掘云服务层的主要功能是为外界提供云服务能力,包括挖掘算法服务、数据预处理服务、数据服务、调度服务等功能。本文提出的基于云计算的农作物病虫害多源遥感数据挖掘平台与传统的数据挖掘系统架构相比,前者具有更好的可扩展性、更高效的海量数据处理能力,有效的解决了传统农作物病虫害遥感数据挖掘框架计算能力不足的问题,能够满足大范围农作物病害虫多源遥感数据挖掘与分析的设计和实际应用。
4结束语
本文针对农作物病虫害多源遥感信息,基于数据挖掘理论和云计算技术理论,提出了一种基于云计算技术的农作物病害虫多源遥感信息的数据挖掘系统架构。本平台基于云计算技术实现了关于农作物病虫害多源遥感数据的挖掘构思,较传统的数据挖掘系统架构而言,具有更高的可扩展性记忆更高效的海量数据处理能力,有效的解决了传统农作物病虫害多源遥感数据挖掘框架计算能力不足的问题,更适用于大范围的农作物病虫害遥感数据挖掘与分析的设计和实际应用。
参考文献:
[1]霍治国,刘万才,邵振润,等.试论开展中国农作物病虫害危害流行的长期气象预测研究[J].自然灾害学报,2000,9(1):117-121.
[2]StrangeRN,ScottPR.PlantDisease:Athreattoglobalfoodsecurity[J].Annualreviewsphytopathol,2005,43:83-116.
[3]张竞成,袁琳,王纪华,等.作物病虫害遥感监测研究进展[J].农业工程学报,2012,28(20):1-11.
[4]日本卡农公司图像研究室.遥感一遥感技术的发展及其应用研究[M].王历译.北京:科学出版社,1983.36一44.
[5]宫辉力,赵文吉,李京.多源遥感数据挖掘系统技术框架[J].中国图像图形学报,2005,10(5):620-623.
[6]易玲,杨小唤,江东,刘红辉.农作物病虫害遥感监测研究进展[J].甘肃科学学报,2003,15(3):58-63.
[7]李德仁,张良培,夏桂松.遥感大数据自动分析与数据挖掘[J].测绘学报,2014,43(12):1211-1216.
[8]李乔,郑啸.云计算研究现状综述[J].计算机科学,2011,38(4):32-37.
[9]林闯,苏文博,孟坤,等.云计算安全:架构、机制与模型评价[J].计算机学报,2013,36(9):1765-1784.
[10]张树凡,吴新桥,曹宇,等.基于云计算的多源遥感数据服务系统研究[J].现代电子技术,2015,38(3):91-94.
作者:王长斌