本文作者:宋云华;柏文阳;周琦;成功正常投稿发表论文到《计算机应用》2014年01期,引用请注明来源400期刊网!
【摘要】:针对云计算平台的硬盘不可靠问题,提出基于带过采样的COG(COG-OS)框架,利用硬盘自我监测分析和报告技术(SMART)日志预测故障硬盘。首先采用DBScan或K-means聚类算法将无故障硬盘样本划分成多个不相交子集;再与故障硬盘样本结合,采用少量样本合成过采样技术(SMOTE)使整体样本集趋于平衡;最后采用LIBSVM分类算法预测故障硬盘。调整参数,将COG-OS与SMOTE+支持向量机(SVM)的预测性能相比较,实验结果表明该方法具有可行性。当采用K-means方法划分无故障盘样本,并采用径向基函数(RBF)内核的LIBSVM方法预测故障盘时,COG-OS改善了SMOTE+SVM对故障硬盘的预测查全率和整体性能。
【论文正文预览】:0引言在云计算平台的实际运营中,硬盘平均日故障率小于千分之一[1],云计算平台的硬盘故障预测是极不平衡的二分类数据集上的稀有类预测问题。其中,故障盘为稀有类(正类),无故障盘为多数类(负类)。类似的不平衡分类问题还有通过卫星图像检测石油喷井[2]、欺诈识别[3-4]、医院传
【文章分类号】:TP333.35
【稿件关键词】:COG-OS框架自我监测分析和报告技术K-均值少量样本合成过采样技术LIBSVM支持向量机
【参考文献】:
- 林智勇;郝志峰;杨晓伟;;不平衡数据分类的研究现状[J];计算机应用研究;2008年02期
- 谢纪刚;裘正定;;非平衡数据集Fisher线性判别模型[J];北京交通大学学报;2006年05期
- 张英俊;周海英;;基于分块主色调和纹理特征的彩色图像检索[J];电脑开发与应用;2010年02期
- 罗兵;;自动质量检测系统的性能评价指标[J];电子质量;2008年01期
- 李正欣;赵林度;;基于SMOTEBoost的非均衡数据集SVM分类器[J];系统工程;2008年05期
- 刘天羽;李国正;;大脑胶质瘤诊断中不均衡问题的特征选择[J];广西师范大学学报(自然科学版);2009年03期
- 朱明;陶新民;;基于随机下采样和SMOTE的不均衡SVM分类算法[J];信息技术;2012年01期
- 程华;房一泉;;基于聚类分析的网络流量高斯混合模型[J];华东理工大学学报(自然科学版);2010年02期
- Alma Lilia Garcia-Almanza;Edward P.K.Tsang;;Evolving Decision Rules to Predict Investment Opportunities[J];International Journal of Automation & Computing;2008年01期
- 邹权;郭茂祖;刘扬;王峻;;类别不平衡的分类方法及在生物信息学中的应用[J];计算机研究与发展;2010年08期
- 周广通;尹义龙;郭心建;董彩玲;;VOTCL及其在交叉销售问题上的应用研究[J];计算机研究与发展;2010年09期
- 陈志国;基于群体智能的机器视觉的关键技术研究[D];江南大学;2010年
- 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
- 李军;不平衡数据学习的研究[D];吉林大学;2011年
- 高赞;基于内容的视频分析关键技术[D];北京邮电大学;2011年
- 黄静华;支持向量机算法研究及在气象数据挖掘中的应用[D];中国矿业大学(北京);2011年
- 张婧;基于SVM的肺结节自动识别方法研究[D];华南理工大学;2011年
- 罗建宏;粒计算分类知识发现算法及其应用[D];浙江大学;2010年
- 郑恩辉;基于支持向量机的代价敏感数据挖掘研究与应用[D];浙江大学;2006年
- 刘万里;支持向量机中若干问题及应用研究[D];西安电子科技大学;2008年
- 谷琼;面向非均衡数据集的机器学习及在地学数据处理中的应用[D];中国地质大学;2009年
- 朱新荣;径向基函数神经网络集成算法的研究及应用[D];大连理工大学;2010年
- 饶裕平;基于视频的森林火灾识别方法研究[D];浙江农林大学;2010年
- 李明方;少数类数据识别方法及性能评价[D];山东师范大学;2011年
- 王瑞伟;网络安全取证的应用研究[D];江南大学;2011年
- 龚薇;失衡样本分类问题的自动过滤算法的研究[D];华东师范大学;2011年
- 刘国强;基于组合抽样技术的集成学习算法研究与应用[D];中国海洋大学;2011年
- 袁兴梅;面向不平衡数据的结构化支持向量机集成方法研究[D];南京师范大学;2011年
- 苏攀;不平衡分类器博弈模型及其在中国象棋中的应用[D];河北大学;2011年
- 童智靖;不均衡数据下基于SVM的分类算法研究与应用[D];哈尔滨工程大学;2011年
- 徐红国;基于数据分布特征的文本分类研究[D];山西大学;2011年
- 洪成昱;张雪峰;王宇彤;;基于粗糙集下近似理论的支持向量机分类方法[J];曲阜师范大学学报(自然科学版);2008年02期
- 迟晓君;;一种基于支持向量机的车牌字符识别方法[J];信息技术与信息化;2007年06期
- 段凤娟;朱吉胜;王华建;;支持向量机快速算法的实现技术[J];现代计算机(专业版);2008年09期
- 彭四海;;基于Hausdorff距离的支持向量机训练集选取方法[J];航空兵器;2007年05期
- 李茂宽,赵洪海;基于半监督支持向量机的数据分类(英文)[J];青岛大学学报(自然科学版);2004年04期
- 燕忠,袁春伟;基于蚁群智能和支持向量机的人脸性别分类方法[J];电子与信息学报;2004年08期
- 王晓云;SVM算法分析与研究[J];渝西学院学报(自然科学版);2005年03期
- 田盛丰,黄厚宽;基于支持向量机的数据库学习算法[J];计算机研究与发展;2000年01期
- 张铃;支持向量机理论与基于规划的神经网络学习算法[J];计算机学报;2001年02期
- 阎辉,张学工,李衍达;支持向量机与最小二乘法的关系研究[J];清华大学学报(自然科学版);2001年09期
- 卢卫雄;;一种基于支持向量机的多国语言文本分类平台[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
- 林杰华;张斌;李冬森;宋华茂;余志强;王浩;;支持向量机在电力客户信用评级中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
- 蒋铁军;张怀强;李积源;;多变量系统预测的支持向量机方法研究[A];管理科学与系统科学研究新进展——第7届全国青年管理科学与系统科学学术会议论文集[C];2003年
- 黄淑云;孙兴玉;梁汝萍;邱建丁;;基于小波支持向量机预测蛋白质亚细胞定位研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
- 谢湘;匡镜明;;支持向量机在语音识别中的应用研究[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
- 涂冬成;薛龙;刘木华;赵进辉;沈杰;吁芳;;基于支持向量机的鹅肉肉色客观评定研究[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年
- 杨凌;刘玉树;;基于支持向量机的坦克识别算法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
- 师旭超;巴松涛;;基于支持向量机方法的深基坑变形预测[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(上册)[C];2004年
- 张军;;支持向量机方法在地下水位干扰排除中的初步应用[A];2007年地震流体学术研讨会论文摘要集[C];2007年
- 许建生;盛立东;;基于改进的支持向量机和BP神经网络的识别算法[A];第八届全国汉字识别学术会议论文集[C];2002年
- 课题主持人 李心丹 课题协调人 上海证券交易所 施东晖 傅浩 课题研究员 宋素荣 查晓磊 宾红辉 张许宏 郭静静 黄隽 南京大学工程管理学院;内幕交易与市场操纵的行为动机与判别监管研究[N];中国证券报;2007年
- 李水根;计算机详解配伍与药效关系[N];健康报;2005年
- 清华大学 苏光大;非接触式人脸识别技术[N];计算机世界;2006年
- YMG记者 李仁 通讯员 曲华明 孙运智;我市九项目进入省“盘子”[N];烟台日报;2010年
- 上海大学理学院教授、副院长 陆文聪;酷爱化学 孜孜以求[N];中国化工报;2006年
- ;选择合适的数据挖掘算法[N];计算机世界;2007年
- 周颖;王米渠与中医心理学[N];中国中医药报;2006年
- 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
- 记者 张云普?通讯员 全攀峰 安强强;大庆物探深度域地震资料岩性解释技术获得五大突破[N];中国石油报;2008年
- 本报记者 冯治恩;敢与“雷公”试比高[N];铜川日报;2008年
- 杜小芳;基于CPFR的农产品采购模型研究[D];华中科技大学;2005年
- 刘育明;动态过程数据的多变量统计监控方法研究[D];浙江大学;2006年
- 栾锋;支持向量机(SVM)和径向基神经网络(RBFNN)方法在化学、环境化学和药物化学中的应用研究[D];兰州大学;2006年
- 孙薇;市场条件下抽水蓄能电站效益综合评价及运营模式研究[D];华北电力大学(河北);2007年
- 常群;支持向量机的核方法及其模型选择[D];哈尔滨工业大学;2007年
- 朱燕飞;锌钡白回转窑煅烧过程智能建模研究[D];华南理工大学;2005年
- 田英杰;支持向量回归机及其应用研究[D];中国农业大学;2005年
- 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
- 任东;基于支持向量机的植物病害识别研究[D];吉林大学;2007年
- 杨金芳;支持向量回归在预测控制中的应用研究[D];华北电力大学(河北);2007年
- 刘艳伟;支持向量机方法在感潮河段洪峰水位预报中的应用[D];浙江大学;2010年
- 杨镭;支持向量机算法设计及在高分辨雷达目标识别中的应用[D];国防科学技术大学;2010年
- 童振;基于支持向量机的电解液成分预测[D];东北大学;2008年
- 聂小芳;模糊粗糙集与支持向量机在煤与瓦斯突出预测中的应用研究[D];辽宁工程技术大学;2009年
- 鄢常亮;基于支持向量机的高炉向凉向热炉况预测研究[D];内蒙古科技大学;2010年
- 韩叙东;基于支持向量机的水电故障分类器的设计与实现[D];东北大学;2008年
- 冯杰;慢时变对象的支持向量机建模与在线校正方法研究[D];东北大学;2009年
- 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
- 王奇安;基于广泛内核的CVM算法研究及参数C的选择[D];南京航空航天大学;2009年
- 张永新;基于支持向量机和遗传算法相结合的模拟电路故障诊断方法研究[D];东北大学;2009年
【稿件标题】:基于COG-OS框架利用SMART预测云计算平台的硬盘故障
【作者单位】:南京大学计算机科学与技术系;计算机软件新技术国家重点实验室(南京大学);阿里云计算有限公司飞天-结构化数据服务;
【发表期刊期数】:《
计算机应用》2014年01期
【期刊简介】:《计算机应用》杂志是由中华人民共和国新闻出版总署、正式批准公开发行的优秀期刊,计算机应用杂志具有正规的双刊号,其中国内统一刊号:CN51-1307/TP,国际刊号:ISSN1001-9081。计算机应用杂志社由四川省科学技术协会主管、主办,本刊为月刊。自创刊以来,......更多
计算机应用杂志社(
http://www.400qikan.com/qk/5984/)投稿信息
【版权所有人】:宋云华;柏文阳;周琦;
更多
科技类论文详细信息:
基于COG-OS框架利用SMART预测云计算平台的硬盘故障
http://www.400qikan.com/lunwen/keji/16152.html
相关专题:体育与健康教学大纲 电脑改变了我的生活 《计算机应用》相关期刊
推荐期刊:
金融纵横科技与企业延安职业技术学院学报灌溉排水学报环境与职业医学政法论丛中文自修辽宁医学杂志江汉大学学报数学大王
上一篇:
移动社交网络实时通信机制的研究
下一篇:
支持位置追溯的射频识别移动对象索引机制