本文作者:张科;罗军;邓俊昆;成功正常投稿发表论文到《计算机科学》2014年01期,引用请注明来源400期刊网!
【摘要】:针对传统增强学习算法存在妥协过快导致自身效用降低的缺点,通过设计改进增强学习算法的双边多议题协商模型,引入期望还原率,还原Agent的期望,从而提高协商解的质量。通过实验分析了期望还原率不同取值对协商的影响,并对传统增强学习协商策略、基于时间的协商策略和改进增强学习协商策略的协商效果做了对比。实验表明,在协商次数允许的范围之内,基于期望还原率的改进增强学习算法在双边多议题协商中能够提升双方的效用。
【论文正文预览】:将学习机制引入基于Agent的电子商务协商中,也就是在协商过程中学习对手的信念、偏好以及协商环境知识,使得Agent适应动态变化的环境,通过不断调整自身信念,采取不同策略与对手进行协商,使利益最大化[1]。目前已有多种机器学习的方法应用到协商当中,常见的有贝叶斯学习、遗传
【文章分类号】:TP18
【稿件关键词】:协商策略增强学习期望还原率双边多议题
【参考文献】:
- 李剑;牛少彰;;一种基于混合遗传算法的双边多议题协商[J];北京邮电大学学报;2009年02期
- 罗志伟;;协同设计系统中图形协同与网络协商的实现[J];重庆理工大学学报(自然科学);2012年07期
- 张化祥,黄上腾;基于增强学习的代理谈判模型[J];计算机工程;2004年10期
- 孙天昊;邓俊昆;陈飞;朱庆生;;基于增强学习协商策略的研究及优化[J];计算机工程与应用;2012年23期
- 程昱;高济;古华茂;傅朝阳;;基于对手态度学习的协商决策模型[J];浙江大学学报(工学版);2008年10期
- 艾解清;双边多议题自动协商研究[D];浙江大学;2011年
- 陈文;基于决策树的入侵检测的实现[J];安徽技术师范学院学报;2005年05期
- 彭莉芬;陈俊生;胡学钢;;基于粗糙集决策树算法的研究[J];安庆师范学院学报(自然科学版);2012年01期
- 赵玉鹏;;论机器学习[J];安阳工学院学报;2011年04期
- 孙雪;李昆仑;胡夕坤;赵瑞;;基于半监督K-means的K值全局寻优算法[J];北京交通大学学报;2009年06期
- 赵勇;刘凯;;数字挖掘方法在遥感分类中的应用研究[J];北京测绘;2009年03期
- 沈奕,滑峰,刘椿年;基于GDT的对FOIL系统的改进[J];北京工业大学学报;2005年02期
- 朱青;刘宇辉;;一种面向领域的组件质量度量算法[J];北京工业大学学报;2007年01期
- 陈阳舟;黄旭;代桂平;;基于新的状态划分的多机器人围捕策略[J];北京工业大学学报;2010年08期
- 张瑞华;周延泉;王枞;李蕾;;移动终端离线浏览系统的新闻推荐服务研究[J];北京邮电大学学报;2006年06期
- 杨种学;;基于回归技术商品销售趋势预测模型的实现[J];保山师专学报;2009年05期
- 张敏;陆向艳;周敏;潘林琳;农冬冬;王彬彬;陈晓江;;数据挖掘在智能题库系统中的应用[A];广西计算机学会2004年学术年会论文集[C];2004年
- 马玉莲;王宇冬;王鑫;;基于解释的分类算法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
- 杜琳;石慧;刘晓平;;一种基于Q学习的任务调度算法的改进研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
- 吴佳金;杨志豪;林原;林鸿飞;;基于改进Pairwise损失函数的排序学习方法[A];第六届全国信息检索学术会议论文集[C];2010年
- 刘汝佳;孙增圻;;RoboCup救援仿真组中火势蔓延的DBN模型[A];2007年足球机器人大会论文集[C];2007年
- 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
- 高山;蛋白质点突变效果预测与突变数据库研究[D];南开大学;2010年
- 曹葵康;支持向量机加速方法及应用研究[D];浙江大学;2010年
- 林龙信;仿生水下机器人的增强学习控制方法研究[D];国防科学技术大学;2010年
- 杜伟;机器学习及数据挖掘在生物信息学中的应用研究[D];吉林大学;2011年
- 聂黎;基于基因表达式编程的车间动态调度方法研究[D];华中科技大学;2011年
- 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
- 黄静华;支持向量机算法研究及在气象数据挖掘中的应用[D];中国矿业大学(北京);2011年
- 张森林;电力市场双边交易若干问题研究[D];华南理工大学;2011年
- 陈俊;笑脸表情分类识别的研究[D];华南理工大学;2011年
- 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
- 韩晓峰;高斯混合模型及在探测网络社区结构中的应用[D];山东科技大学;2010年
- 杨勇;基于SOA的浙江永康某小家电企业应用系统集成平台开发与应用[D];浙江理工大学;2010年
- 王利明;一种基于PMIPv6的智能辅助高效切换方案[D];郑州大学;2010年
- 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
- 吴迪;高校毕业生就业推荐系统的设计与开发[D];大连理工大学;2010年
- 安波;基于蛋白质关系网络的蛋白质络合物抽取研究[D];大连理工大学;2010年
- 蒋延生;基于图的适应性相似度估算的半监督学习[D];大连理工大学;2010年
- 周翔;决策支持技术在企业销售系统中的应用研究[D];中国海洋大学;2010年
- 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
- 李剑;牛少彰;;一种基于混合遗传算法的双边多议题协商[J];北京邮电大学学报;2009年02期
- 彭志平;彭宏;郑启伦;;一种双边多议题自治协商模型的研究[J];电子与信息学报;2007年03期
- 杨明,嘉莉,邱玉辉;基于增强学习的多agent自动协商研究[J];计算机工程与应用;2004年33期
- 张化祥,黄上腾;基于增强学习的代理谈判模型[J];计算机工程;2004年10期
- 程昱;高济;郭航;古华茂;;自动协商中的近似时态关联规则挖掘[J];计算机集成制造系统;2007年09期
- 金贵林;容芷君;应保胜;;基于设计目标最大化的协同设计冲突消解算法[J];机械设计;2010年11期
- 江平宇,陈献国;基于Web的同步远程协同产品设计的实现[J];机械工程学报;2002年03期
- 罗亚波,肖田元;机械产品协同设计同步效率提升策略研究[J];机械工程学报;2005年01期
- 高济;吕何新;郭航;张凡;程昱;傅朝阳;王存浩;;可信的自治式服务协同模型和应用开发构架[J];中国科学(F辑:信息科学);2009年11期
- 程昱;高济;古华茂;傅朝阳;;基于机器学习的自动协商决策模型[J];软件学报;2009年08期
- 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
- 张虹;双边多议题自动协商研究[D];西南师范大学;2005年
- 程昱;面向自治计算的自动服务协商研究[D];浙江大学;2008年
- 陈抒彦;夏克俭;卢庆龄;班晓娟;;基于软件人的装备物流供应链协商模型[J];微计算机信息;2006年24期
- 梁茹冰;;基于资源的协商模型的关键策略研究与实现[J];计算机技术与发展;2006年10期
- 张君雁;段钢;邵培基;;基于网格的电子商务架构和多Agent协商[J];电子科技大学学报;2007年02期
- 姚慧;高承实;戴青;张徐;;一种基于树建模的自动信任协商策略[J];计算机工程与应用;2008年15期
- 申静;姚军财;;基于历史信息和时间约束的多Agent协商模型[J];陕西理工学院学报(自然科学版);2009年01期
- 孙天昊;陈飞;朱庆生;曹峰;;基于贝叶斯分类的增强学习协商策略[J];计算机科学;2011年09期
- 张化祥,赵彤,黄上腾;一般和对策中基于协商的多代理强化学习[J];上海交通大学学报;2005年S1期
- 陈璐;邱玉辉;张谦;;一种基于模糊约束的多并发双边自动协商模型[J];计算机应用;2007年12期
- 王尚平;马宏亮;张亚玲;王晓峰;;基于XACML的Web服务信任协商方案[J];计算机工程;2008年11期
- 杨明慧;王汝传;;基于可信敏感度的网格信任协商策略及其应用分析[J];电子学报;2010年02期
- 王兆明;;基于双边多目标和时间限制的讨价还价协商模型[A];2009年中国智能自动化会议论文集(第五分册)[东南大学学报(增刊)][C];2009年
- 马丽;刘惟一;;多个交通路口调度博弈模型及其均衡求解的增强学习算法[A];第二十七届中国控制会议论文集[C];2008年
- 郝莉莉;杨惠珍;顾浩;康凤举;;基于Simulink/Stateflow的AUV群体协作合同网快速原型仿真[A];中国造船工程学会电子技术学术委员会2011年海战场电子信息技术学术年会论文集[C];2011年
- 宗樾;谁绑架了用户?[N];中国质量报;2010年
- 陈占红 贺文龙;西宁经济开发区生物园区工资集体协商指导员队伍成立[N];青海日报;2010年
- 孙天昊;电子商务中一对多协商研究[D];重庆大学;2008年
- 赵贻竹;开放式环境中自动信任协商机制研究[D];华中科技大学;2008年
- 罗贺;多Agent信息融合与协商及其在故障诊断中的应用研究[D];合肥工业大学;2009年
- 单子丹;高技术虚拟企业(HTVE)协商机制及其支持系统研究[D];哈尔滨理工大学;2009年
- 张振文;基于让步提示的同步自动协商机制研究[D];华中科技大学;2010年
- 谢天保;协商理论在敏捷制造系统中的应用研究[D];西安理工大学;2007年
- 唐亮贵;基于多Agent的电子商务市场结构及交易模型研究[D];重庆大学;2009年
- 姜丽;多Agent协商研究[D];吉林大学;2007年
- 姜怡;基于P2P网络模型的开放业务环境下的信任管理研究[D];北京邮电大学;2008年
- 李开;开放系统中自动信任建立机制研究[D];华中科技大学;2010年
- 郭方铭;基于增强学习算法的智能排课模型[D];武汉理工大学;2004年
- 赵风姬;ATN中协商策略研究[D];哈尔滨工程大学;2011年
- 董青;多Agent系统交互机制及相关问题的研究[D];电子科技大学;2004年
- 武妍;基于多Agent的虚拟企业多目标协商策略研究[D];太原科技大学;2007年
- 孙天昊;基于ebXML的自动协商模型研究[D];重庆大学;2004年
- 金琳;电子集市下基于Agent的自动交易理论及方法的研究[D];合肥工业大学;2005年
- 王英;CSCW建组协商模型及策略的研究与实现[D];西南师范大学;2005年
- 陈璐;零售电子市场中多并发双边自动协商模型研究[D];西南大学;2006年
- 刘婷;基于移动Agent的协商机制的研究与应用[D];大连海事大学;2009年
- 高勇;P2P环境中ATN协商机制的研究[D];哈尔滨工程大学;2011年
【稿件标题】:基于改进增强学习算法的双边多协议协商策略
【作者单位】:重庆大学计算机学院;
【发表期刊期数】:《
计算机科学》2014年01期
【期刊简介】:本刊以其新颖、准确、及时为特色,突出动态性、综述性、学术性。报告特点是:“前沿科学”与“基础研究”相结合;“核心技术”与“支撑技术”相结合;“倡导”与“争鸣”相结合。广采百家之长,博览计算机世界之态势。重在突出文章的思想性,令人有开拓思路之......更多
计算机科学杂志社(
http://www.400qikan.com/qk/1234/)投稿信息
【版权所有人】:张科;罗军;邓俊昆;
更多
科技类论文详细信息:
基于改进增强学习算法的双边多协议协商策略
http://www.400qikan.com/lunwen/keji/15405.html
相关专题:心理学网址 情感心理学咨询 婚姻心理学专家 心理学培训 心理学网站 心理学 中国心理网 心灵咖啡网 心理学网址导航 应用心理学 华北煤炭医学院怎么样 分析化学论文 《计算机科学》相关期刊
推荐期刊:
西安石油大学学报西伯利亚研究少年电脑世界世界经济与政治论坛橡塑资源利用瘦佳人广西物理科学FANS南通航运职业技术学院学报现代电子技术
上一篇:
基于云控制的混沌多种群自适应遗传算法
下一篇:
两级定位-路径问题的人工蜂群算法