加入收藏 | 设为首页 权威学术期刊杂志介绍平台,展示学术期刊行业第一!就在400期刊网!

全国免费咨询电话:

计算机应用杂志社

关注我们

当前位置:首页 > 学术论文 > 科技类 >

基于弱监督的属性关系抽取方法

本文作者:杨宇飞;戴齐;贾真;尹红风;成功正常投稿发表论文到《计算机应用》2014年01期,引用请注明来源400期刊网!



【摘要】:针对从中文百科中抽取属性关系时所面临的训练语料匮乏问题,提出一种利用极少人工参与的弱监督自动抽取方法。首先,利用中文百科条目信息模板中的半结构化属性关系回标条目文本自动获取训练语料;然后,根据朴素贝叶斯分类原理优化训练语料;最后,基于条件随机场(CRF)建立属性关系抽取模型。在互动百科中采集的数据集上进行实验,综合评价F值达到了80.9%。结果表明该方法能够获得质量较高的训练语料,并取得良好的抽取性能。
【论文正文预览】:0引言属性关系是实体关系的一种,包括实体、属性名称和属性值三元组。属性关系对于信息检索、问答系统、知识推理等都具有重要的意义。网络百科(如维基百科、百度百科、互动百科等)是由网络用户协作创建的大百科全书,百科条目中蕴含大量的属性关系,为关系抽取提供了丰富的数据
【文章分类号】:TP391.1
【稿件关键词】:关系抽取弱监督中文百科朴素贝叶斯分类条件随机场
【参考文献】:
  • 李艳翠;冯文贺;周国栋;朱坤华;;基于逗号的汉语子句识别研究[J];北京大学学报(自然科学版);2013年01期
  • 郭剑毅;李真;余正涛;张志坤;;领域本体概念实例、属性和属性值的抽取及关系预测[J];南京大学学报(自然科学版);2012年04期
  • 陈立玮;冯岩松;赵东岩;;基于弱监督学习的海量网络数据关系抽取[J];计算机研究与发展;2013年09期
  • 冯文贺;;汉英篇章结构平行语料库的对齐标注研究[J];中文信息学报;2013年06期
  • 虞为;陈俊鹏;;基于MapReduce的书目数据关联匹配研究[J];现代图书情报技术;2013年09期
  • 于彤;陈华钧;李敬华;;中医药语义维基系统研发[J];中国医学创新;2013年34期
  • 鲜国建;农业科技多维语义关联数据构建研究[D];中国农业科学院;2013年
  • 唐富年;面向语义正确性的集成数据访问方法研究[D];国防科学技术大学;2012年
  • 杨婧;基于概念图的可视属性语义网构建的研究[D];西北大学;2013年
  • 李博;基于语义关系的高血压临床指南知识库构建[D];电子科技大学;2013年
  • 李真;受限域实体语义关系抽取研究[D];昆明理工大学;2013年
  • 项灵辉;基于图数据库的海量RDF数据分布式存储[D];武汉科技大学;2013年
  • 罗超;基于中文自然语言的合理用药查询[D];武汉科技大学;2013年
  • 生兆花;大规模生物医学语义关联数据集的查询关键技术研究[D];天津大学;2012年
  • 储泽祥;;小句是汉语语法基本的动态单位[J];汉语学报;2004年02期
  • 王文格;;现代汉语小句的研究现状及存在的问题[J];汉语学习;2010年01期
  • 黄河燕,陈肇雄;基于多策略分析的复杂长句翻译处理算法[J];中文信息学报;2002年03期
  • 李幸;宗成庆;;引入标点处理的层次化汉语长句句法分析方法[J];中文信息学报;2006年04期
  • 郭剑毅;薛征山;余正涛;张志坤;张宜浩;姚贤明;;基于层叠条件随机场的旅游领域命名实体识别[J];中文信息学报;2009年05期
  • 康为;穗志方;;基于Web弱指导的本体概念实例及属性的同步提取[J];中文信息学报;2010年01期
  • 耿焕同;蔡庆生;于琨;赵鹏;;一种基于词共现图的文档主题词自动抽取方法[J];南京大学学报(自然科学版);2006年02期
  • 廖士中;丁立中;贾磊;;支持向量回归多参数的同时调节[J];南京大学学报(自然科学版);2009年05期
  • 耿骞;耿崇;;利用词语共现进行Ontology的概念获取[J];现代图书情报技术;2006年02期
  • 邢福义;;小句中枢说[J];中国语文;1995年06期
  • 沈勤中;周国栋;朱巧明;孔芳;丁金涛;;基于字位置概率特征的条件随机场中文分词方法[J];苏州大学学报(自然科学版);2008年03期
  • 刘海鹏;王小捷;;基于条件随机场和知识库的手机短信命名实体识别[J];广西师范大学学报(自然科学版);2009年01期
  • 葛金虎;;基于条件随机场的中文命名实体识别的研究[J];科技信息;2010年16期
  • 迟呈英;于长远;战学刚;;基于条件随机场的中文分词方法[J];情报杂志;2008年05期
  • 贾美英;杨炳儒;郑德权;杨靖;;采用CRF技术的军事情报术语自动抽取研究[J];计算机工程与应用;2009年32期
  • 许晓丽;卢志茂;张格森;;基于条件随机场的中文命名实体识别研究[J];中国新技术新产品;2009年02期
  • 刘豹;张桂平;蔡东风;;基于统计和规则相结合的科技术语自动抽取研究[J];计算机工程与应用;2008年23期
  • 阴晋岭;王惠临;;词性标注的方法研究——结合条件随机场和基于转换学习的方法进行词性标注[J];现代图书情报技术;2009年03期
  • 张朝胜;郭剑毅;线岩团;余正涛;雷春雅;王海雄;;基于条件随机场的英文产品命名实体识别[J];计算机工程与科学;2010年06期
  • 乔长兵;;基于条件随机场的分词工作流研究与应用[J];微处理机;2010年03期
  • 代翠;周俏丽;蔡东风;;统计和规则相结合的汉语最长名词短语自动识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
  • 陈禹;史晓东;向晓雯;张润延;;基于混合方法的中文命名实体识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
  • 王东波;陈小荷;年洪东;;基于条件随机场的有标记联合结构自动识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
  • 宁伟;蔡东风;季铎;;基于条件随机场的冠词选择研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
  • 何赛克;王小捷;董远;张韬政;白雪;;归一化的邻接类别方法在基于条件随机场的中文分词中的应用[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
  • 姚树杰;肖桐;朱靖波;;基于句对质量和覆盖度的统计机器翻译训练语料选取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
  • 徐薇;付滨;刘柳;苑春法;李文捷;;中文命名实体识别系统的领域扩展[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
  • 张祝玉;任飞亮;朱靖波;;基于条件随机场的中文命名实体识别特征比较研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
  • 程晓;郑德权;杨宇航;邵国军;;面向半结构化文本的领域本体关系抽取[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
  • 陈奇哲;刘全升;姚天昉;;汉语意见型语句主题与情感关系抽取的研究[A];第五届全国信息检索学术会议论文集[C];2009年
  • 张奇;细颗粒度情感倾向分析若干关键问题研究[D];复旦大学;2008年
  • 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
  • 熊英;中文自然语言理解中基于条件随机场理论的词法分析研究[D];上海交通大学;2009年
  • 孙承杰;基于判别式模型的生物医学文本挖掘相关问题研究[D];哈尔滨工业大学;2008年
  • 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
  • 禇一平;基于条件随机场模型的视频目标分割算法研究[D];浙江大学;2007年
  • 许红涛;Web图像语义分析与自动标注研究[D];复旦大学;2009年
  • 黄健斌;基于条件概率图模型的Deep Web数据抽取与集成研究[D];西安电子科技大学;2007年
  • 瞿仰;基于声调识别的汉语计算机辅助学习系统研究[D];华东师范大学;2012年
  • 钱线;快速精确的结构化机器学习方法研究[D];复旦大学;2010年
  • 章剑锋;评论挖掘中的语义信息抽取[D];复旦大学;2008年
  • 向晓雯;基于条件随机场的中文命名实体识别[D];厦门大学;2006年
  • 刘海鹏;面向手机短信的命名实体识别研究[D];北京邮电大学;2009年
  • 刘磊;面向专利的双语术语自动抽取技术的研究[D];沈阳航空工业学院;2009年
  • 何楠;基于统计机器学习的两阶段中文命名实体识别研究[D];北京邮电大学;2008年
  • 丁卓冶;中文命名实体识别的研究[D];大连理工大学;2008年
  • 代翠;汉语最长名词短语的自动识别与分析[D];沈阳航空工业学院;2009年
  • 徐波;基于条件随机场的口语规范化处理研究[D];南京理工大学;2009年
  • 苗雪雷;基于条件随机场的汉语词义消歧方法研究[D];沈阳航空工业学院;2007年
  • 张志田;无监督关系抽取方法研究[D];哈尔滨工业大学;2007年

【稿件标题】:基于弱监督的属性关系抽取方法
【作者单位】:西南交通大学信息科学与技术学院;
【发表期刊期数】:《计算机应用》2014年01期
【期刊简介】:《计算机应用》杂志是由中华人民共和国新闻出版总署、正式批准公开发行的优秀期刊,计算机应用杂志具有正规的双刊号,其中国内统一刊号:CN51-1307/TP,国际刊号:ISSN1001-9081。计算机应用杂志社由四川省科学技术协会主管、主办,本刊为月刊。自创刊以来,......更多计算机应用杂志社(http://www.400qikan.com/qk/5984/)投稿信息
【版权所有人】:杨宇飞;戴齐;贾真;尹红风;


    更多科技类论文详细信息: 基于弱监督的属性关系抽取方法
    http://www.400qikan.com/lunwen/keji/15443.html


    相关专题:形容词 焦作市建设银行网点 《计算机应用》相关期刊

    推荐期刊:

  • 语文周报
  • 职教研究
  • 读写算
  • 中国蜂业
  • 演化与创新经济学评论
  • 歌剧
  • 财经问题研究
  • 呼伦贝尔学院学报
  • 对外传播
  • 四川党的建设


  • 上一篇:电路板红外图像多目标提取算法
    下一篇:校际网络教研平台的四维构建

    认准400期刊网 可信 保障 安全 快速 客户见证 退款保证


    品牌介绍