本文作者:汪蓉;李寿山;李生;周国栋;成功正常投稿发表论文到《山西大学学报(自然科学版)》2014年04期,引用请注明来源400期刊网!
【摘要】:篇章分析是自然语言处理中一个重要的研究方向。连接词的识别作为篇章分析中的一个基本任务,对后续的篇章分析起到关键作用。针对连接词识别方法中的高维度特征空间问题,提出了基于特征提取的连接词识别方法。具体来讲,引用多种特征提取方法(IG、MI、DF、CHI、WLLR)对连接词识别中所用的所有特征进行打分排序,提取排在前面的一定数量的特征用于分类。实验结果表明特征提取方法能够有效降低特征维度,在仅仅使用50%的特征的情况下能够获得类似甚至更佳的识别性能。
【论文正文预览】:0引言篇章是自然语言中较为复杂的一种结构。相对于词和句子粒度的文本分析,篇章文本分析具有更大的难度。在自然语言研究领域中,针对词或句子的研究工作展开相对较早,然而,文本的篇章自动分析刚刚起步。不同于词或者句子分析这类的浅层次分析,篇章分析是一种更加深层次的分析
【文章分类号】:TP391.1
【稿件关键词】:连接词识别特征提取特征维度
【参考文献】:
- 徐凡;朱巧明;周国栋;;篇章分析技术综述[J];中文信息学报;2013年03期
- 徐凡;朱巧明;周国栋;王明文;;衔接性驱动的篇章一致性建模研究[J];中文信息学报;2014年03期
- 王跃龙;姬东鸿;;汉语树库综述[J];当代语言学;2009年01期
- 田然;近二十年汉语语篇研究述评[J];汉语学习;2005年01期
- 郑贵友;汉语篇章分析的兴起与发展[J];汉语学习;2005年05期
- 张志昌;张宇;刘挺;李生;;基于话题和修辞识别的阅读理解why型问题回答[J];计算机研究与发展;2011年02期
- 刘挺,王开铸;基于篇章多级依存结构的自动文摘研究[J];计算机研究与发展;1999年04期
- 王建波,王开铸;自然语言篇章理解及基于理解的自动文摘研究[J];中文信息学报;1992年02期
- 吴华,黄泰翼;问答篇章生成系统中的用户模型和文本规划[J];中文信息学报;2001年04期
- 周强;汉语句法树库标注体系[J];中文信息学报;2004年04期
- 袁毓林;用逻辑和篇章知识来约束模板匹配——逻辑结构和篇章结构知识在信息抽取中的运用[J];中文信息学报;2005年04期
- 乐明;;汉语篇章修辞结构的标注研究[J];中文信息学报;2008年04期
- 孔芳;指代消解关键问题研究[D];苏州大学;2009年
- 车婷婷;洪宇;周小佩;严为绒;姚建民;朱巧明;;基于功能连接词的隐式篇章关系推理[J];中文信息学报;2014年02期
- 徐瑜;基于连接词预测的隐式语篇关系分类[D];华东师范大学;2013年
【稿件标题】:[人脸识别特征提取论文]基于特征提取的连接词识别方法
【作者单位】:苏州大学自然语言处理实验室;
【发表期刊期数】:《山西大学学报(自然科学版)》2014年04期
【期刊简介】:0......更多山西大学学报(自然科学版)杂志社(
http://www.400qikan.com/qk/12997/)投稿信息
【版权所有人】:汪蓉;李寿山;李生;周国栋;
更多
自然类论文详细信息:
[人脸识别特征提取论文]基于特征提取的连接词识别方法
http://www.400qikan.com/lunwen/ziran/32746.html
相关专题:法律是道德的底线 日化用品 《满学研究》相关期刊
推荐期刊:
体育与科学中国工业经济泸州科技亚热带水土保持农场经济管理煤质技术中国井冈山干部学院学报海军总医院学报口腔护理用品工业环境影响评价
上一篇:
【banach】关于Banach空间l~p的右极限空间l~(p+0)
下一篇:
【广元元坝】川东北元坝地区陆相气地球化学特征及来源