本文作者:汪蓉;李寿山;李生;周国栋;成功正常投稿发表论文到《山西大学学报(自然科学版)》2014年04期,引用请注明来源400期刊网!
【摘要】:篇章分析是自然语言处理中一个重要的研究方向。连接词的识别作为篇章分析中的一个基本任务,对后续的篇章分析起到关键作用。针对连接词识别方法中的高维度特征空间问题,提出了基于特征提取的连接词识别方法。具体来讲,引用多种特征提取方法(IG、MI、DF、CHI、WLLR)对连接词识别中所用的所有特征进行打分排序,提取排在前面的一定数量的特征用于分类。实验结果表明特征提取方法能够有效降低特征维度,在仅仅使用50%的特征的情况下能够获得类似甚至更佳的识别性能。
【论文正文预览】:0引言篇章是自然语言中较为复杂的一种结构。相对于词和句子粒度的文本分析,篇章文本分析具有更大的难度。在自然语言研究领域中,针对词或句子的研究工作展开相对较早,然而,文本的篇章自动分析刚刚起步。不同于词或者句子分析这类的浅层次分析,篇章分析是一种更加深层次的分析
【文章分类号】:TP391.1
【稿件关键词】:连接词识别特征提取特征维度
【参考文献】:
- 徐凡;朱巧明;周国栋;;篇章分析技术综述[J];中文信息学报;2013年03期
- 徐凡;朱巧明;周国栋;王明文;;衔接性驱动的篇章一致性建模研究[J];中文信息学报;2014年03期
- 王跃龙;姬东鸿;;汉语树库综述[J];当代语言学;2009年01期
- 田然;近二十年汉语语篇研究述评[J];汉语学习;2005年01期
- 郑贵友;汉语篇章分析的兴起与发展[J];汉语学习;2005年05期
- 张志昌;张宇;刘挺;李生;;基于话题和修辞识别的阅读理解why型问题回答[J];计算机研究与发展;2011年02期
- 刘挺,王开铸;基于篇章多级依存结构的自动文摘研究[J];计算机研究与发展;1999年04期
- 王建波,王开铸;自然语言篇章理解及基于理解的自动文摘研究[J];中文信息学报;1992年02期
- 吴华,黄泰翼;问答篇章生成系统中的用户模型和文本规划[J];中文信息学报;2001年04期
- 周强;汉语句法树库标注体系[J];中文信息学报;2004年04期
- 袁毓林;用逻辑和篇章知识来约束模板匹配——逻辑结构和篇章结构知识在信息抽取中的运用[J];中文信息学报;2005年04期
- 乐明;;汉语篇章修辞结构的标注研究[J];中文信息学报;2008年04期
- 孔芳;指代消解关键问题研究[D];苏州大学;2009年
- 车婷婷;洪宇;周小佩;严为绒;姚建民;朱巧明;;基于功能连接词的隐式篇章关系推理[J];中文信息学报;2014年02期
- 徐瑜;基于连接词预测的隐式语篇关系分类[D];华东师范大学;2013年
【稿件标题】:[特征提取方法论文]基于特征提取的连接词识别方法
【作者单位】:苏州大学自然语言处理实验室;
【发表期刊期数】:《山西大学学报(自然科学版)》2014年04期
【期刊简介】:0......更多山西大学学报(自然科学版)杂志社(
http://www.400qikan.com/qk/7043/)投稿信息
【版权所有人】:汪蓉;李寿山;李生;周国栋;
更多
自然类论文详细信息:
[特征提取方法论文]基于特征提取的连接词识别方法
http://www.400qikan.com/lunwen/ziran/23422.html
相关专题:swot分析劣势 智能家居产品 《实用医院临床杂志》相关期刊
推荐期刊:
东北电力技术中华航海医学与高气压医学杂志纺织学报投资与创业煤炭科学技术机械设计与研究气象与环境学报制冷技术海口市人民政府公报时代建筑
上一篇:
云算子矩阵计算器|斜对角算子矩阵的本质谱及其应用
下一篇:
【甘肃省陇南市武都区】1879年甘肃武都南8级地震的震灾特征