本文作者:通拉嘎;刘凯;李佳正;成功正常投稿发表论文到《图书馆理论与实践》2015年05期,引用请注明来源400期刊网!
【摘要】:最大熵模型能充分利用上下文,灵活取用多个特征。使用最大熵模型进行蒙古文人名识别,分析蒙古文人名结构及上下文环境,根据语言特点设计特征模板,建立粗选特征集;建立人名知识库,提取精选特征集,训练最大熵模型;实验结果证明,本系统能有效识别蒙古文人名,开放测试的正确率达到94.56%,召回率达到85.15%,F值达到89.61%,识别效果较为理想。
【论文正文预览】:1引言蒙古文词法分析是蒙古文信息处理的一项基础研究课题,是短语、句法、语义、篇章处理的基础环节。命名实体识别是文本信息处理的基本问题,[1]是蒙古文词法分析的关键问题之一,提升命名实体的识别性能,必将提高词法分析系统的整体性能。命名实体包括实体(人名、地名、组织
【文章分类号】:G254
【稿件关键词】:信息处理蒙古文人名识别最大熵
【参考文献】:
- 李佳正;刘凯;麦热哈巴·艾力;吕雅娟;刘群;吐尔根·依布拉音;;维吾尔语中汉族人名的识别及翻译[J];中文信息学报;2011年04期
- 桑海岩;古丽拉·阿东别克;牛宁宁;;基于最大熵的哈萨克语词性标注模型[J];计算机工程与应用;2013年11期
- 潘正高;;基于规则和统计相结合的中文命名实体识别研究[J];情报科学;2012年05期
- 皇甫晶;王凌云;;基于规则的纪传体古代汉语文献姓名识别[J];图书情报工作;2013年03期
- 谭煜辉;;基于统计的改进音译单元的维文—汉文人名音译研究[J];福建电脑;2013年08期
- 米成刚;杨雅婷;周喜;李晓;杨明忠;;基于字符串相似度的维吾尔语中汉语借词识别[J];中文信息学报;2013年05期
- 李湘东;巴志超;黄莉;;基于加权隐含狄利克雷分配模型的新闻话题挖掘方法[J];计算机应用;2014年05期
- 栗伟;赵大哲;李博;彭新茗;刘积仁;;CRF与规则相结合的医学病历实体识别[J];计算机应用研究;2015年04期
- 邹岳琳;吐尔根·依布拉音;麦热哈巴·艾力;艾山·吾买尔;帕力旦·吐尔逊;;基于词干提取的维吾尔语事件类时间短语识别[J];计算机工程与设计;2014年02期
- 谭煜辉;基于统计的维文—汉文人名音译方法研究[D];新疆大学;2012年
- 米日姑·肉孜;维吾尔文机构名识别研究[D];新疆大学;2013年
- 张静杰;虚词用法自动识别及其在依存句法分析中的应用研究[D];郑州大学;2013年
- 吴则建;中文专家证据文档识别研究[D];昆明理工大学;2013年
- 杨莉;Web旅游信息集成中的信息融合研究[D];江西财经大学;2013年
- 彭新茗;基于多层学习的病历实体识别算法设计与实现[D];东北大学;2013年
- 牛宁宁;哈萨克语兼类词词性标注研究[D];新疆大学;2014年
- 邹岳琳;维吾尔语时间表达式识别研究[D];新疆大学;2014年
- 加日拉·买买提热衣木;基于统计和规则混合策略的维吾尔人名识别研究[D];新疆大学;2014年
- 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
- 刘喜平;万常选;刘德喜;;有效的XML模糊内容与结构检索和计分[J];计算机研究与发展;2010年06期
- 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
- 达吾勒·阿布都哈依尔;古丽拉·阿东别克;;哈萨克语词法分析器的研究与实现[J];计算机工程与应用;2008年19期
- 刘艳;古丽拉.阿东别克;伊力亚尔;;哈萨克语词性自动标注研究初探[J];计算机工程与应用;2008年20期
- 侯呈风;古丽拉·阿东别克;;改进的HMM应用于哈萨克语词性标注[J];计算机工程与应用;2010年36期
- 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
- 衣马木艾山·阿布都力克木;吐尔地·托合提;艾斯卡尔·艾木都拉;;基于规则的维吾尔人名汉文机器翻译算法研究[J];计算机应用与软件;2010年08期
- 刘芳,赵铁军,于浩,杨沐昀,方高林;基于统计的汉语组块分析[J];中文信息学报;2000年06期
- 吕雅娟,赵铁军,杨沐昀,于浩,李生;基于分解与动态规划策略的汉语未登录词识别[J];中文信息学报;2001年01期
- 胡锦南;面向XML文档集的检索技术研究与系统实现[D];中国科学技术大学;2009年
- 红梅,敖其尔,白云莉;托忒蒙古文读音输入法的设计与实现[J];内蒙古师范大学学报(自然科学汉文版);2004年02期
- 乌日娜;;清代蒙古文历史文献及其整理研究概况[J];兰台世界;2011年19期
- 嘎日迪,赵小兵,马红旭,赛音,白小玲;蒙古文自动处理系统研究[J];中文信息学报;1999年04期
- 菊花;金良;;使用程序自动分析蒙古文词的研究[J];内蒙古师范大学学报(自然科学汉文版);2014年02期
- 乌林西拉;内蒙古自治区图书馆学(蒙古文)的研究与发展[J];国家图书馆学刊;2000年01期
- S·苏雅拉图;蒙古文整词计算机生成理论研究[J];中文信息学报;2001年04期
- 朝克图;关于蒙古文报刊史研究中的几个问题[J];蒙古学信息;2001年04期
- 红梅;基于Windows 2000/XP平台蒙古文输入法的设计技术[J];内蒙古师范大学学报(自然科学汉文版);2005年01期
- 巩政;郝莉;杨旭华;;非标准蒙古文字符编码转换为国际编码的一种方法[J];内蒙古大学学报(自然科学版);2008年02期
- 巩政;关高娃;;蒙古文停用词和英文停用词比较研究[J];中文信息学报;2011年04期
- 包艳花;图格木勒;;多字体印刷蒙古文识别后处理研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
- 吉仁尼格;;蒙古文同形词的统计法[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
- 呼斯勒;六月;斯日古楞;;浅谈蒙古文通用编辑器几点基本规范[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
- 道布;;回鹘式蒙古文[A];中国民族古文字[C];1982年
- 道布;;回鹘式蒙古文研究概况[A];中国民族古文字研究[C];1980年
- 白双成;胡其图;木仁;;蒙古文音节切分算法实现及其应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
- 孟和吉雅;白音门德;敖其尔;田会利;;蒙古文语音合成技术研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
- 孟和吉雅;敖其尔;巩政;;蒙古文网页制作技术分析[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
- 确精扎布;;蒙古文编码国际标准通过以后研制的几种蒙古文录入系统比较[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
- 宝金良;;蒙古文文本标点符号及其属性字段设置[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
- 记者 吉儒木图;手机可以使用蒙古文了[N];内蒙古日报(汉);2007年
- 记者 解太荣;《蒙古秘史》回鹘体蒙古文复原项目完成[N];锡林郭勒日报;2009年
- 孟克;如何打破蒙古文图书产销两难的困境[N];中国民族报;2010年
- 记者 阿斯钢;蒙古国总统签命令推广回鹘式蒙古文[N];新华每日电讯;2010年
- 记者 苏布达;全盟首届蒙古文图书节落幕[N];锡林郭勒日报(汉);2012年
- 陈岗龙 (蒙古族);蒙古文文学翻译的两个问题[N];文艺报;2013年
- 金坛;蒙古文:描绘大自然的千姿百态[N];中国民族报;2014年
- 阿勒得尔图;沙日布却玛:用回鹘体蒙古文还原《蒙古秘史》[N];中国民族报;2006年
- 记者 张文强;蒙古文图书农牧民阅读大接力活动启动[N];内蒙古日报(汉);2008年
- 徐恒泰;要全力抓好蒙古文教学资源建设[N];鄂尔多斯日报;2008年
- 淑琴;蒙古文同形词知识库的构建[D];内蒙古大学;2010年
- 达古拉;《清内秘书院蒙古文档案汇编》语言研究[D];内蒙古大学;2012年
- 魏宏喜;蒙古文古籍图像检索技术研究[D];内蒙古大学;2012年
- 通拉嘎;基于蒙古文语料库的人名自动识别[D];中央民族大学;2013年
- 莎日娜;乌兰巴托版蒙古文译本《今古奇观》研究[D];中国社会科学院研究生院;2010年
- 王桂荣;蒙古文字结构研究[D];内蒙古大学;2011年
- 关高娃;蒙古文停用词和英文停用词比较研究[D];内蒙古大学;2011年
- 常红梅;衮布扎布语言论著中的蒙古文阿里嘎礼研究[D];内蒙古大学;2013年
- 黄荣;蒙古文古籍形制的演变概况[D];内蒙古大学;2010年
- 蒙古勒夫;蒙古文学与蒙古文书法关系初探[D];内蒙古大学;2010年
- 雪梅;蒙古文教育资源库的设计与实现[D];内蒙古师范大学;2006年
- 包艳花;蒙古文识别文本后处理相关技术研究[D];内蒙古大学;2007年
- 朝鲁门;蒙古文古籍文字种类的演变之历史研究[D];内蒙古大学;2012年
- 塔娜;基于最小字素的蒙古文编码系统间的互译技术研究与实践[D];吉林大学;2012年
- 白喜文;中国蒙古文信息处理技术发展历程研究[D];内蒙古师范大学;2012年
- 赵颖霞;蒙古文信息处理产品标准符合性检测系统的设计与实现[D];内蒙古大学;2013年
【稿件标题】:人名识别|基于最大熵的蒙古文人名识别系统的设计与实现
【作者单位】:泉州师范学院图书馆;中国科学院计算技术研究所;
【发表期刊期数】:《
图书馆理论与实践》2015年05期
【期刊简介】:《图书馆理论与实践》杂志是由中华人民共和国新闻出版总署、正式批准公开发行的优秀期刊,图书馆理论与实践杂志具有正规的双刊号,其中国内统一刊号:CN64-1004/G2,国际刊号:ISSN1005-8214。图书馆理论与实践杂志社由宁夏回族自治区文化厅主管、主办,本刊......更多
图书馆理论与实践杂志社(
http://www.400qikan.com/qk/6399/)投稿信息
【版权所有人】:通拉嘎;刘凯;李佳正;
更多
医学论文格式论文详细信息:
人名识别|基于最大熵的蒙古文人名识别系统的设计与实现
http://www.400qikan.com/lunwen/yixue/yxlwgs/65280.html
相关专题: 《图书馆理论与实践》相关期刊
推荐期刊:
资源环境与工程盐业与化工中国公共卫生江苏教育宣传新型工业化体育科研财经科学中国食用菌教育学术月刊海军工程大学学报
上一篇:
财务部廉洁风险防控|国际工程财务风险的识别与防控
下一篇:
【临床护理教学实践探讨】非计算机专业“C语言”教改方案的探讨与实践