本文作者:张振昌;成功正常投稿发表论文到《厦门大学学报(自然科学版)》2014年06期,引用请注明来源400期刊网!
【摘要】:基于统计的方法是当前机器翻译领域主流的研究方向之一,其中对齐模板统计翻译模型是效果较好的一个统计模型,而双语词聚类在对齐模板统计模型参数训练中占有十分重要的地位.本研究针对其参数训练的双语词聚类,在原有的非层次聚类基础上,提出了双语层次聚类的算法;另外,又结合2种算法的思想,提出一种新的混合算法.使用信息熵作为评价标准,结果显示混合算法的聚类效果有3.4%~5.0%的改进.
【论文正文预览】:1预备知识1.1统计机器翻译概述20世纪90年代初,PeterBrown等[1]提出了基于信源信道思想的统计机器翻译模型,在实验上取得初步的成功.不过由于当时计算能力不足等多方面原因,对统计机器翻译方法进行深入研究的人并不多.直到1999年,约翰霍金斯(JHU)大学的统计机器翻译夏季讨论
【文章分类号】:TP391.2
【稿件关键词】:双语词聚类对齐模板信息熵
【参考文献】:
- 刘群;统计机器翻译综述[J];中文信息学报;2003年04期
- 张贯虹;高玲玲;;一种基于统计和模板的双层翻译研究[J];电脑知识与技术;2008年32期
- 肖明;;机器翻译系统中间件模型[J];福建电脑;2006年03期
- 卢朝华;徐好芹;王玉芬;;基于语义分析的汉语介词短语识别方法研究[J];电脑与电信;2012年03期
- 王斯日古楞;斯琴图;那顺乌日图;;基于短语的汉蒙统计机器翻译研究[J];计算机工程与应用;2010年14期
- 徐金安;;理性主义与经验主义相结合的机器翻译研究策略[J];计算机科学;2011年06期
- 周新栋,王挺;基于N元语言模型的文本分类方法[J];计算机应用;2005年01期
- 骆凯;李淼;强静;乌达巴拉;;基于统计和模板的双层汉蒙翻译研究[J];计算机应用;2009年07期
- 王晓涓;赵春;;最大熵方法在英语名词短语识别中的应用研究[J];计算机仿真;2011年03期
- 李俊;薛永增;赵铁军;;常用统计翻译模型在口语汉英翻译中的比较研究[J];计算机应用研究;2007年06期
- 胡乃全;孔芳;王海东;周国栋;朱巧明;;基于最大熵模型的中文指代消解系统实现[J];计算机应用研究;2009年08期
- 吴秋锋;黄书剑;戴新宇;陈家骏;;一种基于句法的用于汉英翻译的预调序方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
- 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
- 张大鲲;张玮;董静;;基于非连续短语的统计翻译模型[A];第三届学生计算语言学研讨会论文集[C];2006年
- 强静;李淼;高翊;胡冠龙;胡泽林;;多民族语言农业知识处理平台[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
- 李响;徐金安;刘群;吕雅娟;姜文斌;;移动终端机器翻译设备的解码定点化方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
- 杨雨图;支持双语的协同CAPP系统若干关键技术研究[D];南京航空航天大学;2006年
- 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
- 方淼;语义单元自动获取研究[D];大连理工大学;2008年
- 薛永增;统计机器翻译若干关键技术研究[D];哈尔滨工业大学;2007年
- 胡蓉;WEB日志和子空间聚类挖掘算法研究[D];华中科技大学;2008年
- 巢文涵;基于双语语料库的机器翻译关键技术研究[D];国防科学技术大学;2008年
- 雪艳;汉蒙词语对齐及相关技术研究[D];内蒙古大学;2009年
- 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
- 百顺;日蒙机器翻译及相关技术研究[D];内蒙古大学;2012年
- 马建军;面向机器翻译的英语功能名词短语识别研究[D];大连理工大学;2012年
- 张庐颖;基于粗糙集的K-means研究[D];北京交通大学;2011年
- 李志青;基于Internet的互动辅助翻译技术研究[D];内蒙古大学;2011年
- 银花;基于短语的蒙汉统计机器翻译研究[D];内蒙古师范大学;2011年
- 王茜;[D];电子科技大学;2011年
- 卢朝华;基于语义分析的汉语短语识别方法研究[D];河南科技大学;2009年
- 刘莎莎;大规模中文机构名称与机构地址自动翻译研究[D];哈尔滨工业大学;2010年
- 许冲;统计机器翻译中层次短语翻译模型的研究与实现[D];哈尔滨工业大学;2010年
- 霍亚格;汉语短语识别方法研究[D];河南科技大学;2011年
- 占飞;计算语言学领域英文辅助写作系统[D];哈尔滨工业大学;2011年
- 康维鹏;基于复述的问题扩展技术研究[D];哈尔滨工业大学;2011年
【稿件标题】:k means聚类算法|基于信息熵的双语词聚类算法
【作者单位】:福建农林大学计算机与信息学院;
【发表期刊期数】:《厦门大学学报(自然科学版)》2014年06期
【期刊简介】:0......更多厦门大学学报(自然科学版)杂志社(
http://www.400qikan.com/qk/10470/)投稿信息
【版权所有人】:张振昌;
更多
自然类论文详细信息:
k means聚类算法|基于信息熵的双语词聚类算法
http://www.400qikan.com/lunwen/ziran/24044.html
相关专题:感应垃圾桶 江苏省服务业招聘 《考古与文物》相关期刊
推荐期刊:
上海包装产业与科技论坛晚晴青年科学廊坊师范学院学报宁夏农林科技IT经理世界黎明职业大学学报上海公路小读者
上一篇:
[有一个t形工件 如图18论文]带有退化工件和拒绝的不同类型机排序
下一篇:
[离散相模型论文]弱离散Koszul模(英文)