加入收藏 | 设为首页 权威学术期刊杂志介绍平台,展示学术期刊行业第一!就在400期刊网!

全国免费咨询电话:

考古与文物杂志社

关注我们

当前位置:首页 > 学术论文 > 自然类 >

k means聚类算法|基于信息熵的双语词聚类算法

本文作者:张振昌;成功正常投稿发表论文到《厦门大学学报(自然科学版)》2014年06期,引用请注明来源400期刊网!



【摘要】:基于统计的方法是当前机器翻译领域主流的研究方向之一,其中对齐模板统计翻译模型是效果较好的一个统计模型,而双语词聚类在对齐模板统计模型参数训练中占有十分重要的地位.本研究针对其参数训练的双语词聚类,在原有的非层次聚类基础上,提出了双语层次聚类的算法;另外,又结合2种算法的思想,提出一种新的混合算法.使用信息熵作为评价标准,结果显示混合算法的聚类效果有3.4%~5.0%的改进.
【论文正文预览】:1预备知识1.1统计机器翻译概述20世纪90年代初,PeterBrown等[1]提出了基于信源信道思想的统计机器翻译模型,在实验上取得初步的成功.不过由于当时计算能力不足等多方面原因,对统计机器翻译方法进行深入研究的人并不多.直到1999年,约翰霍金斯(JHU)大学的统计机器翻译夏季讨论
【文章分类号】:TP391.2
【稿件关键词】:双语词聚类对齐模板信息熵
【参考文献】:
  • 刘群;统计机器翻译综述[J];中文信息学报;2003年04期
  • 张贯虹;高玲玲;;一种基于统计和模板的双层翻译研究[J];电脑知识与技术;2008年32期
  • 肖明;;机器翻译系统中间件模型[J];福建电脑;2006年03期
  • 卢朝华;徐好芹;王玉芬;;基于语义分析的汉语介词短语识别方法研究[J];电脑与电信;2012年03期
  • 王斯日古楞;斯琴图;那顺乌日图;;基于短语的汉蒙统计机器翻译研究[J];计算机工程与应用;2010年14期
  • 徐金安;;理性主义与经验主义相结合的机器翻译研究策略[J];计算机科学;2011年06期
  • 周新栋,王挺;基于N元语言模型的文本分类方法[J];计算机应用;2005年01期
  • 骆凯;李淼;强静;乌达巴拉;;基于统计和模板的双层汉蒙翻译研究[J];计算机应用;2009年07期
  • 王晓涓;赵春;;最大熵方法在英语名词短语识别中的应用研究[J];计算机仿真;2011年03期
  • 李俊;薛永增;赵铁军;;常用统计翻译模型在口语汉英翻译中的比较研究[J];计算机应用研究;2007年06期
  • 胡乃全;孔芳;王海东;周国栋;朱巧明;;基于最大熵模型的中文指代消解系统实现[J];计算机应用研究;2009年08期
  • 吴秋锋;黄书剑;戴新宇;陈家骏;;一种基于句法的用于汉英翻译的预调序方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
  • 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
  • 张大鲲;张玮;董静;;基于非连续短语的统计翻译模型[A];第三届学生计算语言学研讨会论文集[C];2006年
  • 强静;李淼;高翊;胡冠龙;胡泽林;;多民族语言农业知识处理平台[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
  • 李响;徐金安;刘群;吕雅娟;姜文斌;;移动终端机器翻译设备的解码定点化方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
  • 杨雨图;支持双语的协同CAPP系统若干关键技术研究[D];南京航空航天大学;2006年
  • 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
  • 方淼;语义单元自动获取研究[D];大连理工大学;2008年
  • 薛永增;统计机器翻译若干关键技术研究[D];哈尔滨工业大学;2007年
  • 胡蓉;WEB日志和子空间聚类挖掘算法研究[D];华中科技大学;2008年
  • 巢文涵;基于双语语料库的机器翻译关键技术研究[D];国防科学技术大学;2008年
  • 雪艳;汉蒙词语对齐及相关技术研究[D];内蒙古大学;2009年
  • 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
  • 百顺;日蒙机器翻译及相关技术研究[D];内蒙古大学;2012年
  • 马建军;面向机器翻译的英语功能名词短语识别研究[D];大连理工大学;2012年
  • 张庐颖;基于粗糙集的K-means研究[D];北京交通大学;2011年
  • 李志青;基于Internet的互动辅助翻译技术研究[D];内蒙古大学;2011年
  • 银花;基于短语的蒙汉统计机器翻译研究[D];内蒙古师范大学;2011年
  • 王茜;[D];电子科技大学;2011年
  • 卢朝华;基于语义分析的汉语短语识别方法研究[D];河南科技大学;2009年
  • 刘莎莎;大规模中文机构名称与机构地址自动翻译研究[D];哈尔滨工业大学;2010年
  • 许冲;统计机器翻译中层次短语翻译模型的研究与实现[D];哈尔滨工业大学;2010年
  • 霍亚格;汉语短语识别方法研究[D];河南科技大学;2011年
  • 占飞;计算语言学领域英文辅助写作系统[D];哈尔滨工业大学;2011年
  • 康维鹏;基于复述的问题扩展技术研究[D];哈尔滨工业大学;2011年

【稿件标题】:k means聚类算法|基于信息熵的双语词聚类算法
【作者单位】:福建农林大学计算机与信息学院;
【发表期刊期数】:《厦门大学学报(自然科学版)》2014年06期
【期刊简介】:0......更多厦门大学学报(自然科学版)杂志社(http://www.400qikan.com/qk/10470/)投稿信息
【版权所有人】:张振昌;


    更多自然类论文详细信息: k means聚类算法|基于信息熵的双语词聚类算法
    http://www.400qikan.com/lunwen/ziran/24044.html


    相关专题:感应垃圾桶 江苏省服务业招聘 《考古与文物》相关期刊

    推荐期刊:

  • 上海包装
  • 产业与科技论坛
  • 晚晴
  • 青年科学
  • 廊坊师范学院学报
  • 宁夏农林科技
  • IT经理世界
  • 黎明职业大学学报
  • 上海公路
  • 小读者


  • 上一篇:[有一个t形工件 如图18论文]带有退化工件和拒绝的不同类型机排序
    下一篇:[离散相模型论文]弱离散Koszul模(英文)

    认准400期刊网 可信 保障 安全 快速 客户见证 退款保证


    品牌介绍