本文作者:贾熹滨;尹宝才;孙艳丰;成功正常投稿发表论文到《计算机科学》2014年01期,引用请注明来源400期刊网!
【摘要】:提出了一种基于双层码本的语音驱动视觉语音合成系统,该系统以矢量量化的思想为基础,建立语音特征空间到视觉语音特征空间的粗耦合映射关系。为加强语音和视觉语音的关联性,系统分别根据语音特征与视觉语音特征的相似性两次对样本数据进行自动聚类,构造同时反映语音之间与视觉语音之间相似性的双层映射码本。数据预处理阶段,提出一种能反映视觉语音几何形状特征与牙齿可见度的联合特征模型,并在语音特征LPCC及MFCC基础上采用遗传算法提取视觉语音相关的语音特征模型。合成的视频中图像数据与原始视频中图像数据的比较结果表明,合成结果能在一定程度上逼近原始数据,取得了很好的效果。
【论文正文预览】:1引言语言是自然人进行交流的主要方式,在人交谈中,除了声音外,人说话时的口形、表情、手势等都是加强语言理解的不可或缺的因素,因而有研究者提出将人类这种自然的交流方式用在人机交互中,提供包括声音语音、视觉语音、表情等多通道交互方式,提高人机交互的自然性和逼真性[1,
【文章分类号】:TN912.3
【稿件关键词】:双层码本视觉语音合成视觉语音特征语音特征
【参考文献】:
- 王志明;陶建华;;文本-视觉语音合成综述[J];计算机研究与发展;2006年01期
- 谢金晶;陈益强;刘军发;;基于语音情感识别的多表情人脸动画方法[J];计算机辅助设计与图形学学报;2008年04期
- 邵艳秋;穗志方;韩纪庆;王志伟;;小规模情感数据和大规模中性数据相结合的情感韵律建模研究[J];计算机研究与发展;2007年09期
- 崔明;许志闻;;基于加权DFFD算法和渐变动画思想的人脸动画系统[J];吉林大学学报(理学版);2012年02期
- 孙凯;于俊清;;面向观众的个性化电影情感内容表示与识别[J];计算机辅助设计与图形学学报;2010年01期
- 潘红艳;柳杨华;徐光祐;;人脸动画方法综述[J];计算机应用研究;2008年02期
- 熊磊;毕笃彦;何林远;李权合;;分层人脸模型及其真实感风格表情合成[J];计算机辅助设计与图形学学报;2013年08期
- 张小燕;宿建军;薛化建;王磊;;维吾尔语语音识别语料库中的OOV研究[J];计算机工程与设计;2012年02期
- 郭戈;数字视频语义信息提取与分析[D];解放军信息工程大学;2010年
- 李皓;语音驱动的人脸建模与动画技术研究[D];国防科学技术大学;2011年
- 周维;汉语语音同步的真实感三维人脸动画研究[D];中国科学技术大学;2008年
- 王蒙军;唇读发声器中视觉信息的检测与处理[D];天津大学;2007年
- 於俊;低比特率真实感人脸视频编码研究[D];中国科学技术大学;2010年
- 徐雪绒;基于单张正面照片的三维人脸建模及表情合成的研究[D];西南交通大学;2011年
- 王霞;文本驱动的表情合成研究[D];西南交通大学;2011年
- 屠彬彬;基于多特征提取与融合的语音情感研究[D];江南大学;2012年
- 朱文辉;基于FAP的细微表情合成[D];北京工业大学;2005年
- 李菁菁;基于控制点平滑的人脸变形算法及其在人脸动画中的应用[D];湘潭大学;2008年
- 王恺;基于MPEG-4的三维人脸动画合成研究[D];北京工业大学;2009年
- 崔明;基于语音驱动的人脸口型动画系统[D];吉林大学;2012年
- 徐芳;针对虚拟人的文本情感语义分析[D];西南交通大学;2012年
- 杨逸;基于肌肉模型控制的口型可视化研究[D];西南交通大学;2013年
- 高文,陈熙霖,晏洁,宋益波,尹宝才;虚拟人面部行为的合成[J];计算机学报;1998年08期
- 赵力,钱向民,邹采荣,吴镇扬;语音信号中的情感识别研究[J];软件学报;2001年07期
- 卢坚,陈毅松,孙正兴,张福炎;基于隐马尔可夫模型的音频自动分类[J];软件学报;2002年08期
- 陈益强,高文,王兆其,姜大龙;基于机器学习的语音驱动人脸动画方法[J];软件学报;2003年02期
- 王志明,蔡莲红;动态视位模型及其参数估计[J];软件学报;2003年03期
- 陈明义;余伶俐;朱晗;周昆湘;;基于特征参数融合的语音情感识别方法[J];微电子学与计算机;2006年12期
- 左力,李治国,李锦涛,高文;基于标注图像的MPEG-4人脸运动参数获取方法[J];系统仿真学报;2001年S2期
- 张欣;杜利民;陈柯;赵向阳;;汉语语音视觉合成研究数据库CVSS1.0[J];微计算机应用;2007年03期
- ;[J];;年期
- ;[J];;年期
- ;[J];;年期
- ;[J];;年期
- ;[J];;年期
- ;[J];;年期
- ;[J];;年期
- ;[J];;年期
- ;[J];;年期
【稿件标题】:[语音驱动论文]基于双层码本的语音驱动视觉语音合成系统
【作者单位】:北京工业大学多媒体与智能软件技术北京市重点实验室;
【发表期刊期数】:《
计算机科学》2014年01期
【期刊简介】:本刊以其新颖、准确、及时为特色,突出动态性、综述性、学术性。报告特点是:“前沿科学”与“基础研究”相结合;“核心技术”与“支撑技术”相结合;“倡导”与“争鸣”相结合。广采百家之长,博览计算机世界之态势。重在突出文章的思想性,令人有开拓思路之......更多
计算机科学杂志社(
http://www.400qikan.com/qk/1234/)投稿信息
【版权所有人】:贾熹滨;尹宝才;孙艳丰;
更多
科技类论文详细信息:
[语音驱动论文]基于双层码本的语音驱动视觉语音合成系统
http://www.400qikan.com/lunwen/keji/18299.html
相关专题:交通论文网 集体备课方案 《计算机科学》相关期刊
推荐期刊:
中国史研究动态华北地震科学章回小说张家口职业技术学院学报今日新疆人力资源管理河北学刊互联网周刊医学分子生物学杂志气象科技进展
上一篇:
图像检测范文|一种基于RPCA的图像聚焦区域检测方法
下一篇:
重庆:数据清理整合保“金质”