人机语音通信研究评测实验室
研究领域:
本实验室是人机通信领域的教学、科研及实验基地,受中国科技大学及国家智能计算机研究开发中心双重领导。主要研究领域:
1)语音合成与语音识别,人机语音通信。
2)语音编码与图像编码,多媒体通信。
3)DSP及其应用,嵌入式系统。
4)中文语音系统的标准化研究。
主要在研项目:
编号 |
项目名称 |
来源 |
总经费(万元) |
1 |
高自然度语音合成研究 项目编号G1998030504-4 |
国家973项目 |
30 |
2 |
高性能汉语文语转换研究项目编号69975018 |
国家自然科学基金 |
16 |
3 |
汉语连续语音标准数据库项目编号863-306-ZT03-02-1 |
国家863项目 |
30 |
4 |
中文语音处理技术 |
讯飞公司 |
150 |
主要研究成果(1996年以来)
论文与著作:
1)李锦宇,王仁华:“HP/C 语音压缩与重放实现”,软件学报,第12卷,第6期,p914-921, 2001
2)戴礼荣等:“基于PSTN的远程多媒体监控系统”,中国图像图形学报,Vol.6(A),No.6 Jun.2001.
3)李枫,戴礼荣,王仁华:“单机多媒体监控系统中的数据采集、组织与传输”,数据采集与处理,第16卷,第1期,p119-124, 2001
4)戴礼荣,李锦宇,王仁华:“多路数字语音记录仪”,电子测量与仪器学报,第14卷,3期, p4-8, 2000
5)李锦宇,罗鑫,王仁华:“ITU-T G.729算法及其实时实现”,电子技术应用,第26卷,2期, p50-52, 2000
6)李锦宇,王仁华:“基于预搜索策略的ASELP语音编码算法”,信号处理,第16卷,第二期,p126-130, 2000
7)李锦宇,宋彦,王仁华:“双路 G.723.1在ADSP21061上的实时实现”,数据采集与处理,第15卷,第4期,p481-485, 2000
8)R.H.Wang, Liu Qinfeng, Hu Yu:“KD2000 Chinese Text-to-Speech System”,Advances in Multimodal Interfaces-ICMI2000
9)R.H.Wang,Ma Zhongke,Li Wei: “ A Corpus-Based Chinese Speech Synthesis with Contextual-Dependent Unit Selection”,The Sixth International Conference on Spoken Language Processing,P391,2000
10)Wu Xiaoru,R.H.Wang,Hu Guoping: “Special text processing based on external descriptor rule”,The Sixth International Conference on Spoken Language Processing,P689,2000
11)Li Jinyu,Luo Xin,R.H.Wang: “A Novel Search Algorithm for LSF VQ,The 6th International Conference on Spoken Language Processing”,P194,2000
12)Zhu Donglai,Hu Yu,R.H.Wang: “Automatic Segmentation and Labeling of Speech Corpus Based on HMM with Adaptation”,ISCSLP2000 Beijing,P351,2000
13)Yinbo,R.H.Wang:”A Hierarchic Processing Model In Chinese TTS”,International Proceeding on Chinese Speech Language Processing,P81,2000
14)Zhu Donglai,Hu Yu,R.H.Wang:”Automatic Segmentation and Labeling of Speech Corpous Based on HMM with Adaptation”,International Proceeding on Chinese Speech Language Processing,2000,P351
15)Ma Zhongke,Li WeiXia Deyu:”An Efficient Method to Synthesize Chinese Speech with Speaker Style”,International Proceeding on Chinese Speech Language Proceesing,2000,P315
16)王仁华:“PSTN网上可视多媒体通信终端”,通信学报, Vol.20, No.5, 1999.
17)刘庆峰,滕永盛,王仁华:“多路实时,高音质数字串合成系统”,声学学报,第24卷,第5期, p510-515, 1999.
18)R.H.Wang, ”Overview of Chinese text-to-speech systems”, Communications of COLIPS 8 (2): 221-234, 1999.
19)Qingfeng Liu, R.H.Wang, Zhongke Ma, Bo Yin: “Design and realization of a Chinese speech platform—Tianyin Huawang System”, Communications of COLIPS 8 (2): 211-220, 1999.
20)R.H.Wang ,Qingfeng Liu, Deyu Xia,: " Towards A Chinese Text-To-Speech System With Higher Naturalness", Proc. ICSLP98, p2047-2050, Sydney, 1998.
21)R.H.Wang: "Overview of Chinese Text-To-Speech Systems", Keynote of ISCSLP98, Singapore, 1998.
22)王仁华,倪晋富,刘庆峰:“KD-863汉语文语转换研究”,高技术通讯,第8卷,第8期, p9-p14,1998.
23)刘庆峰,王仁华: “基于LMA声道模型的语声合成新方法”,声学学报, 第23卷,第3期, p271-278, 1998.
24)何润中,王仁华,郭武:“一种有效的视频信号编码块效应消减技术”, 中国图形图象学报,第3卷,第5期, p381-385,1998
25)Qingfeng Liu, R.H.Wang: “A new synthesis method based on the LMA vocal tract model”, CHINESE JOURNAL OF ACOUSTICS,Vol.17,N0.2,p153-162,1998
26)江辉, 王仁华:“基于词组输入方式的汉语大词汇语音识别系统的研究”,中国科学技术大学学报,第27卷,第1期,p8-16,1997.
27)Jinfu Ni, R.H. Wang: “Modeling the control mechanism for generating the rise-fall patterns in F0 contours”,CHINESE JOURNAL OF ACOUSTICS, Vol16. No.4, p339-349,1997
28)Jinfu Ni, R.H. Wang, K. Hirose: “ Quantitative Analysis and Formulation of Tone Concatenation in Chinese F0 Contours”, Proc. Of EuroSpeech'97, p195-198, Greece 1997.
29)王仁华,徐超,戴礼荣:“ITU-T G.723.1双速率语音编解码器定点DSP实现”, 信号处理学报,第13卷,第3期,p199-206,1997
30)王仁华,江辉:“基于状态码本的连续隐马尔可夫模型”,信号处理学报,第12卷,第2期,p117-123, 1996.
31)王仁华,江辉:“正反向隐马尔可夫模型及其在连续语音识别中的应用”, 电子学报,第24卷,第10期,p63-68, 1996.
32)倪晋富,王仁华:“模型化F0曲线中的升降模式控制机制”,声学学报, 第21卷,第6期,p863-871, 1996.
33)R.H.Wang, Qinfeng Liu, Defei Tang: "A New Chinese Text-To-Speech System With High Naturalness" , Proc.ICSLP-96,p1441-1444,1996,10, USA.
34)R.H.Wang, Deyu Xia, Jinfu Ni: "USTC95 - A Putonghua corpus", Proc.ICSLP-96, p1894-1897, 1996,10, USA.
获奖情况:
1)KD系列汉语文语转换系统,2002年国家科技进步二等奖
2)KD系列汉语文语转换系统,2000年安徽省科技进步一等奖
3)介绍KD863文语合成系统的论文获得1998年12月在新加坡召开的国际汉语口语会议的最佳论文奖(语音合成方面的唯一奖)
4)KD2000中文语音合成系统获2000年中国国际软件博览会创新奖
5)“一种图象/语音前端处理装置”,专利号:ZL-00-2-04487.0,证书号:413173;2000
6)SJ-9608多通道数字语音记录仪。1998天津市科技进步二等奖
7)汉语人机语音对话系统工程。(中科院"八五"重大应用项目, 1996年3月通过中国科学院成果鉴定)
8)获第五、六、七届“挑战杯” 全国大学生课外学术科技作品竞赛二等奖和一等奖
9)2001年实验室负责人获国家863计划15周年先进个人称号
国际学术交流与合作:
本实验室的研究课题"高级人机语音通信"是中国科学技术大学和日本东京大学长期合作课题之一。与本课题对口的日方合作者藤崎博也教授 (东京大学名誉教授, 现为东京理科大学教授)是国际知名学者,也是本实验室的客访教授。藤崎博也教授每年定期来校讲学和讨论, 本实验室也派人去东京大学进行合作研究工作。另一名合作教授广赖启吉和王仁华教授分别为中日大学群合作项目中,“电子与信息工程”领域的日方和中方的负责人。除学术交流,共同培养博士研究生外,还定期组织召开中日双边学术会议。
为了跟上国外高新技术发展,并尽快将实验室的研究成果推向市场,实验室与美国ANALOG DEVICES公司长期合作开发ADSP技术。在单片ADSP2181上实时实现了G.723.1语音编码,达到了国际先进水平,受到了国内外普遍重视和好评。通过合作,在国内率先引进了ADSP 218X 和 ADSP 2106X开发工具,这些开发工具的引入使实验室的DSP研究与开发水平大大提高,有效地缩短了与国际先进水平的差距,在国内已处于领先地位。
研究条件:
1)SUN ULTRA-1 工作站 1台
2)SUN SPARCⅡ 工作站 2台
3)高档微机 20台
4)SONY DAT 记录设备 2套
5)DSP 开发设备 多套
6)标准录音室及录音设备