mwave@ustc.edu.cn +86 0551-63601307

凌震华副教授研究团队在2014年国际语音合成大赛再创佳绩(7.28)

  • 谭勇_006
  • 2014-07-28
  • 213

  在刚刚结束的“Blizzard Challenge 2014”国际语音合成大赛上,中国科学技术大学语音及语言信息处理国家工程实验室报送的参赛系统在25项测试指标中的11项位列第一,取得了所有参赛系统中最好的综合表现。这是继2006至2013年后,科大语音实验室连续第9次在此活动中取得佳绩。这充分体现了实验室在语音合成技术上稳固的领先地位。

  作为国际上规模最大、最具影响力的语音合成大赛,历届Blizzard Challenge吸引了国际一流的科研单位和一流企业参加。之前历届的参赛单位包括CMU (美国卡耐基-梅隆大学)、Edinburgh University(英国爱丁堡大学)、Nitech (日本名古屋工业大学)、ATR(国际电气通信基础技术研究所)、IBM 研究院、微软亚洲研究院等语音技术领域的世界知名研究机构。与往届相比,本次大赛首次将主要测试语种由英语转换到了非英语语种,要求提交的合成系统包括印地语、阿萨姆语等六种印度语种,并增加了这些语种与英文混读情况下的合成测试,进一步提高了测试的难度。

  语音及语言信息处理国家工程实验室的一个研究团队在凌震华副教授带领下,克服了时间紧、语种多、小语种语言资源与专家经验匮乏等困难,充分发挥实验室在语音合成核心技术上的优势,采用基于统计声学模型的单元挑选与参数合成技术方案,在不到两个月的时间内完成了所有参测系统的构建。此外,研究团队提出并实现了基于深度神经网络的合成新方法,进一步提高了合成语音质量。本届活动组织方选择了5个语种在统一组织下进行主观测试,每个语种的测试指标包括相似度、自然度、可懂度、英文混读相似度和英文混读可懂度。语音及语言信息处理国家工程实验提交的参赛系统获得了印地语合成语音相似度与可懂度、印地语英语混读合成语音相似度与自然度等共计11个指标的第一名,其综合表现在所有参测系统中是最好的。

  语音及语言信息处理国家工程实验室于2011年6月由国家发展改革委正式批准成立,由中国科学技术大学和安徽科大讯飞信息科技股份有限公司联合共建,其前身为中国科学技术大学讯飞语音实验室。实验室充分发挥研究支撑和产业主导的综合优势,是我国语音产业界唯一的国家级研究开发平台。