现代信号与数据处理实验室
Advanced Data & Signal Processing Laboratory

深圳机器人语音技术青年博士论坛成功举办

时间:2018-01-16

2018年1月16日上午,由深圳市机器人与智能系统专委会携手深圳市智能多媒体与虚拟现实重点实验室联合主办的2018年“深圳机器人语音技术博士论坛”在北京大学深圳研究生院国际法学院108会议室成功举办,论坛旨在促进和推动深圳市智能语音技术产学研融合与发展,搭建沟通交流平台,论述智能语音产业发展需求,分享最新学术研究成果,探讨人工智能时代产学研融合发展新特点和新模式。
本次论坛共邀请了来自产学研一线的6位青年博士领军人才,他们分别是庞建新、孙立发、李坤、陈霏、曾子铭。深圳机器人与智能系统专委会秘书长、北京大学教授、博士生导师邹月娴博士为论坛主持人,北京大学深圳研究生院信息工程学院副院长、北京大学教授、博士生导师朱跃生博士为大会致开幕辞。来自学界的专家学者、企业界的管理研发人士以及在读硕博士等近六十人参加了本次盛会。
深圳市优必选科技有限公司研发副总裁的庞建新博士,首先提全面地分析了机器人应用中的对智能语音技术的需求,其中包括麦克风阵列、语音信号识别、自然语言处理、语音合成和自然语音交互等,清晰地为论坛勾画了当下主流语音技术的脉络。

图1 庞建新博士在论坛做报告
深圳市声希科技联合创始人、香港中文大学博士孙立发博士分享了深度学习在语音转换领域的应用。孙博士创新地使用深度学习算法,实现了“非平行语句以及跨语言”间的语音转换,提高转换系统的实用性和灵活性。同时,他也就提高转换语音自然度和相似度进行进一步地探讨。常用的语音合成技术已基本解决了文字转语音的难题,但如何判断用户合成文字时的意图和情感还有许多难点。

  图2 孙立发博士在论坛做报告

清华大学信息科学与技术学部副教授吴志勇博士的研究方向主要集中在多模多媒体处理和通信领域,尤其是视听双模建模,文本 - 视听 - 语音合成,自然语言理解和生成。论坛中为我们带来的报告主题是智能语音交互中的用户意图理解和表现力语音生成。就智能语音交互中如何理解用户意图、如何生成有表现力的语音进行了分享和技术展示。

图3 吴志勇博士在论坛做报告

深圳市声希科技联合创始人、香港中文大学博士李坤的演讲以“AI+语言学习”为主题,论述了人工智能技术在语言学习领域的运用和发展。李博士认为,AI可以帮助解决现有教育体系中的种种问题,提高学生参与学习的积极性,强调学生的主体性,实现以教师和课本为中心向以学生为中心的改革。

图4 李坤博士在论坛做报告

陈霏,香港中文大学博士,美国德州大学达拉斯分校博士后,现为南方科技大学电子与电气工程系副教授,则为大家分享了智能助听领域的语音降噪技术和语音增强技术的研究成果,以达到改善用户体验的目的。图5 陈霏博士在论坛做报告

最后,来自深圳壹秘科技有限公司的CTO、英国威尔士大学计算机博士曾子铭,分享了语音技术应用于远程会议的场景的研究成果。他首先分析了现有远程会议系统的痛点,然后分享了他们公司所提供的语音技术解决方案。  图6 曾子铭博士在论坛做报告

各位专家学者在此次论坛不仅深度分析了前沿的语音技术成果,还紧密与联系了市场动向,进一步激发了与会者在产学研结合方面的想象力。
大会最后,邹教授组织现场嘉宾就语音技术相关问题同青年博士报告人进行了互动交流,并拍照合影,为此次论坛画上了圆满的句号。

 图7 邹教授组织青年博士嘉宾同参会者互动

图8 部分专家合影

(从左至右依次为:声希科技联合创始人孙立发,清华大学副教授吴志勇,南方科技大学副教授陈霏,北京大学教授李挥,北京大学教授邹月娴,北京大学信息工程学院副院长朱跃生,优必选研发副总裁庞建新,腾讯高级研究员康世胤,声希科技联合创始人李坤)