现代信号与数据处理实验室
Advanced Data & Signal Processing Laboratory

“智能语音技术”产学研研讨会成功举办

时间:2017-07-06

撰稿:罗丹青

2017年7月5日上午,“智能语音技术”产学研研讨会如期在北京大学深圳研究生院C栋203教室举行。该研讨会由ADSPLAB实验室邹月娴教授牵头组织,众多学术界及产业界的专家学者纷纷到场,齐聚一堂共同学习讨论语音相关技术的最新动向和发展趋势。

研讨会由两部分组成,首先由梁伟文、康世胤和桂林三位领域专家依次进行专题演讲,最后是自由互动时间。

研讨会的第一个专题是语音识别中的解码器,由梁伟文先生进行演讲。梁伟文现为广州视源公司中央研究院科学家,参与其语音识别技术研发工作。他硕士毕业于南开大学,曾组建搜狗和百度的语音团队,并负责其语音识别的研发工作,目前的研发方向包括语音识别,语音合成,语义理解,手写识别等。梁先生首先为我们介绍了语音识别技术中解码器的功能和原理,接着深入讲解了解码器整体的架构及其设计技巧,最后介绍了剪枝这一解码器中最重要的加速手段。

1

图1 梁伟文先生进行专题演讲

 

第二个专题是语音合成,由康世胤博士进行演讲。康博士现为腾讯AI Lab高级研究员,从事语音合成算法的研发工作。他于2007年和2010年分别获得清华大学学士和硕士学位,2016年获得香港中文大学博士学位,已在一流期刊和会议上发表学术论文10余篇,被引用200余次,主要的研究兴趣包括语音合成及识别、说话人转换、深度学习、机器学习等。在报告中,康博士从基本概念出发,介绍了语音合成技术的整体框架,以及深度学习技术在语音合成中的应用,最后总结了语音合成技术的最新进展和未来可能的发展方向。

2

图2 康世胤博士进行专题演讲

研讨会的最后一个专题是文本情感原因发现,由桂林博士生进行演讲。桂林现在哈尔滨工业大学攻读博士学位,今年即将毕业,在读博期间曾多次前往香港理工大学以及英国Aston大学交流访问,在ACL、EMNLP、IJCAI、CIKM、World Wide Web等领域相关的重要国际会议及期刊发表论文多篇,并于2016年获得百度奖学金资助,目前的研究方向包括自然语言处理、文本情感分析。桂博士在演讲中首先给出了情感原因发现的任务定义,再介绍了相关数据集的构建方法和算法的设计方法,最后对该领域的前沿工作和未来方向进行了展望。

3

图3 桂林博士进行专题演讲

 

三位讲者介绍完各自的领域后,便是自由讨论交流环节。在场听众不仅纷纷向讲者提问,也各自互相讨论,现场气氛非常热烈,大家都从彼此的交流中收获颇丰。最后,此次研讨会以全体合影落下了帷幕。

4

图4 听众进行提问

5

图5 研讨会留影

该次研讨会积极促进了学术界和产业界之间的交流互动,对技术的进步和实用化都有着重大意义。研讨会最终获得了到场专家学者的一致好评,大家反响强烈,并共同期待下一次研讨会的举行!