现代信号与数据处理实验室
Advanced Data & Signal Processing Laboratory

微软首席研究员俞栋博士应邹老师邀请来我院做学术报告

时间:2016-10-30

撰稿人:15级黄艺驰

2016年10月28日下午,应邹月娴教授邀请,微软研究员首席研究员俞栋博士来我院访问交流,在我院C栋203教室发表了题为“Deep Learning: Core concepts and applications”的学术讲座。参加讲座的有来自北大信息工程学院的朱跃生教授、邹月娴教授、李革教授、赵勇副教授、崔小乐副教授、中科院先进院的乔宇博士、深圳大学陈彬副教授团队以及信息工程学院的同学们。

俞栋博士,1998年加入微软公司,2002年加入微软研究院语音和对话组(Speech and Dialog Group),担任首席研究员,兼任浙江大学兼职教授和中科大客座教授。他一直专注于机器学习技术在语音识别和其他任务的应用,是语音识别和深度学习方向的资深专家。他出版了两本专著,发表论文160余篇,是60项专利的发明人及深度学习开源软件CNTK的发起人和主要作者之一。他与邓力博士、Hinton等共同研发的语境依赖深层神经网络-隐马尔科夫模型(CD-DNN-HMM)是深度学习技术在大词汇量语音识别任务的首次成功应用,他的这种突破性工作,曾获2013年IEEE信号处理协会(IEEE SPS)最佳论文奖,引起大词汇语音识别模式的转变,推动了深度学习在语音识别上的应用。俞栋博士是IEEE高级会员、ACM和ISCA会员,现担任IEEE语音语言处理专业委员会委员。曾任IEEE音频、语音和语言处理期刊-语音和语言处理中的深度学习特刊(IEEE transactions on audio, speech, and language processing– special issue on deep learning for speech and language processing)首席客座编辑、IEEE信号处理杂志(IEEE signal processing magazine)编辑。

近几年,深度学习在许多特定的人工智能任务中取得了显著的效果,俞栋博士本次讲座也紧紧围绕深度学习展开,分为三部分,第一部分是对深度学习中的核心概念讲述,包括:1)Multi stage Nonlinear Transformation View; 2) Hierarchical Feature Representation View; 3) End-to-end Optimization View; 4) Encoder-Decoder View; 5) Optimization Strategy Matters;同时提出模型结构的设计和训练准则的选择在深度学习中至关重要。第二部分俞栋博士介绍了深度学习在语音任务上的成功应用,包括:1)Deep CNN, deep LSTM;2) CTC, LFMMI; 3) Attention model + CTC; 4) PIT; 5) WaveNet。 第三部分,俞栋博士提出了深度学习未来趋势和挑战,包括:1)End-to-End model; 2) Unsupervised Learning; 3) Transfer Learning: 4) Semantic Representation and Reasoning; 5) Learning Algorithm; 6) Problem Solving。演讲结束,进入提问环节,参会的嘉宾和同学们向俞栋博士提出了自己感兴趣的问题,俞老师对大家的问题进行了耐心回答和讲解。讲座持续了2个多小时,俞栋博士给参与讲座的嘉宾和同学们带来了一场深度学习领域高含金量的学术交流体验。讲座结束,俞栋博士与参会人员合影留念。图1-俞栋博士单人照

图1. 俞栋博士演讲

 

图2-提问

图2. 同学们向俞栋博士提问

图3-合影

图3. 俞栋博士与参与讲座人员合影