ADSP实验室参加DSP 2018国际会议
撰稿人:刘超
2018年11月18日至11月21日,第23届数字信号处理国际会议(The 23rd International Conference on Digital Signal Processing,DSP2018)在上海科技大学召开。北京大学现代信号与数据处理实验室主任邹月娴教授以及16级硕士生刘超、种大丁参加了会议。
此次大会,ADSP实验室共发表2篇文章并且均通过口头报告的形式在大会上进行汇报和讨论,内容涵盖了实验室在文本目标检测以及声源事件检测相关领域的最新研究进展。
在文本目标检测方面,刘超作为第一作者发表的文章“Hierarchical Feature Fusion With Text Attention For Multi-scale Text Detection”提出了基于SSD检测框架下的层级特征融合模块以及注意力(Attention)机制模块,来提升自然场景下近水平多尺度文本目标检测的表现,提升了对于小尺度文本及模糊文本检测的效果。该方法在ICDAR2013、ICDAR2015以及SVT这三个标准数据集下的实验结果均取得优异的表现。
在声音事件检测方面,15级学生张小虎作为第一作者发表的文章“DCH-Net: Densely Connected Highway Convolution Neural Network for Environmental Sound Classification”由种大丁代为汇报,该文章提出了基于密集连接的深度卷积神经网络的声音事件检测算法,设计了密集连接的66层卷积神经网络模型,用于提取音频事件深度特征,提升了声音事件检测的准确率。该方法采用密集连接结构,一定程度上缓解了梯度消失问题,该方法在ESC50以及ESC10这两个公开数据集上的实验结果均取得了优异的表现。
此外,刘超和种大丁同学认真聆听学习了著名专家学者的主题报告,并积极地同参会者等进行了深入的讨论和交流,拓宽了学术视野,期待能做出数字信号处理领域更新更强的研究成果。
图1.刘超同学做口头报告
图2.种大丁同学在做口头报告
图3.ADSP实验室学生刘超在会场留念
图4.邹月娴教授和参会学者合影