报告题目:基于GAN的语音增强
报告时间:2023年7月3日(周一)15:45
报告地点:信息科技大楼A101-102会议室
主持人:张国庆副教授
新西兰工程院士王瑞丽博士目前是新西兰奥克兰梅西大学自然与计算科学学院的人工智能教授和R esearch主席,他是该学院语言和语音处理中心的主任。他目前的研究兴趣包括视频处理、语音
处理和自然语言处理。他是国际期刊编辑委员会的成员和副主编,包括IEEE Transactions on Emerging Topics in Computational Intelligence、Neurocomputing、Knowledge and Information
Systems以及Applied Soft Computing的期刊。
报告(内容)摘要:
语音增强旨在提高受污染语音信号的清晰度和整体感知质量,是改善语音通信的有效途径,已广泛应用于移动通信、助听器设备、语音助手等。最近,我们提出了几种基于生成对抗网络(GAN)
的语音增强方法。研讨会将介绍其中的两个。第一个是用于潜在空间探索的对抗性潜在表示学习。该方法基于对抗特征学习,采用额外的编码器来学习从生成的数据分布到潜在空间的逆映射。
换句话说,编码器在发生器和潜在空间之间建立了内部连接。其次,我们提出了一种对抗性多任务学习,采用逆映射方法进行有效的语音表示。该方法侧重于增强生成器的语音信息捕获和表
征学习能力。为了实现这种方法,开发了两个额外的网络来学习从生成的分布到输入数据域的逆映射。
欢迎广大师生踊跃参加!
计算机学院、网络空间安全学院
2023年7月3日