永利yl23411no1举办第Ⅵ期第42场“玛珈山名家论坛”

2025年07月23日 18:56    浏览次数:
主讲人 时间
地点


7月16日上午,永利yl23411no1举办“玛珈山名家论坛”系列学术讲座暨2025年永利yl23411no1“AI+低空技术与工程”研究生暑期学校报告,邀请北京航空航天大学计算机学院黄迪教授开展“开放环境视觉感知”专题报告。


报告开场,黄迪聚焦开放环境视觉感知的核心挑战,深入剖析样本差异、语义差异带来的影响。他指出,开放环境下数据分布复杂多变,相比封闭环境,更易出现模型泛化难题,清晰阐释了开放场景中视觉感知技术面临的天然困境 。随后,黄迪结合开放环境机器人抓取、人脸防伪、行人检测等具体研究场景展开讲解。在机器人抓取部分,他提出引入领域先验知识应对未见物体泛化的思路,从物理先验、接触先验等维度,为解决复杂场景下物体识别与交互难题提供新路径 。人脸防伪与行人检测的研究内容,引导师生思考多模态感知、抗干扰识别技术在多样化实际场景(如公共安全监测、智能交互系统 )中如何落地应用,拓展技术迁移想象空间。

报告尾声,黄迪围绕样本差异、语义差异的解决方向,提出建立域不变表征、引入外部知识等展望,还提及多模态大模型进展对开放环境视觉感知的推动价值,勾勒技术发展新方向。现场交流环节,线上线下反响热烈,师生围绕技术细节、多模态融合实践等积极提问、深入探讨,思维碰撞不断。

此次报告让学院师生深度了解开放环境视觉感知前沿成果,为计算机视觉领域学术研究、技术应用拓宽思路,助力搭建跨场景、跨任务的技术融合思考框架,提供宝贵学术参考与创新灵感

【黄迪,博士,北京航空航天大学计算机学院教授,博士生导师。长期从事计算机视觉、表示学习、具身智能方向的基础理论与关键技术的研究工作,承担国家重点研发计划项目、国家自然科学基金等科研任务,在IEEE TPAMI、CVPR等领域内重要期刊会议发表论文100余篇,引用13800余次,获IEEE ICB等学术会议论文奖项6次、国际音视频情感计算竞赛第1名、国际机器人抓取与操作竞赛第1名。成果成功应用于公安、网安、医疗等国家重要行业,成效显著。任中国人工智能学会第七届、第八届理事和智能交互专委会秘书长,曾获吴文峻人工智能自然科学一等奖、中国图象图形学学会自然科学二等奖、中国人工智能学会杰出贡献奖等荣誉。】