4月14日下午,计算机与信息学院主办的人工智能创新讲堂系列报告在明理楼 0326 会议室成功举行。本次报告邀请浪潮高端服务器系统全国重点实验室研究员杜国光博士担任主讲嘉宾,主题为 “视频生成模型驱动的 3D 内容生成”。相关教师、研究生、本科生通过线下参会和线上会议的方式参与了此次学术交流活动。

报告中,杜国光研究员首先剖析了3D 内容生成领域面临的核心挑战 ——3D 数据获取成本高、规模小且多样性不足,严重制约了 3D 生成模型的发展。他指出,海量视频数据为解决这一难题提供了新思路,因为视频天然具备多视角空间一致性,同时拥有规模和语义覆盖优势。针对现有方法存在的底座视频生成模型空间一致性较弱、微调所用 3D 数据规模有限且缺乏文本监督等问题,杜国光团队构建了适配 3D 生成的底座视频生成模型 DropletVideo,以及基于大规模高质量 3D 渲染视频数据微调的环绕视频生成模型Droplet3D。这两款模型支持图文输入,在 3D 空间一致性和可控生成等方面表现卓越,能够高质量生成 3D 高斯点云和带纹理网格模型,充分展示了视频生成模型驱动 3D 内容生成范式的巨大潜力。此外,杜国光研究员还分享了其在多模态视频及 3D 内容生成领域的最新研究成果和实践经验。
本次学术报告是人工智能创新讲堂系列活动的第五场,为师生们搭建了与行业专家交流的平台,有效拓宽了师生们的学术视野,激发了对人工智能前沿技术的研究热情。未来,学院将继续举办此类高水平学术活动,推动人工智能领域的学术交流与创新发展,助力学院科研工作提质增效、再上新台阶。
(作者:计算机与信息学院 陶振钊、王洪丰;供稿审核人:郭长友)