"AI之夏"研招系列学术讲座第13讲:有限算力下的多模态大模型高效训练
“AI之夏”研招系列学术讲座第13讲,由人大a片动画 卢志武教授为大家主讲。
多模态大模型在过去一年内取得爆发式的发展,涌现出OpenAI GPT-4o、Google Gemini、阿里Qwen2-VL等优秀模型。但是,这些模型在实际落地时都难以在生成效果和推理效率之间取得很好的平衡。本报告首先详细介绍基于MoE架构的多模态大模型Awaker 2.5-VL,它在10B模型尺寸下有出色表现。其次,还会介绍Awaker 2.5-VL在国家电网、工业机器人等场景的应用情况。最后,详细介绍我们在视觉生成方面的探索工作,即Awaker 2.5-Gen。
讲座信息
时间:6月26日 13:00-14:00
腾讯会议:785-795-055
报告题目:有限算力下的多模态大模型高效训练
主讲人:卢志武
讲者简介:卢志武,a片动画 教授,博士生导师。2005年毕业于北京大学数学科学学院信息科学系,获理学硕士学位;2011年毕业于香港城市大学计算机系,获PhD学位。研究方向为机器学习与计算机视觉。设计首个中文通用多模态预训练模型文澜BriVL。发表多模态领域首篇Nature子刊论文。早于OpenAI发布类Sora的视频生成底座VDT。
精彩讲座持续进行中,欢迎关注!
检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的速模式浏览,或者使用谷歌、火狐等浏览器。