来源:视觉语言导航封面图源:豆包AI生成作者: Xiaofeng Han, Shunpeng Chen, Zenghuang Fu, Zhe Feng, Lue Fan, Dong An, Changwei Wang, Li Guo, Weiliang Meng, Xiaopeng Zhang, Rongtao Xu, Shibiao Xu单位:中科院自动化所多模态人工智能系统国家重点实验室,北京邮电大学人工智能学院,算力互联网与信息安全教育部重点实验室;山东计算机科学中心论文标题:Multimodal...