爱荷 发表于 7 天前

多模态版DeepSeek来了,北大出品,可用于机器人控制


机器人前瞻2月13日报道,最近,北京大学联合香港科技大学团队基于自研全模态框架Align-Anything,将纯文本模态的Deepseek R1系列模型拓展至图文模态,推出多模态版DeepSeek-R1,即Align-DS-V,它在部分视觉理解表现评测集上超越GPT-4o。
联合研究团队中的北京大学对齐团队的指导老师为北京大学人工智能研究院助理教授杨耀东,他同时也是北京具身智能初创公司灵初智能与北大共同成立的具身灵巧操作联合实验室首席科学家。

爱荷 发表于 7 天前

凭一张图就能让大模型操控机械臂。
页: [1]
查看完整版本: 多模态版DeepSeek来了,北大出品,可用于机器人控制