上海首家人形机器人量产企业发布通用具身模型基座
智元机器人是由“稚晖君”彭志辉创办的人形机器人初创公司,也是上海首家实现人形机器人量产的企业。该企业2024年已下线1000台人形机器人,并将在2025年实现数千台的年产量。
智元机器人2024年已下线1000台人形机器人,并将在2025年实现数千台的年产量。中新网记者 汤彦俊 摄
智元具身研究中心常务主任任广辉当日接受记者采访时表示,GO-1大模型借助人类和多种机器人数据,让机器人获得了革命性的学习能力,可泛化应用到各类的环境和物品中,快速适应新任务、学习新技能。同时,它还支持部署到不同的机器人本体,高效地完成落地,并在实际的使用中持续不断地快速进化。
任广辉介绍,GO-1大模型的特点可归纳为4个方面。首先是人类视频学习。GO-1大模型可以结合互联网视频和真实人类示范进行学习,增强模型对人类行为的理解。
第二是小样本快速泛化。GO-1大模型具有强大的泛化能力,能够在极少数据甚至零样本下泛化到新场景、新任务,不仅降低了具身模型的使用门槛,也大大了降低后训练成本。以“倒水”这一动作为例,如果人形机器人没有搭载大模型,完成该动作的训练需要1万至5万条数据采集;搭载大模型后,完成该动作仅需1000条左右数据采集。
第三是“一脑多形”。作为通用机器人策略模型,GO-1大模型能够在不同机器人形态之间迁移,快速适配到不同本体,类似“群体升智”。
第四是持续进化。任广辉介绍,搭配一整套数据回流系统,GO-1大模型可以从实际执行遇到的问题数据中持续进化学习,“越用越聪明”。
3月10日,智元机器人发布通用具身模型基座:智元启元大模型(Genie Operator-1,简称GO-1)。智元机器人 供图
如何达成这些?智元机器人合伙人、具身智能事业部总裁姚卯青介绍,这源于GO-1的Vision-Language-Latent-Action(ViLLA,即视觉-语言-隐式-动作)架构,该架构由VLM(多模态大模型)+ MoE(混合专家)组成。
“VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作数据获得通用的动作理解能力,MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力。”姚卯青介绍,通过三者环环相扣,让GO-1可利用人类视频学习,完成小样本快速泛化。
“例如,用户给出指令告诉机器人要做的事情,比如‘挂衣服’,模型就可以根据看到的画面,理解这句话对应的任务要求。”任广辉表示,该模型可根据之前训练时看过的挂衣服数据,设想这个过程应该包括哪些操作步骤,最后执行这一连串的步骤,完成整个任务的操作。
距离人形机器人进入家庭“打工”还有多久?“我们目前发布的技术处于从G3到G4的过渡阶段。”任广辉表示,人形机器人走进家庭创造价值,还需5年左右。(完)
- 上海首家人形机器人量产企业发布通用具身模
- 宁夏民营企业累计获签逾1900份RCEP出口原产
- 青年消费,“性价比”走向“心价比”
- 中国最大南极磷虾专业捕捞加工船启航
- 迈向全光万兆时代 F5G全光园区2.0成数智园
- 「知其所以」特别篇 X四川观察|当科技更
- 中粮可口可乐开展“梦想书架”活动
- 从《食养中国》走进峨眉山中,与中粮悦活一
- 《食养中国》走进峨眉山,探寻自然的味道
- “爱在山野”中粮可口可乐开展感恩节活动
- 垃圾分类做得对不对?中粮可口可乐邀你“纠
- 有担当·有作为·有爱心 韶光十年“在乎”
- 团圆礼盒丨定制祝福送到你心“礼”
- 后疫情时代行业竞争压力大,欣宝风空压机品
- 太古可口可乐中国内地2021表现强劲总裁苏薇
- 快问快答:艾拉物联Max Pad之超级智慧中
- 到2050年乡村全面振兴 农民富全面实现
- 为了我们的新时代,奋斗2018
- 蓝筹白马还会是赚钱的金饭碗吗?
- A股2018年继续慢牛格局 债市基本面不悲观
- 由于近期遭遇极寒天气,加拿大一些地区被迫
- 从穷小子、大球星到利比里亚总统
- 患儿“扎堆儿”奔急诊 看发烧等6小时
- 空中改卷 “网红”又红了
- 全国城镇土地面积增长速度总体呈逐渐放缓趋
- 全国城镇土地中超过三分之一是住宅用地
- “去哪儿网”自营店307张机票违规超收机票
- 限额后,我们还能愉快地扫码“买煎饼”吗?
- 重庆市园博园管理处举办“2018新春嘉年华”
- 华创证券重庆分公司落户重庆自贸试验区两江