36氪出海 - 助力中国公司全球化

  • 英文站 KrASIA
  • 日文站 KrJAPAN
36氪出海
36氪出海
人工智能

聊模型的王兴兴

深度观察 

王兴兴认为应该把焦点放在具身机器人的模型架构上,因为现在的模型“不够好、也不够统一”。
分享:

当行业里都认为,宇树是一个做机器人本体的公司,宇树科技创始人王兴兴,在世界机器人大会(WRC)期间的一番言论,打破了这刻板印象。

WRC上,王兴兴在他的主题演讲中,将大段篇幅留给了模型、算法和数据,其中不少观点引起了行业广泛讨论——

比如,对于当前机器人大火的VLA(Vision-Language-Action)路线,王兴兴直言,他持有一定的怀疑态度。他甚至认为,“这是一个相对傻瓜式的架构”。

原因是具身领域的现存数据量不够。王兴兴认为,当VLA模型与真实世界交互的时候,背后的数据质量、数量,并不太够用。

这已经是个共识,但不少具身公司都疯狂用堆真机数据、仿真数据、甚至建数采厂的方式来弥补。

王兴兴对此也直言不讳——“大家对于基础数据的关注度太高了”,相反,他认为应该把焦点放在具身机器人的模型架构上,因为现在的模型“不够好、也不够统一”。

“宇树的模型团队其实不算小”

此前王兴兴在公开场合中多次强调,宇树的核心优势在于机器人本体硬件而非大脑,过往的种种表述,很容易让外界产生,“宇树不做机器人大脑”的印象。

而在WRC期间,王兴兴向《智能涌现》等媒体表示,宇树虽然对于模型的投入保持谨慎状态,但其实“模型团队人数算多的,但相比于AI大厂算少的。”

△王兴兴接受媒体采访中 《智能涌现》拍摄

但是,他也坚信,在模型上部署人员数量多寡,与最终的结果并不强挂钩——至少,从过去AI领域的经验来看,创新不一定在大厂中发生。

“不是资源多、钱多、人多,就能做出全球最好、最早的技术,一个中小型团队,也是有概率做出更好的模型,只是压力也会很大。”王兴兴对《智能涌现》等媒体说到。

在大脑的路线选择上,王兴兴选择多方下注,他的另一个引发行业热议的论点,有关当下最热门的“VLA”。

王兴兴并不认同行业里在VLA模型还不够好的情况下,就疯狂堆一大堆数据去训练。因为,对于一个能力更强的具身模型来说,或许只要很少的数据,就能以更高的成功率做训练。

当然,宇树不是完全不使用VLA,在演讲中,王兴兴也提到,宇树也在尝试在VLA模型上,加AI进行训练。

不过,在大脑路线上,宇树显然会更倾向于视频的路线。去年,谷歌已经发布了视频驱动的世界模型,王兴兴说,早在去年,宇树已经尝试了类似的方法。

具体而言,就是先让视频生成模型生成一个「机器人整理房间」的视频,再用这个视频去驱动机器人,完成整理房间的任务。

△王兴兴演讲截图

王兴兴判断,这种视频的路线,未来或许会比VLA的路线发展更快、收敛的概率更大。只是,这种视频的路线也不是100%完美。由于对视频质量要求过高,会导致GPU消耗过多。

但未来机器人的算力问题如何解决,王兴兴也有了一定的预期。

他判断,未来机器人领域,需要搭建低成本、大规模、分布式的算力集群。他认为,未来如果一个工厂里有 100 个机器人,那工厂里面大概率可以搭建一个分布式的服务器集群,因为机器人需要更低的通讯延迟。

宇树机器人,只表演,不干活?

从今年春晚的机器人扭秧歌丢手绢,再到今年WAIC、WRC大火的机器人格斗,这让很多人以为,宇树的机器人不干活,只做表演。

尤其是,一众新入局者,都在费尽心思把机器人送进工厂拧螺丝、叠衣服、叠被子,形成了对比。

王兴兴直言,现阶段要让机器人进工厂、进家庭干活,并不太现实,而在当前,表演则是机器人相对容易落地的方向

相反,在宇树的内部,思考如何让机器人干活的员工,也是最多的。

他也解释了为什么宇树很少对外宣传机器人干活的场景——“机器人干活,对于AI模型的挑战很大,目前我们的实现也并不理想。”

对于“干活”这件事,王兴兴提出了自己的看法——他希望,机器人不应该只做单功能性的事情,比如整理衣服、烧菜,而应该是通用型、多功能的,比如能在工厂端茶倒水,又能做表演。

王兴兴这次也对机器人的节点下了判断:机器人的ChatGPT时刻,最快可能2-3 年实现,最慢可能是3-5年。他认为,这波具身智能浪潮,不会超过10年。

不过,ChatGPT时刻长啥样?

王兴兴设想了一个画面——在一个场馆里,人形机器人随意走来走去,你随机吩咐一个机器人做点事情,他都能帮你完成时,这才达到了机器人的“临界点”。

头图 | 宇树科技官网

本文来自智能涌现,文|邱晓芬,编辑|苏建勋,36氪出海经授权发布。

近期活动

活动 | 迪拜出海实战分享:落地典型路径与关键决策解析

为帮助企业打通迪拜落地路径,36氪出海将联合迪拜 IFZA 自贸区,于8月13日举办线上活动。IFZA 自贸区的中国代表将与36氪出海的中东特别顾问共同带来分享,结合近期真实案例,围绕企业在决策阶段的常见难点、自贸区在落地过程中的支持机制,以及落地后各类运营事项的实操路径,为中国企业提供清晰的判断依据与行动建议。欢迎您扫描下方二维码或点击“此处”,填写表单,报名参加本次活动。活动报名将于2025年8月12日23:59截止。

近期发布

KrASIA 英文媒体服务助力中国公司提升全球品牌

在全球经济复杂格局的当下,英文报道不仅是向海外客户和消费者传递价值主张的重要手段,也是企业在世界范围内的认知沉淀。英文媒体 KrASIA(kr-asia.com)致力于向世界介绍中国商业和文化。英文网站约60%的读者为东南亚核心国家的商业人群。KrASIA 通过优秀的搜索引擎优化,专业的英文内容和可靠的社交媒体矩阵,以及全球顶级信息数据平台彭博终端和道琼斯 Factiva 等外部收录平台,帮助中国公司提升全球品牌。如果您的公司对英文传播有相关需求,或者希望与 KrASIA 合作提供出海服务,欢迎点击“此处”或扫描下方二维码,获取 KrASIA 媒体服务刊例和工作人员的联系方式。

加入36氪出海学习交流群

目前,36氪出海学习交流群已经吸引超过15,000位出海人加入,他们来自国内外初创企业、行业巨头、投资机构等。在出海社群里,我们为成员挑选整理每日全球跨境资讯,帮助出海人把握最新动态;定期组织出海交流活动,链接出海生态圈,寻找潜在合作伙伴。欢迎添加36氪出海小助手微信(ID:wow36krchuhai-xzs2)申请入群,一同出海!

分享
//
热门行业
|
市场
|
公司
汽车出海
广告图片
关注公众号
扫一扫即刻关注
36氪出海微信公众号

推荐阅读


深度解析

  • TikTok 败诉,全球化的艰难一章才刚刚翻开

    TikTok 案背后, 是更多在美国开展业务的中国企业们,将集体迎来一个并不乐观的信号。

    社交文娱

    TikTok 败诉,全球化的艰难一章才刚刚翻开

    刚刚