文|刘俊宏
编|王一粟
“做机器人痛点太多了”,地瓜机器人CEO王丛对光锥智能说,从数据获取,到模型训练等等,哪哪儿都是痛点。
2025年,是具身智能从实验室走向商业应用的关键一年。光锥智能在今年见证了机器人在“工厂打螺丝”、巡检、导览,甚至卖“煎饼果子”的身影。人形、机器狗、“半人形”、陪伴等各种形态的机器人也如井喷一般涌现。
毫无疑问,机器人已经成为智能硬件领域最火热的创业赛道。所有科技爱好者们,无不希望机器人能快一些走入日常生活。这一进度,被地瓜机器人“点了一把火”。
今年6月,地瓜机器人发布行业首款单SoC算控一体化机器人开发套件RDK S100。半年时间不到,地瓜在今年的开发者大会上又带来更高算力的具身智能开发平台S600,并宣布将于2026年第一季度正式量产。与此同时,地瓜还在硬件开发平台的基础上,推出了覆盖数据闭环系统、具身智能训练场、Agent开发服务的地瓜机器人一站式开发平台。
从硬件开发平台到软件开发平台,为什么地瓜要坚持实现机器人平台化开发?这背后与机器人开发过程中的实际难题有关。
机器人开发,常常被拿来与汽车自动驾驶技术做对比,两者的相同点是用AI驱动硬件来完成任务,但区别是,机器人面临的场景复杂度要比汽车高出太多。
在智驾平权的2025年,汽车智驾在很多层面已经有了“标准解法”。但机器人的硬件形态、芯片架构、技术方案、功能场景等层面还有太多的不确定性。
地瓜要做的机器人开发平台,本质上就是想从机器人各种不同的需求中,找到推动机器人落地的“最大公约数”。
“我们关注到了算法工程师(的需求),无论做什么样的算法,做的无外乎是数据的采集、标注、生成、仿真、测试这些环节,那我们就把这些环节都做成工具箱。”王丛说。
地瓜本次发布的RDK S600平台从硬件层面,支持VLA、VLM、LLM、Locomotion多种具身大模型在端侧的高效部署。在软件层面,地瓜机器人一站式开发平台提供数据闭环系统、具身智能训练场和Agent开发服务,为机器人开发者提供尽可能多的高效工具。甚至,在Agent开发服务的帮助下,开发者还能“一句话写好机器人代码”。
对于机器人开发者来说,简单易用的开发工具是实现所有创意的第一步。毕竟,有了创意之后,才会有后面一系列的产品化、商业化和量产。
对于B端的需求,地瓜也在平台上早已准备了机器人开发必备的数据闭环、仿真、模型训练与部署以及开发效率提升的全链路工具。这种能力,或许就是傅利叶、加速进化、自变量机器人、星动纪元、北京人形机器人创新中心、人形机器人(上海)有限公司、逐际动力、广汽集团等成为S600全球首批战略客户的原因。
“针对共通点做一个能帮助大家的工具,是一个蛮难的事情,但可能也是最有意义的事情。因为未来的机器人公司太多了,不一定每家机器人公司都有能力和资源做一个公共组件。”
正如王丛的总结。具身智能在从实验室走向日常生活的路上,除了对最先进技术的追求外,也同时有对集成化、成本控制、性价比层面的考量。
一千个人的心目中,可能有一千种样式的机器人。地瓜的梦想,是想要帮所有机器人开发者们“梦想成真”。
地瓜机器人CEO王丛
以下是地瓜机器人CEO王丛的采访实录:
(为了方便阅读,文字细节做了些许优化。)
Q:机器人现在能在哪些工业场景落地?哪些场景现在做的还不错?
王丛:现在工业的机器人里面,任务完成最好的是搬运。然后再是拣选和装配,最后是一些特殊的精细度操作。但其中的问题是,这些基础工作有更合适的本体,不是一定都需要人形机器人。一些固定的机械臂加上履带也能实现高效工作。
大家原本假设人形应该是既能干搬运,又能干分拣。但现在机器人更适合单点任务,这就很难达到工厂所需要的PMF。这也是现在机器人更多用于试点的原因。什么时候能完成泛化任务,可能才会迎来真的应用。
Q:把机器人本地算力做大,对机器人行业的意义是什么?
王丛:S600可以做到比其他主流产品更好的效果。但问题是,即使达到更好的效果,针对主流VLA算法也只能跑到10赫兹。10赫兹只能算是基本可用,但落到真实场景是否好用?可能还需要一些提升。接下来我们会继续迭代芯片和算法。
大模型也有自己的摩尔定律。比如去年需要用7B的模型解决问题,今年可能3B的模型就可以了。在这个过程中,芯片本身也在迭代。推高工艺、用更先进的3D封装,让芯片的算力更好。那我们这颗芯片能否实现通用具身智能?我觉得不光取决于算力本身,还要综合芯片和模型的适配,以及对应用场景的支持一起去看。就现阶段看,我觉得500~600这个level的算力是在未来的3~5年之内落地的最佳选择。
Q:看到现场展示有很多陪伴类型机器人。能否介绍一下,陪伴类型机器人赛道今年为什么会这么热?这种现象背后有哪些原因?
王丛:2015年那会陪伴机器人主要就是一些简单的对话,跟智能音箱很像。这两年大语言模型能实现更拟人的对话后,大家就又想到做陪伴功能。陪伴是一个很大的市场,因为每个人都会需要。但同时陪伴又很难做,因为不同人需要的陪伴又不同。
现在陪伴机器人有萌宠型的、玩具型,还有带IP、带教育的,种类很多,但大家都比较笼统地说是陪伴机器人。我觉得陪伴机器人未来发展的挑战是满足用户长期需求。因为陪伴很难被定义,它不是工具类市场。那怎样才算是一个好的陪伴,这个问题还需要进一步的探索。
Q:S600在整体参数上和地平线的征程6P是非常接近的。旭日系列和地平线的征程系列芯片之间有什么相同点和差异点?未来是否会和地平线的下一代芯片有协同?
王丛:地瓜是地平线整个集团的一部分,我们有很多协同关系,这也是地瓜为什么能发展得非常快。旭日和征程两者的区别是,我们在BPU神经网络加速器和架构上做了协同,但是整个SoC的设计上又完全不一样。
这种区别的原因,是因为两边市场需求不一样。车需要车规、功能安全、稳定性,但机器人很多时候要功耗低、性价比、集成度高、接口丰富、支持多传感器。打个比方,都是用同样的材料盖房子,但是房屋的设计是不一样的,本质都是从技术出发满足客户需求。
Q:能加载具身大模型的芯片跟过去车和机器人用的有哪些区别?
王丛:首先,跟过去的机器人肯定很不一样,因为需要承载的算力任务复杂太多了。我们自己也是用两个产品线来进行分类,具身是S系列,泛机器人对应X系列。虽然有很多厂商对照汽车的思路来设计具身芯片,但我认为目前具身对芯片的需求还没有达成共识。具身技术处在发展阶段,没有汽车那么成熟。
汽车智驾要装几个摄像头、装在什么位置,行业现在很清楚。执行的任务就是从a点到b点,不撞东西,丝滑行驶。但具身这边本体的样子都还没有完全确定,芯片又怎么能一下子完成定义?你只能先定义出一个大平层,至于里面要怎么装修,那后面再说。所以大家都是先用一个市场上相对算力高的芯片。我觉得需要行业充分发展之后,我们才能定义出一个合适的芯片。
Q:既然机器人芯片和零部件都没有收敛。那接下您觉得是本体来定义芯片,还是芯片厂商基于智驾或者其他经验来定义本体和芯片?
王丛:作为芯片公司,我们更清楚各种类型的传感器应该怎么样去连接,什么样的接口会速度更高、稳定性更强。但至于人形机器人具体应该放几个摄像头,放在哪里,我们不能很确定。
应用上的东西,应该交给本体厂家往前去蹚。计算架构需要我们一起去蹚。因为我们和机器人公司都在研究更先进的算法。落回芯片层面,就要考虑两者的诉求来设计。这需要大家联合起来共同推动。
Q:与合作方讨论的过程中,是否会触及对方需要保密的内容?地瓜同时需要跟很多公司合作,如何协调这种冲突?
王丛:在任何一个行业里,不同公司的风格都不一样。但同时,在一个早期的市场中,没有任何一个人敢保证自己做的就是对的。比如说算法的迭代就很快,三个月之前的算法到现在可能用处就不大了。所以我们很多算法都是开源的。大家一起交流,可能会对行业的帮助会更大。
Q:地瓜想打造一个机器人平台,但机器人面向的场景有非常大的差异。统一的平台怎么去适应这些差异?我们怎么帮助生态伙伴把这些场景给打通?
王丛:首先,我们不做解决方案。机器人行业有太多各种类型的需求,我们很难一一做完。我们考虑的问题是,什么是机器人的common point?
举个例子,我觉得现在双目是一个common point。用双目方案可以完成扫地、割草,乃至具身四足类机器人。那我们就想把双目不断迭代,做到世界第一,因为它能适应很多类型的产品。但再具体一点的功能,例如扫地机的细节,这块我们就不碰了。在具身里面,我们做了机器人的运控算法。有了算法之后,你想操作机器人完成什么样的任务都行。
总之就是有common point就会做,涉及到一些完整的业务逻辑就不做。我们关注到了算法工程师(的需求),因为无论做什么样的算法,做的无外乎是数据的采集、标注、生成、仿真、测试这些环节,那我们就是把这些环节都做成工具箱。
举个通俗的例子,就跟大家用PPT一样。每个人做PPT风格都不一样,但都还是用PPT那个软件。针对共通点做一个能帮助大家的工具,是一个蛮难的事情,但可能也是最有意义的事情。因为未来的机器人公司太多了,不一定每家机器人公司都有能力和资源做这么一个公共组件。我们这样的芯片公司来做,可能是更合适的。
Q:客户很多时候会提一些定制需求,甚至可能超出目前云平台的能力。这些定制需求会转换成标准化的能力吗?
王丛:地瓜绝大部分时间都不接定制化需求。但同时我们也会关注客户本身的价值。如果客户是走在机器人前沿的话,我们会愿意关注客户提出的高价值需求。哪怕是提出一些定制化需求,我们有时候往也会往前多迈一步。但落回到产品,我们还是倾向落成工具,这就是地瓜做平台的思路。即使有部分定制化,本质上是打磨自己平台化能力的手段。
Q:客户对于平台化的东西最关注什么?
王丛:我觉得关注点还挺多的。目前我们的平台化算是刚起步吧。我们去年讲的时候,更多还比较偏概念或者偏原型。今年客户才开始真的用起来了。一个完整的机器人软件研发其实流程非常的多,需要满足不同品类机器人的需求。比如说导航控制,扫地机、割草机的需求都不太一样,导致很难抽象成工具层。
现在平台是刚开始的第一步。基本上能完整把一套研发流程给串起来,满足一些客户的需要。其中每一个环节都还有一堆问题,需要接下来不断迭代。
Q:面对机器人繁杂的品类,地瓜怎么解决整体技术适配和场景数据互通的问题?从前端技术研发到最后产品落地,中间有哪些关键的痛点?哪些是我们现在还需要解决的?
王丛:我们会把不同定义芯片的客户需求拿出来,然后尽可能找到其中的最大公约数。如果找不到的话,我们做一些冗余,去满足需求。至于其他方面,比如说像数据迁移等等的需求,我觉得现在还很难做。其中还有硬件差异,例如扫地机的数据割草机用不了,割草机的数据也用不到人形。这就是现在具身数据这么匮乏的原因。本体有变化,那视角和其他部分都要变,导致很多环节都要重来。
Q:具身智能芯片下一个发展的方向会是什么?是否会有具体针对的点,还是说只关注算力?
王丛:做大算力其实并不难。还是用盖房子的例子,大算力无非就是多放几块砖,多挖片儿地就盖了。但要是讨论一个木头房如何盖成钢筋水泥房子,那要研发的东西就多了。放在芯片上,就得考虑计算架构。机器人很多都往VLA等新的方向尝试。这部分应该如何与芯片适配?实现VLA需要的算力、带宽,还有芯片本身架构设计,工艺、晶圆、封装,都是要考虑的。实现完整的机器人系统,其中要求又都不一样。
所以其中有各方面的细节要做,堆算力可能是其中最简单的事,但实际客户很少按照这个思路想,因为他们需要方方面面测试。
Q:下游客户对芯片反映最多的是什么问题?他们不满意现在芯片的哪些方面?
王丛:带宽和功耗的问题都比较多。基本上现在的四足狗负重跑2-3小时电就用得差不多了,人形可能更短。当然芯片功耗只是机器人的一部分,但功耗问题不解决,会影响机器人大规模落地。
Q:据了解,不少人形机器人公司采用的是X86架构再加GPU的一个计算架构。地瓜的架构未来会有变化吗?
王丛:我觉得会并行。在我们看来,机器人分为两种。有些目标是科研,做最领先的算法、最牛的Demo。这种倾向于把算法跑到极致,所以可能沿用X86加GPU的架构。这样的方式能让开发者更熟悉、更简单开发。因为目标是落地算法,性价比就不是优先要考虑的。
但如果要考虑落地,就需要想怎么做集成。毕竟一个芯片干两个芯片的事情,它的体积、功耗、成本都会更低,那他们就需要跟我们合作。但凡是商业化的东西,归根到底就是在满足需求的情况下去满足性价比,这个是商业的本质。
Q:您觉得未来两到三年内,机器人最有可能突破哪个日常生活场景?目前哪一类发展得比较快一点?
王丛:我们现在的品类太多了。说实话,我说不太清楚哪个品类会类似于扫地机那样爆发,短时间还没看到。我更多看到是每一个品类可能都能出个几十万台。这样的局面我觉得是比较贴切的。
扫地机器人大家都很熟悉了。接下来比如割草机器人这个品类,这两年增长非常快,基本上每年翻倍。泳池机器人基本上也是每年翻倍,此外还有一些新的品类。接下来还有一些网球机器人、高尔夫、智能轮椅等,这些产品都还没有真正在渠道里面铺货。所以我觉得这个问题可能明年会看得更清晰一些。
Q:我们这个平台的研发设计对于开发者来说,是一个更自动化的东西吗?相对其他平台有怎样区别?
王丛:其实就是更快、更容易。开发者基本上现在用是代码生成,用提示词就能把大框架写下来,更细节的交给开发者自己调。在调的过程中,我们也有很多代码生成和问答协助。我们希望用RDK的板子配上平台,能把之前需要做一两个月的Demo变成一两周搞定。
另外我补充一点:一体化平台就是我们面向RDK的版本,算是整个开发者平台的一个子集。因为我们需要同时面向to B和 to Developer两个不同的用户群体。开发者的诉求是简单易用,他们不太追求算法的场景迭代。因为场景迭代要靠数据驱动,这需要真实商业化量产。to B更关注数据、训练、仿真测试这些。我们希望通过这样的方式让开发者先体验易用,开发快了才能更快完成产品化。到商业化之后再考虑算法迭代的问题。我们希望开发者从始至终都能用得更爽。
Q:能否透露一下2026年地瓜机器人在具身智能领域的出货量或是目标?
王丛:我们基本上的底线是翻倍。现在S600刚出来,很多芯片的出货预期需要跑半年才可能看得更准一些。
本文来自投稿,不代表增长黑客立场,如若转载,请注明出处:https://www.growthhk.cn/cgo/model/148356.html
微信扫一扫
支付宝扫一扫