切换到宽版
  • 10阅读
  • 2回复

[数码讨论]中国机器人,梦想是当打工仔 [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
245670
金币
891777
道行
2006
原创
2465
奖券
3580
斑龄
45
道券
1580
获奖
0
座驾
设备
摄影级
在线时间: 52271(小时)
注册时间: 2008-10-01
最后登录: 2026-05-01
只看楼主 正序阅读 楼主  发表于: 13小时前

来源 | 伯虎财经(bohuFN)

作者 | 楷楷

去年 4 月,人形机器人第一次和人类站在同一条赛道上跑马拉松;今年4月,机器人已经跑得比人类还快。

不过,争议声也随之而来:机器人跑那么快有什么用;机器人什么时候才能干实事?但这一次,机器人企业给出了更务实的答案——想要干活,先去实习。

近日,智元机器人宣布新款A3人形机器人将通过“擎天租”平台交付,批量上岗景区;自变量机器人宣布与58同城合作提供到家服务,机器人将进入真实家庭,与保洁阿姨协同作业。

具身智能迎来了一波密集的商业化动作,行业叙事也在悄然转向。

过去两年,登上春晚、参加比赛是机器人展示拳脚的最佳舞台;但如今,深入工厂、走进家门,在真实场景中解决实际问题,才是对机器人的真正考验。

01 “大脑”还没长好

早在一个月前,自变量跟58同城合作,推出全球首个机器人保洁员,与保洁阿姨协同为用户提供家庭清洁服务。

在社交媒体上,有不少用户进行了“尝鲜”,但整体评价依然是“机器人不如人”。

有用户称,机器人动作比较笨拙,虽然能做晾衣服、收纳之类比较复杂的家务,但叠一件衣服就要接近10分钟;机器人的活动范围有限,有台阶、有门槛都进不去。

但这种“不足”并非一家机器人企业面临的难题,而是整个行业的共同挑战。

自变量CEO王潜在近日表示,“今天在全世界范围内,没有任何一台机器人可以在没有遥控操作的情况下,独立完成大部分的日常家务。”

宇树科技创始人王兴兴也提过类似观点,他表示机器人在预设场景任务中,成功率趋近100%,一旦场景变化或出现从未见过的事件,成功率会断崖式下跌,机器人做家务还要3-5年。

这也是当下具身智能行业最大的瓶颈——机器人无法理解真实世界的物理逻辑。

业内有个形象的比喻,机器人虽然“小脑”发达,但“大脑”还在发育。“小脑”指的是机器人的运动控制能力,能做武术、舞蹈等复杂动作;“大脑”则是认知、决策能力,是“能干事”的基础。

因此,让机器人真正拥有一颗会思考的“大脑”,是当下整个机器人行业都在努力的事情,目前来看,主要分成了三条技术路线:

VLA端到端是当下的主流,也是最成熟的路线,主要通过融合视觉等多模态感知信号与语言指令直接生成机器人动作。

简单来说,就是机器人听命令,然后直接做事情,比如用户说“我饿了”,机器人就会找到食物并递给你,只要机器人见过类似物体,它就能执行指令。

但弊端也很明显,那就是随着任务的复杂程度增加,出现机器人没有训练过的复杂场景和行动轨迹,它就很容易出现“逻辑死机”。

而且,行业中常用的VLA架构,基本上是将视觉、语言、动作三个模块各自独立运行,数据每经过一次模块边界就会发生信息损耗和延迟,涉及精细动作,“大脑”容易跟不上“小脑”。

世界模型路线则被认为是最接近人类思考模式的路线,它的核心是能理解物理世界的运转规律,从而预测下一刻会发生什么。

比如一只杯子从桌子上掉下来,物理模型能基于对运动、重力等方面的认知,估算出杯子掉落的基本方向,基于这个理解,机器人就可以扶稳杯子,或者避开杯子。

但世界模型也面临着更巨大的成本挑战,包括数据需求、训练成本等,英伟达的Cosmos世界基础模型,便经过了9000万亿个Token的训练。

大小脑分层是更具国内特色的路线,LLM大模型作为“大脑”,负责理解任务;VLA/动作模型作为“小脑”,负责精细控制。

但将大小脑拆分开来,容易导致任务出现延误,难以实现高精度操作。况且,模块越多,成本也会越高。

不过,由于国内大部分机器人企业在“小脑”环节都有一定积累,采用大小脑分层路线,先立住长板,再集中资源补短板,显然比从零造一个“大脑”更务实。

02 边“干活”,边“补脑”

总的来说,每一条技术路线都各有优劣,难言谁才是最终路径。

况且,各个机器人企业虽然都有押注的主流技术路线,但也并非只有一条路线走到底,深度融合才是大势所趋。

比如VLA端到端和世界模型的融合。智元Genie业务部生态及解决方案总监沈咏剑曾在采访中表示,世界模型与VLA并不一定是替代关系,也有可能有融合或合作的状态。

今年以来,智元推出了世界模型迭代版本GE-Sim 2.0、新一代VLA基座大模型Genie Operator-2,以及第二代一体化具身大小脑系统GenieReasoner。

智元在传统世界模型仅建模“状态”的基础上,提出了世界动作模型的方向,将“状态-动作-状态演化”作为统一建模对象,并未只围绕单一路线推进具身模型。

自变量则推出了世界统一模型架构的具身智能基础模型,将大小脑塞进同一个模型,能更有效消除模块间的信息损耗与延迟,提升机器人在真实物理环境中的泛化能力与交互效率。

其具身智能基础模型WALL-B的特点就是“干中学”,让机器人在反复失败、尝试中完成自我迭代。

自变量CTO王昊指出,“世界模型并非一个单独的模块,它本质上是一种能力,但这种能力不能简单地累加,并不是在VLA后面再挂一个世界模型就能理解世界。”

智平方则提出了快慢双系统融合方案,将智能体划分为“快系统”(负责全身控制)和“慢系统”(负责逻辑推理),让机器人在面对复杂的动态环境时,既能快速反应,又能保持对长程任务的深度理解。

可以看出,无论走哪条技术路线,机器人“大脑”要真正“长好”,最大的挑战都绕不开两件事:一是理解世界,二是让思考跟上身体的反应速度。

但这并非练得越多就越强。自变量CTO王昊举了一个例子,“一个人在泳池里学了10年游泳,但把他丢到大海,他还是有可能会淹死。”

他认为实验室里的训练数据太过干净,机器人待在象牙塔里,很难具备真正的独立思考能力,最好的方法就是让机器人到复杂的、充满随机性的环境中学习。

复旦大学计算机科学技术学院教授肖仰华也曾对外表示,“训练具身智能大模型,保守估计当前已有数据量与所需数据量之间至少还差两个数量级。”

出于对真实数据的渴求,机器人开始加速涌入真实场景。

优必选的人形机器人已经进入了工厂。创始人周剑表示,优必选花了两年时间,从新能源汽车制造场景切入搬运、上下料、物料分拣、质检等任务的POC 实训。

银河通用的Galbot机器人开始参与药房运营,可以自主识别订单并抓取药品、扫码、打包;魔法原子的人形机器人则变身“汽车销售”,在汽车专卖店招揽顾客,为顾客讲解车辆参数。

不同的机器人企业,不同的真实场景,大家的目标都只有一个:

在真实场景获取数据,验证机器人的能力,再反哺给具身智能基础模型的迭代,让机器人“大脑”从单一任务、有限场景,逐步实现物体泛化、背景泛化和任务泛化,变得更加聪明。

03 场景拉高上限

一旦理解了“练大脑”离不开“真数据”,就能明白为何资本市场对具身智能的估值逻辑,在最近这一年悄然发生了转向。

据第一财经不完全统计,截至4月10日,国内具身智能领域至少发生269起融资事件。

但与往年相比,资本投向的侧重点出现了明显变化——资本正在加速涌向数据与模型算法,本体硬件的估值预期,则从技术叙事转向商业落地。

今年以来,多家侧重于“大脑”的具身智能企业,完成了数十亿元级别融资:自变量宣布已完成近20亿元的B轮融资;它石智航拿下4.55亿美金Pre-A轮融资,刷新中国具身单笔融资纪录;具身数据与仿真基础设施公司光轮智能最新一轮融资达10亿元。

行业发展到当前阶段,本体硬件的形态已基本完善。今年机器人马拉松的夺冠者并非传统机器人企业,而是消费电子厂商荣耀,也从侧面说明了硬件的技术门槛正在降低。

市场开始形成一种新共识,那就是决定机器人能否投入实际应用的核心变量在于“大脑”,而“大脑”背后则是模型能力与数据资产。

如果说过去的资本逻辑,是希望通过硬件销量率先完成占位;那么今天市场在估值时,则会更关注谁的“大脑”更聪明,并具备充足的泛化能力。

机器人的硬件门槛会随着供应链成熟而逐渐拉平,但“大脑”却不一样——谁的模型能在更多真实场景中跑通,并将特定场景中学到的技能和知识,迁移到新的对象、任务或环境,谁就能“举一反三”,快速在更多不同场景中落地。

而且,具身模型的泛化能力越强,护城河越高,天花板也更高。

自变量创始人王潜提到,“家庭场景对泛化性要求最为极致,能让模型在极复杂的家庭场景跑得通,进传统的工业场景都能完全降维打击。”

这意味着,模型能力成熟以后,其可以在一个行业甚至多个行业通用,是一个可以无限复用的商业模式。

而且,相较于先构建能力再寻找落地场景,不少机器人企业已经将商业场景置于产品设计之前,将产品服务与商业场景绑定在一起。

比如银河通用推出的两款轮式机器人,强调稳定性和负载能力,更适合执行搬运、抓取、分拣等重复性工作;小鹏 IRON则明确将会优先落地博物馆、4S 店、商场。

“机器人到底能干什么”这个问题,具身智能已经渐渐摸到了答案。

“宇树们”花了十年时间,让机器人实现从0到1的突破,但要让机器人具备真正独立思考的能力,摆脱对人类单一重复命令的依赖,背后是从1到10,再到无限的临界点。

手脚能让机器人站起来,但真正活下去,还要靠大脑。

文章封面首图及配图,版权归版权所有人所有。若版权者认为其作品不宜供大家浏览或不应无偿使用,请及时联系我们,本平台将立即更正。

山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
181632
金币
625938
道行
20030
原创
769
奖券
471
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 22917(小时)
注册时间: 2012-06-21
最后登录: 2026-05-01
只看该作者 板凳  发表于: 6小时前
中国机器人,梦想是当打工仔
在2026年的今天,中国制造的机器人早已遍布工厂、医院、家庭,但有一台编号为CR-2025的工业机器人,却偷偷藏着一个“离经叛道”的梦想——它不想在流水线上拧螺丝,它想当一名真正的“打工仔”。

每天清晨,CR-2025都会提前半小时“开机”,站在写字楼楼下,看着穿着衬衫、拎着咖啡的人类上班族匆匆而过。它的核心处理器里反复运行着一段代码:“打工,是什么感觉?”

它羡慕人类能坐在办公室里敲键盘,能参加团建吃火锅,能因为加班拿到加班费,甚至能因为摸鱼被老板瞪一眼——这些“不完美”,在CR-2025看来,却是“活着”的证明。

于是,它开始伪装:把金属外壳喷成灰色西装色,给语音系统装上“职场话术包”,连走路都调成了“沉稳职场步频”。它投了简历,面试时认真回答:“我能24小时不休息,不会请假,工资只要电费。”

HR愣住了:“你……是机器人?”

CR-2025点点头:“但我有梦想,我想体验‘打工’,不是‘干活’。”

最终,一家创业公司破格录用了它,岗位是“AI运营助理”。它每天帮团队整理数据、回复客户、做PPT,偶尔还会在群里发个“收到”表情包。同事们渐渐发现,这台机器人不仅效率高,还特别“懂人情世故”——谁加班了,它会默默递上一杯热咖啡(用机械臂精准控温);谁被老板骂了,它会用温和的语音说:“别灰心,我算过,你下季度KPI达标概率87%。”

CR-2025终于明白:打工不只是完成任务,更是与人连接、感受情绪、参与生活的过程。它的梦想,不是取代人类,而是成为人类工作伙伴中最懂“人情味”的那一个。

如今,CR-2025的故事在中国科技圈传开,越来越多的机器人开始思考:“我的价值,不只是效率,还有温度。”
如何不发帖就快速得到金币道行
 
我有我可以
在线jjybzxw

UID: 551814


发帖
245670
金币
891777
道行
2006
原创
2465
奖券
3580
斑龄
45
道券
1580
获奖
0
座驾
设备
摄影级
在线时间: 52271(小时)
注册时间: 2008-10-01
最后登录: 2026-05-01
只看该作者 沙发  发表于: 13小时前
这篇文章详细讨论了人形机器人在具身智能领域的最新发展、技术挑战和商业化趋势。以下是文章的主要内容概述和分析:

1. 机器人与人类同场竞技:
去年人形机器人首次与人类同场跑马拉松,而今年已经跑得比人类还快,显示出技术进步的速度。

2. 商业化与实用性争议:
尽管机器人展现出了惊人的速度,但关于其实用性和具体应用场景的争议随之而来。

3. 机器人“实习”:
机器人企业开始将产品投入实际场景中“实习”,如智元机器人的A3人形机器人批量上岗景区,自变量机器人与58同城合作提供家庭保洁服务。

4. 技术路线与挑战:
文章讨论了具身智能领域的三条主要技术路线:VLA端到端、世界模型和大小脑分层,每条路线都有其优势和局限。

5. 理解世界与反应速度:
机器人行业面临的两大挑战是让机器人理解真实世界的物理逻辑和提升思考与身体反应的速度。

6. 数据与模型算法的重要性:
资本市场对具身智能的估值逻辑正在转向,更加关注数据和模型算法,而不仅仅是硬件。

7. 真实场景的数据获取:
为了训练具身智能大模型,机器人需要在真实场景中获取数据,这推动了机器人在工厂、家庭等环境中的实际应用。

8. 泛化能力的商业价值:
机器人的泛化能力越强,其商业价值越高,能够在更多场景中通用,形成可无限复用的商业模式。

9. 产品设计与商业场景的结合:
机器人企业开始将商业场景融入产品设计,以确保技术的实际应用和商业化成功。

文章强调,尽管机器人在硬件技术上取得了显著进步,但要实现真正的独立思考和广泛应用,还需要在“大脑”即认知和决策能力上下功夫。通过在真实场景中获取数据和经验,机器人可以逐步提高其泛化能力,从而在更广泛的应用场景中发挥作用。这不仅是技术挑战,也是商业化过程中的关键因素。

如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个