以下是根据文本内容,从具身智能数据采集行业的整体概况、企业布局、采集方式、市场情况、利润水平、行业门槛几个方面进行的详细梳理:
整体概况
市场机遇:今年以来多家企业加快部署机器人落地应用,行业对数据需求进一步加大,具身智能数据采集成为新风口。
市场规模预测:相关机构报告预测,中国具身智能产业的市场规模预计在2030年达到4000亿元,并有望在2035年突破万亿元。
企业布局
具身智能企业、研究机构及大厂:多家具身智能企业、研究机构以及大厂下场布局数据采集,如智元在上海、成都等地布局数据采集中心;帕西尼感知科技新建4座超级数据采集工厂;鹿明机器人建成3个标准化数采场;国家地方共建具身智能机器人创新中心、北京人形机器人创新中心等机构参与建设“新基建”;京东宣布将建成全球规模最大、场景最全的具身智能数据采集中心。
跨界玩家:吸引像王会军这样原本从事其他数据采集业务(如自动驾驶数据采集)的跨界玩家入局,山西博阅数据科技有限公司在长治、运城设立具身智能数据基地;此前从事AI大模型的贾鑫祎创立星际硅途,聚焦提供数据解决方案服务;青瞳视觉(深圳)科技有限公司从卖动捕设备、为动画公司提供动捕数据拓展到具身智能数据采集业务。
采集方式
真机遥操作:数据质量高,但采集成本高、效率低。
无本体/人类演示:不依赖特定机器人硬件本体的数据,被视为行业新范式,主流路线包括UMI(通用操作接口)、Ego(第一人称视角)。
仿真:通过在虚拟世界中模拟机器人及其环境生成的一类合成数据。
市场情况
需求增加:一部分受访对象反馈,赶上具身智能数据采集的这波风口后,今年以来接到的项目有所增加,除头部公司外,一些初创公司也前来对接数据采购需求。
邹志鹏称公司今年接到的具身智能数据采集订单增长翻倍,给动画公司提供动捕数据的基本业务正在缩减。
王会军预计博阅科技今年要采集的具身智能数据规模在10万 - 20万小时。
定价情况:数据价格并非“一口价”,主要依据完成动作的复杂度、采集成本等而定。
鹿明机器人按场景、任务复杂度、采集时长、质量等级实行质量分级、阶梯定价。
邹志鹏举例称高动态数据价格较高,贵一点的话可能会在10元/秒左右,像打球、跑酷等动作就属于高动态的数据。
姚卯青介绍目前国内真机数据的市场价格在每小时500 - 1000元之间,无本体数据的价格预计收敛至真机数据的三分之一到二分之一。
利润水平
多位受访对象表示具身智能数据采集利润没有想象中那么高。
王会军称接到的具身智能企业数据采集项目多以定制类为主,数量规模大且有一定质量要求,但项目预算并不高,且相比于自动驾驶数据采集,具身智能数据采集成本投入更高,涵盖场景资源投入、人工成本,只能“小赚”,利润可能比不上自动驾驶数据采集。
行业门槛
考验多方面能力:不仅考验供应商的硬件资产、运营管理能力,还需具备数据处理、标注等专业能力。
数据质量要求高:高质量数据需满足多模态对齐、轨迹稳定无漂移、可跨批次复用、场景真实动作规范、标注精准等条件,依赖团队的运营管理能力。
鹿明机器人搭建了内部专业人才储备与外部社会化引进相结合的人才供给体系,所有数据采集人员均需经过体系化、标准化培训与实操考核后方可上岗。
王会军称公司在人员培训和管理上有制定相应流程规范,有利于提高数据采集的效率、质量,最终提高公司盈利水平。