具身智能体
具身智能的特点
具身智能是新质生产力的重要组成部分,具身智能体在AI大脑的指挥下,需要自主感知复杂的环境,自主完成学习和任务执行。其涉及学科广泛,包括人工智能、机器人科学、认知科学、传感技术等。
针对不同的行业,以及行业内的细分使用场景,机器人的表现形态、功能组件、智能化程度都会有很大的不同,这也能显示出具身智能定制化这一题材,拥有潜力巨大的发展空间和市场空间。
核心部件及进阶发展
具身智能体要实现感知、行动、决策这三大需求,需要其各个感知元件、行动部件和匹配算法的协同支持,即“多模态融合感知技术”,需要机器人的视觉、听觉、触觉感知高度协同,模拟人类感知,从多维度收集并融合多种模态的数据,同时理解外部环境并进行融合分析,以完成决策。多模态数据如何进行融合对齐、交互理解,也是具身智能需要深入钻研的重要课题。
部分具身智能体所需的关键零部件如下:
1. 视觉传感器
为了满足感知这一基础需求,机器人需要配备多种视觉传感器,不同于人类仅需双眼即可满足日常生活。受限于活动关节角度、传感器配置限制、算法算力限制等情况,具身智能体需要较多的视觉传感器和摄像头。按使用场景的不同,可能需要配置观察使用环境的视觉摄像头、用于测量距离的TOF摄像头、机械臂上针对细致操作的摄像头等等。
针对进阶需求,机器人也会配备不可见光、雷达等其他传感器。
2. 机械臂
机械臂是具身智能体最基础也是最必备的原件。其性能和可活动关节数等因素,决定了机器人在应用场景中的灵活度。除了活动功能,其表面也需要整合基础的触觉感应,以便在运行中避开障碍磕碰,不损伤其本身或场景,更不能伤害场景中的工作人员。
3. 抓手
机械抓手(机械爪)用于机械臂末端的精细执行操作,按使用场景的需求,存在二爪、三爪等多种制式。仿生的五指灵巧手也存在,但当前对现实应用的落地能力有待考证。机械爪的灵敏度和制作材料也需要适配使用场景,如涉及玻璃等易碎易坏物品时,机械爪力需要整合力反馈功能。如针对危废工厂的场景,机械爪需要选用低成本易替换的材质。
机械爪的进化方向,包括多维度力测量、霍尔效应触觉传感器、摄像头视觉感知、柔性表面等等。
4. 移动底盘
在部分应用场景,如科研实验室等环境内,机器人需要配备移动底盘以拓展可触及范围。拥有移动能力的具身智能体被称作多用途柔性机器人,能够极大拓展应用纵深。
按照某大型制药企业的反馈,同样具备感知能力和机械臂的机器人,是否拥有移动能力将决定机器人的应用场景。不可移动的机器人更适合量产场景,可作为固定工作站的一部分。而可移动的机器人才能胜任研发环境,以针对科研环境内更灵活的应用环境。
移动底盘本身除去最基本的移动功能,还需要集成独立的自动巡路、路线规划、智能避障等功能,不占用机器人主要功能的算力,因此也需要集成各类传感器和计算能力。
5. IOT协同
在实验室环境中,具身智能体需要与场景内的许多实验仪器实现互动,较为务实的方案是将已有的设备接入IOT网络,将各个设备读取的如温度、重量等信息传递至移动机器人的数据云端,以此产生协同。
这一方案仅需对现有的实验器材进行最低限度的调整,不用为了铺设机器人而大幅调整现有实验环境,从而改变工作流程,影响人员工作习惯,产生本末倒置的负面影响。
6. VLA模型
VLA模型不是具体的物理部件,而是一种延伸至物理空间的模型,即视觉-语言-动作模型(Vision-Language-Action Models,简称VLA)。过往的机器人、人工智能协同模式下,视觉、语言、动作系统是相互独立的。VLA模型通过整合上述各个核心零部件,能够理解复杂的图像和语言命令,提高机器人的能动性,让机器人拥有对应复杂实时场景的能力。
市场环境与投资机会
市场规模分析
AI大模型及具身智能体作为当前最热门的两大领域,可融合的场景过于宽泛,因此其总体市场规模的预测失去了实际意义。但若集中于科研领域,我们可以通过某些维度的信息进行粗略的了解。
通过截取相关产业上市公司晶泰科技、已申报公司镁伽科技公开的招股说明书,我们可以大致列出部分细分领域的市场体量,具体如下,仅供参考,不具备投资决策价值:
针对上文提到的AI EDA领域,根据Mordor Intelligence数据,2023年中国模拟芯片市场规模为3026.7亿元,预计2024年将达到3175.8亿元。参考2021-2024年国内模拟IC设计行业上市公司数据,粗略估计模拟芯片版图和电路设计软件对应的市场规模约为190亿元。Gartner在2023年发布的半导体技术趋势报告中提到,AI/ML在EDA工具中的渗透率约为10% – 15%(覆盖布局、验证等环节),并预测到2026年将增长至30%以上,预计到2026年AI EDA对应的国内市场将达到约60亿元。
海内外市场行情
基于上文提到的市场空间,在全球范围内,各行业的研发环节都会对AI垂直模型+具身智能体的协同体产生海量需求。
中国拥有全世界最大最全甚至唯一的全产业工业体系,网络上,部分网友用“工业克苏鲁”来形容中国大陆的工业实力对全世界的碾压。在可预见的未来,具身智能体产业将由中国大陆主导,海外部分头部企业和高校会对掌握部分高端技术,但难以弥补工业体系存在的鸿沟。
因此,海外需求方也将把目光集中到国内,国内拥有特定领域专长的企业,也能因此获得较好的订单机会。
对国内开发者和初创公司来说,由于国内市场的客户习惯,纯算法或模型的软件产品,很难具备盈利水平,许多企业因此被动发展出硬件开发能力,这种软硬件结合的能力可以让企业在面对客户时拥有更好的综合优势与议价权。
而面对海外客户,单纯的软件产品也能拥有更好的销售机会。如果要与海外客户签订硬件产品的订单,则很考验企业的跨境运维支持能力。
合作生态
在AI垂直模型和机器人算法的科研场景中,产业上下游各角色的特征,决定了合作生态。
1. 产业方
行业龙头企业和跨行业集团,这类企业一般对终端消费者输出产品。如3C数码产品与汽车等厂商、互联网巨头、制药厂、科研机构和高校等角色。
其中部分具有综合研发实力的科技属性综合企业,一般都会对自身的流水线做定制化智能开发,也拥有一定的AI开发实力。这类公司对AI模型与具身智能体整合属于可预见事项。然而这类企业的整合成果,大多用于满足内部生产需求,与其内部流程高度集成,不会作为对外生产的产品,也缺乏配合客户做定制化的动力。
部分单一领域龙头企业,如制药厂和化工厂,可能积累了庞大的生产数据,可以作为AI训练的语料,但不一定具备垂直模型的开发能力或执行力,具身智能体的启动门槛更是高于模型训练。
因此,对于非头部科技企业、大部分单一领域龙头、规模非顶级的企业、规模中小型的科研单位,为了拥有整合了AI模型的机器人研发平台(协同体),必须向外部开发者寻求支持。
2. 开发者/初创公司
拥有AI模型训练能力和机器人硬件整合能力的公司,有机会在这一轮范式重构的热潮中获取战略机会。
许多拥有开发需求但缺乏能力和动力的大型企业,一旦获得能实际落地的协同体,几乎可以在落地瞬间立刻提升工作效率(因为无论何种程度的优化和自动化都能带来效益提升)。这种协同体的软硬件定制化需求都非常高,需要贴合产业方的流程和生产惯例,且一旦落地之后,产业方自然会持续性的寻求优化迭代和新需求落地,且轻易不会更换供应商。
因此,开发者若是能抓住指定的细分领域,只要与单个颇具规模产业方形成合作关系,就能够保证自身的存活能力,如果能借助初始的产业方客户完成首单落地,那么通过贴身服务和长期磨合积累的宝贵经验,会助力开发者站稳脚跟。
部分产业方甚至愿意开放自身的生产数据,与开发者共同开发/委派开发者训练更有针对性的垂类模型。这也将成为开发者可贵的成长经验。
3. 模组厂、元件厂
对于纯专注于机器人硬件产品的机械厂商(模组厂),当前的重点应当从通用领域转入具体细分场景,聚焦某一集中的市场方向。细分领域所需的应用场景相对单一,需要感知的环境和设备相对标准化。相比通用场景和更复杂的消费场景,垂直场景的协同体应用将更容易落地。因此专精于特定小场景的开发者,往往会比执着于通用场景的开发者拥有更好的发展机会。如果能与提供匹配AI工具的企业结盟联合,则有机会获得更好的成长空间。这种情况下,速度和实绩就成为了能否成功的关键。
对于机器人核心零部件的研发机构,其针对特定部件的产品能力和技术深度必然优于模组厂,这类企业如果可以直接与开发者建立联系,则能够为开发者带来技术优势,可以与开发者共同服务于产业方客户。
总结
优势
1. AI for Science的热潮下,AI垂直模型能够为研发环节带来全面的效率提升,从整体流程、单个研发环节、对高端科研人员的人力解放层面都大有裨益,这种优势是不可逆的。
从事相关协同体产品的企业不但坐拥赛道本身的市场空间,在迫切的需求和外溢效应下,协同体可以进一步挖掘存量市场的改造升级需求。对于被解放的人力成本,其原先对应的市场规模也可以计入开发者的营收之内。
2. AI大模型和工具的发展会快于具身智能体的发展,而AI行业的持续发展将会倒逼机器人行业迭代更新,从而弥补智能协同体在实际物业环境中的短板。两者高度相关又相辅相成,可以形成互相促进的螺旋形进化趋势。
3. 中国大陆基于产业门类全、规模大、对新技术导入的态度积极,就算面对垂直场景,也能够产生出相当大的市场体量,支撑发展和迭代。而发达的机电供应链,对于机器人本体的快速性能迭代与成本下降也提供了有力保障。
只要能够实现快速落地并产生即时的经济效益,国内的具身智能体行业将获得持续性的快速发展。
挑战
1. 反过来需要注意,产业的极端发达也意味着产能过剩和内卷。随着AI大模型热潮与具身智能体热潮的叠加,智能机械工业可能很快就会面临拥挤,不正当的竞争会将成本杀到很低的区间。短期内该行业大概率会进入红海阶段,重蹈光伏和碳化硅的覆辙。反映在投融资市场上,针对具身智能体领域的行业风口可能会非常短暂,后入局的玩家有可能会承担较大的回报压力。
2. 与短期内卷同时发生的,将会是中长期的高端瓶颈。现阶段的具身智能体产业还有许多亟待解决的技术问题,机械关节强度、电池续航能力、散热能力、传感器精度、触觉灵敏度、极端场景特化等等方面都存在大小不一的门槛。
这些高精尖的技术突破可能只会掌握在极少数头部大厂或科研机构的手中。且必须正视尖端领域尚存的技术差距,有些关键性的技术发明中长期还会由国外企业和高校掌控。这意味着中低端具身智能体在供大于求的同时,高端具身智能体市场会十分紧俏甚至出现空挡。
如何实现特定细分领域的领先、如何在中低端市场内守好护城河,将会是从业者很快要面临的现实问题。
3. 纵观本篇全文,AI大模型的开发、具身智能体的落地,都对开发者有着极高的专业领域知识需求,甚至是相关行业的多年从业实践需求。如果欠缺对应领域的实操经验,那么协同体的开发就缺失根基,并随时会面临失败的风险。未来,同时拥有AI大模型训练能力和行业专精背景的复合型人才,将会是这一领域的中流砥柱。
展望
AI垂直模型与具身智能体的整合是多维度且互相缠绕的,能够在软硬件协同&人机协同的新工作流模式中,引发生产力的指数级上升。AI for Science的概念会逐渐向Agent for Science,乃至具身智能for Science的方向进化,最终转化为全新的、尚未被人总结概括出的全新科研范式。在这一范式的实现过程中,产业方、开发者、模组部件厂商、投身于该赛道的投融资机构,只要能抓住机遇,都有机会享受到发展带来的红利。
而无论结果如何,这种科研进步带来的时代红利,最终还会融入到每个人的生活中。正如疫苗、空调、冰箱、现代物流、互联网等科技进步给普通人带来的红利一样,未来的人自然会能够享受到比前人更优质又更具性价比的生活品质。
在这波变更与迁移的时代浪潮中,每个人都会是见证者和受益者。