随着大模型如ChatGPT的问世,机器人展现出了越发近似人类的“头脑心智”能力,这一领域的进步已不仅仅局限于科幻电影的幻想。去年底,特斯拉推出的Optimus Gen 2人形机器人,以及Figure AI近期从微软、OpenAI、Nvidia等科技巨头获得的巨额融资,都是这一领域快速发展变革的明证。亚马逊支持的Agility Robotics和波士顿动力等公司的加入,使得竞争和创新日益激烈。根据高盛的预测,到2035年人形机器人的市场规模将达到380亿美元,这揭示了其巨大的市场潜力。
本文旨在深入探讨人形机器人的技术挑战,产业化路径与投资机遇,以及其在未来社会中的潜在应用和影响。通过对特斯拉、Figure AI等先行者的分析,以及对行业政策和市场趋势的解读,我们希望能够为读者提供一个产业化分析的投资视角。
期待与业界同行及读者分享见解,一同探讨人形机器人在新技术潮流中的投资价值和社会意义,以及它们将如何塑造我们的未来。
01人形机器人的底层投资逻辑
首先,让我们探讨为什么机器人需要被设计成“人形”。虽然人们倾向于将“人形”理解为机器人在外观上与人类相似,实际上,这个概念在软件和硬件两个层面上都有深刻的含义。硬件上的“人形”可能在某些场景中并不具有明显优势,例如,它可能不如四足机器人那样稳定或快速。然而,软件层面的“人形”——即通过先进算法实现的人类大脑式的智能,却展现了无可比拟的价值。这种智能不仅能够灵活应对多变的环境,还能跨越多个领域进行泛用,而非仅仅定制化应用。
目前,人形机器人领域的火热,与其说是因为机器人的人形外观,不如说是因为它们作为具身智能的载体,这种广泛的适应性和智能化是人形机器人成为投资热点的关键因素。因此,在评估一家人形机器人公司的投资价值时,我们更看重其在AI领域的深度布局和智能实现能力。
“人形”设计的核心不仅仅在于模仿人类的外观。人类是一种极其复杂的生物,模仿人的机器人在设计上面临巨大挑战——仅仅站立和行走的功能,就需要极其复杂的设计。因此,虽然当前许多用于工业和服务行业的机器人,可能只展现出一些类似动物的特征,如机械臂,但仍有许多企业致力于研发外观和行为都极为接近真人的机器人。
这引出了一个根本的问题:如果机器具备类人智能,它的形态是否必须为人形?在探讨这个问题之前,让我们先回顾非人形机器人的设计逻辑。以火锅店送餐机器人为例,其设计初衷是针对特定用途优化其能力和形态,旨在实现对基础重复劳动力的部分替代。然而,这种替代并不完全,因为机器人无法执行所有服务员的职责,如为客户摆盘或倒水等,导致送餐机器人需要与服务员结合使用以达到降低成本的目的。
在这种背景下,人形机器人的设计首先可以实现在特定场景下完全替代人类。人形机器人采用人形设计的一个主要理由是人体结构,特别是手部的灵活性。这一设计使得人形机器人能够在多种已设定的场景中无缝替代人类。例如,它们能够在餐饮服务中自主摆放菜品,或在清洁任务中侦测并开始工作,自行清洗抹布,有效应对长尾非结构化场景。
然而,人形机器人人形的价值远不止其在特定场景的应用。我们特别强调它们的高通用性和高泛性。当机器人需要处理设计初期未曾设想的多种类任务时,人形设计成为了在设计和开发阶段降低成本的理想选择。这是因为大多数人类社交和劳动活动都基于人体生理结构,相同的资源投入于人形机器人,可以极大地避免重复开发。
此外,当机器人的用途不再局限于替代基础劳动力,而是扩展到需要智力和共情能力的更复杂任务时,人形设计显得尤为关键。这不仅是智能化的一个重要里程碑,也是人形机器人设计的核心价值所在。人形机器人通过技术模仿人类,更重要的是,它们能以自然的方式融入人类的生活和工作环境,成为我们真正的智能伙伴。
人形机器人吸引人的关键之一在于,它们的人形外观和能力能够激发人们的情感共鸣。随着机器人角色的扩展,不仅仅是作为简单的劳动力替代,它们还被期望承担更加复杂的任务,这些任务要求理解力和同理心。
02人形机器人在2023年爆火的原因
首先,ChatGPT等大模型的成熟让人们对人形机器人真正具备像人一样的大脑有了信心。这主要体现在两个方面:自然语言交互和自动化决策。自动化决策意味着机器人能够像人一样处理复杂任务并适应多变的环境,而大模型能够一定程度帮助机器人拥有自动化决策的能力。
与传统依赖多个小模型算法耦合的机器人相比,大模型的训练基于第一人称视角,通过大量数据的预训练实现了高度的泛化能力。当模型参数扩增至一定量级所涌现的思维链能力,使得它们能够逻辑化地拆解复杂任务,从而提升机器人的实用性。此外,大模型将语言作为预训练数据,使得人形机器人在未来有可能替代需要智力和共情力的职位,并与人类进行自然语言交互。
其次,特斯拉人形机器人的快速迭代,让人们看到了人形机器人产业化的可行路径。特斯拉当前时点积极推出人形机器人原因有几点,一是短期迫切因素,其在北美的工厂建成需要万人级别的工人,而在北美招到这么多低成本的工人并不容易,二是马斯克长期看好人形机器人在C端市场的远期前景;但更重要是特斯拉有较强的能力禀赋去做好人形机器人,它在算法算力上(纯视觉感知算法的积累、FSD及DOJO芯片的自主能力等)有极大优势,同时硬件又能一定程度利用其电车的供应链取得规模经济,这些都为人形机器人的规模化生产提供了可能。
如果之前提到的两个因素在海外促进了人形机器人的快速发展,那么国内的情况则由工信部在去年11月发布的《人形机器人创新发展指导意见》提供了实质性的推动。该指导意见明确了中国人形机器人产业的发展目标和节奏:到2025年初步建立人形机器人创新体系,使整机产品达到国际先进水平,并培育出2-3家具有全球影响力的生态型企业以及一批专精特新的中小企业,到2027年,人形机器人的创新能力将显著提升,形成一个安全可靠的供应链体系,构建具有国际竞争力的产业生态,使得人形机器人在国内从概念落地为现实。
03人形机器人的应用场景
理论上,人形机器人可代替机器人全部场景。然而,考虑到投入产出比,人形机器人与普通机器人相比的最大区别在于两点:一是它们具备类似人脑的高度智能化;二是它们拥有精细化四肢的直立形态,这强调了硬件性能的灵活性而非仅仅是稳定性和强度。因此,面向消费者的市场(to C)将成为人形机器人长期发展的主要舞台,这一市场相比面向企业的市场(to B)拥有更广阔的空间。
尽管工业领域并非人形机器人远期的重点应用场景,它仍然是一个必经的发展阶段。这背后的主要原因包括:首先,商业场景的产业化以通用AI技术的成熟为前提,而高质量数据基础的缺乏成为最大难点,亟需机器人在实战中进行数据搜集。而工业场景中非结构化长尾场景的出现频数仅需要“适度的智能化”即可实现,目前拥有初步通用智能能力的基础版人形机器人能够初步满足工业场景的需求。也就是说工厂里场景没有太复杂,不需要经常去训练它,现有算法能实现的深度学习程度使得机器人本身有一定的学习能力去应对;与此同时,工业场景对硬件性能的要求更多体现在抗干扰性和负载上(而非灵活性),落地门槛低,可为机器人通用AI的算法优化以较高的效率投喂数据。
在众多细分工业场景中,适合人形机器人落地的细分领域需要包含两大特征:1)高度信息化;2)具备较多长尾场景。汽车是工业场景最为合适的细分应用之一。由于汽车的形态是高度参照人体工学和姿态进行设计的,因此汽车制造的总装环节当中,仍然是重人力的环节,95%是人工,现行的机械臂难以完成,需要人形机器人来替代。
04人形机器人产业化所需条件
人形机器人产业化三要素是算法优化、硬件成本和性能(重要性依次递减)。目前硬件性能是发展最快,有望最快满足产业化要求的,短期内硬件成本的快速下降以支持前期人形机器人落地,从而更好地训练优化算法、进一步拓展人形机器人的应用场景和市场潜力。
其中,硬件成本的下降是短期人形机器人进行初步落地最迫切的。目前人形机器人的售价普遍在60~200万元区间内,特斯拉凭借自身整车供应链成本降到了25万人民币,全球领先。人形机器人企业普遍的目标成本在15~35万之间。
我们认为人形机器人远期成本的合理锚定值在10~30万,短期处于非商业化考虑的阶段性落地时的合理成本是25~50万。在远期放量的toC领域,我们认为人形机器人价格需降到接近乘用车价格时,具备放量条件,即成本需降到10万(对应中低端)~30万(对应中高端)。短中期,当人形机器人面向的直接客户是制造业时(toB,替代劳动力),一般的制造企业固定资产的折旧一般都是5年,对自动化的投资回收周期一般要求控制2年,假设回收期为18-30个月,国民收入平均10.68万元,1.6-2.8年的回本周期分别对应17和30万的价格区间。以上为将人形机器人等同于自动化设备的测算逻辑,现实中考虑到前期B端和G端客户的人形机器人采购并不完全出于商业目的,因此对价格体现出更高的容忍度,预计价格区间能上浮至25~50万。
05人形机器人可能的产业化路径
我们尝试从行业内龙头特斯拉的实际路径和政策的具体规划两个角度进行推演。
首先,特斯拉的计划产业化时间和实际路径。据特斯拉员工介绍,其整体目标是在其自己的北美工厂出货2500台机器人(对应10%的人工替代率),同时将成本由现在的25万降到14万。若上述条件实现,特斯拉有望和政府达成进一步采购,从而实现万级机器人销售。可见,特斯拉的产业化逻辑是以自家B端场景印证C端能力,依靠政府力量进行C端推广。我们认为上述条件中数量条件的达成相对容易,关键在于降本,据悉,特斯拉规划的主要降本对象是关键,合计从目前19万降至8万。
从政策的角度,我们尝试对工信部发布的指导意见中对2025和2027年两个时间节点希望人形机器人实现的目标差异进行解读:首先,从应用场景方面,到2025年政策目标是“在特种、制造、民生服务等场景得到示范应用”,可见此时的落地场景是非市场化的,到2027年则是“应用场景更加丰富,相关产品深度融入实体经济”,逐步市场化;其次,从整机企业实力方面,从2025年“培育2-3家有全球影响力的生态型企业”到2027年“构建具有国际竞争力生态”的表述变化,同时结合具体专项中对“基础版和功能型整机”的描述,可以看出到25年强调的是硬件层面的拟人和结合具体场景的定制开发,到27年则强调更强的智能化、通用性,而硬件层面更加强调灵活性:再者,在供应链层面,从25年强调“确保核心部组件安全有效供给”,即核心零部件在极端条件下的国产替代,转向27年“有竞争力的生态”,强调真正意义的国产替代。
基于上述分析,我们尝试对人形机器人可能的产业化路径尝试进行推演。我们认为人形机器人未来的产业化会经过三个阶段:
1、伪人形阶段
伪人形阶段(2023~2025年),此时,人形机器人在硬件性能上具备了类人形态(手部及下肢拥有一定程度的负荷能力、稳定性和抗干扰性),此时的销售主要面向B端及G端客户,更多为在落地场景中积累数据迭代算法,此时单个机器人企业预计可实现千台级销售,30~50万元的成本对应30~50亿空间;
2、伪 to C阶段
伪to C阶段 (2026~2030年),此时销售部分拓展到C端,实现对简单劳动力的完全替代,对应机器人手部灵活性和精确控制能力提升,成本进一步降至20~40万元,单个机器人企业预计可形成万台级销售,对应200~300万空间,同时算法与大模型的结合进一步完善;
3、放量阶段
放量阶段,在大模型的赋能下,对硬件的性能要求逐渐削弱,促进成本降至在10~30万元,实现“陪伴”等高阶功能,对应千亿甚至万亿以上空间。
06人形机器人产业链
以特斯拉Optimus测算,单台机器人的BOM成本约25万元人民币,目前执行系统(含对内感知传感器)占到80%以上。
相比传统机器人,人形机器人最大的区别是自由度大幅上升,对应的系以关节为代表的执行系统(含对内感知传感器)的需求提升,由此带来两大增长逻辑:
1)技术相对成熟的活动关节需求增量逻辑:
活动关节从2-6个/台→24个/台,是人形机器人产业最具有业绩弹性的部分。线性关节在垂直方向上具有刚度,可类比于人体的肌肉,用在手臂、腿部等伸缩部件上,以特斯拉Optimus为例:全身使用14个线性执行器;旋转关节用于机器人肩部、腕部、髋部、腰部等有相对运动要求的连接部件上,可类比于人体的手腕、脚腕等,以特斯拉Optimus为例:全身使用14个旋转执行器;
2)灵巧手——技术方案及需求都得到创新创造:
相比传统机器人额外具备精细手部结构,相应技术方案为0-1创新。
无论是何种关节其均有电机提供旋转形式的动力,由减速器将电机的高转速转换为高扭矩以提高关节运动的稳定性、精确性和负载能力,由丝杠、蜗杆等传动装置将旋转运动转换为直线运动,结合编码器和力传感器对位置及力的感知和反馈进行整体控制参数的矫正从而进行工作。
人形机器人的感知系统分为内外感知,其中:外部感知中视觉感知以摄像头、激光雷达、IMU为主,与电动车智能化产业链重合度高,听觉以麦克风为主,整体技术成熟,嗅觉和味觉的应用场景有限,因此增量创新主要在内部感知,体现在力和扭矩传感器对运动状态的感知以及编码器对运动姿态的感知。
我们认为,人形机器人的上游产业链机会中,降本的优先级远高于对性能的追求。人形机器人并非针对特定需求/场景出现,因其追求通用化和灵活性(这也是为什么一定要长成人的样子),因此对硬件的性能要求是具备高度弹性的,甚至未来有逐步削弱的可能性,而降本能为其落地进行算法训练的数据搜集提供帮助。
降本主要围绕执行部件及内部感知传感器进行。只有那些高技术壁垒、卡脖子的零部件才真正具备投资价值,因为降本使得机器人企业寻求本土供应商进行国产替代从而降低成本的需求会更强烈,国产供应商拥有更多进入头部客户供应链的机会;而对于那些国内已经可以初步实现国产化的零部件,降本的诉求将压缩本土供应商盈利空间。此外,价值量层面,考虑到短期人形机器人量产落地空间有限,面向全场景的空间远比在人形机器人中的价值量重要。
基于上述逻辑,我们看好编码器、减速器在当下人形机器人进度下的股权投资价值;力传感器及空心杯电机则更适合通过与产业方合作,以并购或CVC的方式进行布局。
编码器:应用场景广泛、空间广阔(2022年全球规模超200亿元)、进口依赖度高(日系多摩川和欧系海德汉分别以27.6%和14.3%市场占据主导地位,国产化率仅约20%),机器人所有关节都需要使用1个及以上,随未来自由度提升,需求量有望进一步增加,需求刚性较强。此外,据机器人企业反馈,编码器是目前电机中的主要痛点,国产小尺寸、高精度产品性能仍然无法达到国际龙头水平,需要向海外进行采购,因此具备较高股权投资价值。
减速器:2022年全球减速器市场空间超240亿元,其中行星减速器在伺服等领域均有广泛应用,国产化率70%;谐波和RV减速器主要应用于机器人及半导体等高端设备场景,国产化率分别为30%和20%,其中谐波减速器已出现绿的谐波等龙头企业,RV减速器的国内基础仍比较薄弱,建议关注行星及谐波减速器已形成稳定规模化供应、同时具备RV减速器技术能力的企业。
空心杯电机:尽管全球市场规模相对有限(2022年全球规模仅约50亿元),空心杯电机对人形机器人手部灵活性和精确控制却极为关键,且面临高度进口依赖(国产化率约15%),预示着与传统电机制造商合作布局的潜力。
力传感器:全球市场空间巨大(2022年超过1200亿元),广泛应用于汽车、消费、工业等领域,在人形机器人的所有关节中均需要使用,需求刚性程度较高。鉴于力传感器技术路线仍以相对成熟的应变式为主,可横向布局机器人领域应用的成熟公司较多,相比单纯进行股权投资,通过与产业方合作,以并购或CVC投资可能是更优策略。
正如《西部世界》中难以分辨的机器人、《Her》中具深情的人工智能Samantha,以及《人工智能》里渴望成为真正孩子的机器人所示,这些故事不只是激发了我们对技术未来的想象,也能预见人形机器人在增强人机交互、提供情感支持方面的潜在社会作用。
随着关键技术的发展,我们相信,人形机器人将跨越当前的应用边界,成为家庭成员、社交伙伴,乃至情感支持的存在。它们巨大的投资潜力和对社会的积极贡献,将引领我们进入一个全新的人机共生时代。