版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 举报,一经查实,本站将立刻删除。如若转载,请注明出处:http://www.51hangyebaogao.com/_cong___honghaijuan_/6354.html
定制报告-个性化定制-按需专项定制研究报告
行业报告、薪酬报告
联系:400-6363-638
《软件与服务行业:从特斯拉智能驾驶看人形机器人发展路径-240829(30页).pdf》由会员分享,可在线阅读,更多相关《软件与服务行业:从特斯拉智能驾驶看人形机器人发展路径-240829(30页).pdf(30页珍藏版)》请在本站上搜索。 1、 行业研究丨深度报告丨软件与服务 从特斯拉智能驾驶看人形机器人发展路径%1 请阅读最后评级说明和重要声明 2/30 丨证券研究报告丨 报告要点 Table_Summary Table_Summary 当前人形机器人产品落地的主要瓶颈在于模型侧。模型侧对机器人多模态对齐数据有较高的需求。数据驱动的大模型需要大量机器人多模态对齐数据投喂,对机器人数据的数量和质量都有较高的需求。机器人厂商解决机器人数据短缺主要靠两种途径:1)通过为数众多的机器人在物理世界中收集数据;2)通过 AIGC、数字孪生等方式合成仿真数据。因此建议关注模拟仿真相关标的。分析师及联系人 Table_Author 宗建树 SAC2、:S0490520030004 SFC:BUX668%28XbUeUcWfY8XaYaYbR9R7NpNrRpNmQeRpPvNkPpMoOaQqRrRuOnMqPwMnQtR请阅读最后评级说明和重要声明 丨证券研究报告丨 软件与服务 从特斯拉智能驾驶看人形机器人发展路径 行业研究丨深度报告 Table_Rank 投资评级 看好丨维持 Table_Summary2 机器人软件:越过 L2,直接从具身智能开始 AI 模型的发展已经接近关键节点,多模态模型具备了一定的成熟度,为人形机器人系统的发展铺平了道路。复盘特斯拉智能驾驶的发展路径可以发现,人形机器人模型可以采用自上而下的形式,直接从 L3 3、级开始构建模型系统。在机器人时代,主流软件厂商都选择了数据驱动的开发范式。数据驱动的机器人模型具备较高的泛化能力,不仅可用于高复杂性场景,还能在环境沟通中自主学习。受限于算力不足以及数据集短缺,模型控制层暂时只能以规则驱动。特斯拉正在以数据驱动快速迭代机器人系统。目前特斯拉已将为数众多的 Optimus 放进汽车生产工厂,安排其协助完成工厂内的电池分拣工作,形成了数据飞轮。机器人硬件:性能优化与云边端协同 机器人从汽车感知系统上继承了摄像头、超声波雷达、激光雷达等传感器,并且提高了传感器数量和性能。此外,为了实现更精准的操控,机器人新增加了一维力和一维力矩传感器、关节电机内部的位置传感器、IM4、U、用于腕关节和脚部的六维力传感器、触觉传感器(指尖、手掌、高碰撞风险区)等部件。当前条件下,如何平衡云端的计算延迟与端侧的算力不足是机器人 AI 大脑的核心矛盾之一。放眼未来,机器人大脑在一段时间内或采用云端大脑与端侧模型并行的技术路径。在云端,特斯拉自研 DOJO 超算平台支撑人形机器人的底层算力。DOJO 芯片架构平台由 D1 芯片组成,D1 芯片采用了台积电的 7 纳米制程工艺,计算能力在 BF16/CFP8 上达到 362TFLOPS,FP32 峰值算力为 22.6 TFLOPS,TDP(热设计功耗)为 400W。预计到 2024年 10 月,Dojo 超算平台的有望匹配 30 万块5、英伟达 A100 芯片的算力。特斯拉自研的 Dojo 超算平台有望为公司节省超过 65 亿美元的算力投入。商业模式:从制造到运营,机器人有望复刻路径 具身智能将带来产业链的重构,其中软件将在产业链中具备最高价值量。未来随着大模型的渗透率提升,机器人智能化程度有望大幅度提高。参考智能汽车领域的“软件定义汽车”逻辑,软件算法或成为人形机器人厂商的技术护城河,是机器人主机厂实现产品差异化的关键因素。特斯拉 Robotaxi 将于今年 10 月 10 日发布,而人形机器人有望复刻 RoboTaxi 商业路径。从长期来看,人形机器人有望在近两年快速将本,仿照 RoboTaxi 的形式,在某些高价值场景中6、的成本低于人力成本,快速达到生产厂商的投资回报曲线门槛。投资建议:关注模拟仿真相关标的 当前人形机器人产品落地的主要瓶颈在于模型侧。模型侧对机器人多模态对齐数据有较高的需求。数据驱动的大模型需要大量机器人多模态对齐数据投喂,对机器人数据的数量和质量都有较高的需求。机器人厂商解决机器人数据短缺主要靠两种途径:1)通过为数众多的机器人在物理世界中收集数据;2)通过 AIGC、数字孪生等方式合成仿真数据。因此建议关注模拟仿真相关标的。风险提示 1、人形机器人技术发展不及预期;2、人形机器人产品需求不及预期。Table_StockData市场表现对比图市场表现对比图(近近 12 个月个月)Table_7、Chart资料来源:Wind 相关研究相关研究 Table_Report Neuralink 公布脑机接口新进展,产品完成度迅速提升2024-08-28 Neuralink 公布脑机接口新进展,产品完成度迅速提升2024-08-28关键词:泛信创崛起 2024 年第 34 周计算机行业周报2024-08-26-40%-26%-11%3%2023/82023/122024/42024/8软件与服务沪深300指数2024-08-29%3 请阅读最后评级说明和重要声明 4/30 行业研究|深度报告 目录 软件:从规则驱动到数据驱动,大模型带来产业链重构.6 智能驾驶软件:先做加法再做减法.7 机器人8、软件:越过 L2,直接从具身智能开始.12 硬件:性能触及边界之后的再优化.15 智能驾驶硬件:性能与成本之间的平衡.15 机器人硬件:性能优化与云边端协同.19 商业模式:从制造到运营,机器人有望复刻路径.22 软件在产业链中具备最高价值量.23 人形机器人或复刻 RoboTaxi 路径.24 投资建议:关注模拟仿真相关标的.26 风险提示.28 图表目录 图 1:智能驾驶技术通常被分为 L0 到 L5 共 6 个级别.6 图 2:L3 级的人形机器人算法转向数据驱动.7 图 3:智能驾驶感知、决策与控制之间的关系.7 图 4:规则驱动下的智能驾驶算法.8 图 5:规则驱动的算法难以覆盖长尾9、场景.9 图 6:理想几千人的团队解决 Corner Case.9 图 7:高通新一代舱驾融合智驾芯片.9 图 8:特斯拉 FSD V12 实现了端到端的自动驾驶.10 图 9:特斯拉 HydraNet 方案.10 图 10:2021 年特斯拉 HydraNet 智驾系统结构.10 图 11:Occupancy Network 可以识别 3D 空间的体素.11 图 12:2022 年特斯拉 Occupancy Network 智驾系统结构.11 图 13:截至 2024 年 6 月,FSD 里程数据已突破 16 亿英里.12 图 14:AI 模型的演进方向.13 图 15:谷歌 RT-2 模型10、采用大模型作为底层框架.13 图 16:VLA 是端到端的机器人系统,具备较高的运行效率.14 图 17:机器人模型的两条技术路径.14 图 18:拖动示教快速丰富机器人动作数据.15 图 19:Optimus 机器人在工厂.15 图 20:智能驾驶感知硬件功能俯视图.16 图 21:视觉派和激光雷达派各自代表厂商.17 图 22:特斯拉纯视觉传感器方案.17 图 23:特斯拉智驾系统算力迅速提升.18 图 24:特斯拉 HW3.0 智驾芯片内部构造.18 图 25:Optimus 手指采用触觉传感器.20%4 请阅读最后评级说明和重要声明 5/30 行业研究|深度报告 图 26:Optimu11、s 脚部采用的力和力矩传感器或为六维力传感器.20 图 27:云端大脑与端侧模型特点对比.20 图 28:Dojo D1 芯片参数.21 图 29:DOJO D1 性能超越英伟达 A100.21 图 30:Dojo 超算平台为特斯拉带来了什么.21 图 31:到 2024 年 10 月 Dojo 超算平台算力有望达到 100EFlops.21 图 32:英伟达 NVlink 架构.22 图 33:特斯拉 Dojo 超算中心结构.22 图 34:人形机器人产业链图谱.23 图 35:全球 FSD 搭载比率.23 图 36:FSD 在全球各地的订阅收入(百万美元).23 图 37:国内不同城市无人12、驾驶落地节奏.24 图 38:特斯拉设想的手机 App 的打车服务界面.25 图 39:人形机器人有望仿照 RoboTaxi 模式,快速实现投资回报.26 图 40:超过 20 个机器人使用 AutoRT 自主收集现实世界数据集.27 图 41:ISSAC 数字孪生系统提升了机器人可用训练数据规模.27 表 1:不同场景下的部分智驾功能模块.8 表 2:FSD 迭代历程.11 表 3:特斯拉机器人发展的关键节点.15 表 4:特斯拉智能驾驶硬件.16 表 5:不同芯片种类的优劣点.19 表 6:AutoPilot 和 FSD 价格变化(美国,美元).24%5 请阅读最后评级说明和重要声明 6/13、30 行业研究|深度报告 软件:从规则驱动到数据驱动,大模型带来产业链重构 智智能能驾驾驶驶行行业业与与人人形形机机器器人人行行业业具具备备多多处处共共性性。智能驾驶的技术进步本质上是通过人工智能高技术供给,驱动交通行业从数字化向智能化转型的过程。在此过程中,车辆与环境互动能力提升,交互门槛降低;与此相对应的,人形机器人也是通过人工智能的高技术供给,驱动制造业/服务业从数字化向智能化转型的过程,在此过程中机器人与环境互动能力提升,交互门槛降低。因因此此,复复盘盘智智能能驾驾驶驶的的发发展展历历程程,对对研研究究人人形形机机器器人人的的产产业业变变革革具具备备较较强强的的参参考考意意义义。智智能14、能驾驾驶驶技技术术按按照照能能力力划划分分通通常常被被分分为为 L0 到到 L5 共共 6 个个级级别别。L0-L2 级智能驾驶又被称为辅助驾驶(ADAS),主要由人类驾驶者负责车辆的操控与决策,并且为最终行驶结果负责,智驾系统只起到辅助作用;而 L3-L5 级的智能驾驶由智驾系统负责车辆的操控与决策,其中 L3 级在特定条件下需要人类接管,L4 级和 L5 级无需人类监督。目前,L0 至 L2 级辅助驾驶系统已广泛普及,而 L3 至 L5 级的智驾也逐渐落地。图 1:智能驾驶技术通常被分为 L0 到 L5 共 6 个级别 资料来源:SAE 官网,长江证券研究所 人人形形机机器器人人系系统统也15、也可可以以分分成成 L0-L5 六六个个等等级级。在在软软件件算算法法层层面面,特特斯斯拉拉机机器器人人同同样样复复刻刻了了智智能能驾驾驶驶算算法法的的开开发发模模式式。与智能驾驶类似,端到端的人形机器人系统同样由规则驱动转向数据驱动。传统机器人算法本质上由规则驱动,开发者基于机器人作业规则和需求,参考人类动作的经验,制定预定义的规则和逻辑来进行决策,算法中包含着若干规则算法库;场景越复杂,规则设定也越复杂;但由于现实场景存在较多Corner Case,所以仅靠规则算法库难以覆盖所有场景,泛化性较低。相比之下,具身智能机器人大脑由数据驱动,开发者先收集大量机器人对齐数据,再使用 AI 算法对数16、据进行训练和学习,以得出最优的活动策略。L0L1L3L4L5L2无论这些驾驶员支持功能是否已经开启,都是您在驾驶车辆,即使您的脚已离开踏板也没有转向您必须时刻监督这些辅助功能,且根据需要转向、制动或加速以保证孞全当这些自动驾驶功能启动时,即使您坐在驾驶位上,也无须驾驶这些自动驾驶功能不会要求您接管车辆当功能请求时,您必须接管仅限于提供警告和瞬时协助为驾驶员提供转向或制动/加速支持为驾驶员提供转向或制动/加速支持AEB自动紧急制动盲区警告车道偏离警告车道保持或自适应巡航控制车道保持和自适应巡航控制可以在有限的条件下驾驶车辆,除非满足所有条件,否则无法运行可在所有条件下驾驶车辆交通阻塞自动驾驶模式17、宓域无人出租车踏板/方向盘可能不被孞装与L4级相同,但无条件限制全自动驾驶半自动驾驶等级驾驶员需做到功能举例%6 请阅读最后评级说明和重要声明 7/30 行业研究|深度报告 图 2:L3 级的人形机器人算法转向数据驱动 资料来源:甲子光年,长江证券研究所 智能驾驶软件:先做加法再做减法 从 L0 到 L2 级:规则驱动下系统高度复杂 L0-L2 智智能能驾驾驶驶软软件件系系统统通通常常分分为为感感知知、决决策策、控控制制三三个个模模块块。感知模块主要负责处理雷达、激光雷达、摄像头等传感器收集起来的周围环境的数据。收集到传感器信号后,感知算法会将信息融合,创建一个实时的三维环境模型,传输给控制模18、块;决策模块基于感知模块提供的信息,分析路况环境,识别潜在危险,规划行驶路径,并做出如变道、加速、刹车等驾驶决策。最后,控制模块将决策模块的指令转化为实际的车辆动作,包括调整油门、刹车和转向。图 3:智能驾驶感知、决策与控制之间的关系 资料来源:艾瑞咨询,长江证券研究所 从从软软件件层层面面来来看看,L0-L2 级级的的智智驾驾系系统统主主要要由由规规则则驱驱动动。系统由多个不同的模块组合而成,不同模块的算法内置了不同场景的应对规则;在进入新场景时,智驾系统需要算法模块之间的衔接。这些模块通过预设的规则集进行交互,确保在不同情境下能够适当地响应,但它们并不具备自主学习或适应新情况的能力,因为决19、策主要由人类驾驶员监控和干预。人类人形机器人具身智能L5L4L3L2L1L0监督者观察者任务设计运动控制控制算法行为设计拖拽录制回放人类智能非结构化环境自主决策行动执行复杂任务.任务推理知识图谱语义地图.感控一体环境感知定位导航算法驱动执行规划关节驱动结构驱动全自主认知层感知层运动层关节层结构层自主自动感知系统决策系统控制系统激光雷达摄像头毫米波孾航孥位路径规划智能决策电子驱动电子制动电子转向前端感知宔中央决策宔底部执行宔%7 请阅读最后评级说明和重要声明 8/30 行业研究|深度报告 图 4:规则驱动下的智能驾驶算法 资料来源:Apollo 开发者社区,长江证券研究所 从从 L0 到到 L220、 级级的的软软件件迭迭代代是是功功能能模模块块丰丰富富的的过过程程,算算法法呈呈现现极极度度复复杂杂化化的的趋趋势势。由于算法规能力不足导致的规则不完善,早期的 L0 级智驾仅能对驾驶员进行路况的提醒;而中后期的 L2 级系统通过补全算法规则,已经能实现自动泊车、交通拥堵辅助等特定场景的接管。在此期间,智驾算法为了尽可能应对所有场景,呈现极度复杂化的趋势。表 1:不同场景下的部分智驾功能模块 场场景景 功功能能 功功能能缩缩写写 功功能能介介绍绍 智智驾驾等等级级 智能行车功能 自适应巡航 ACC 纵向自动控制,实现加减速 L1 车道居中控制 LCC 横向自动控制,保持居中行驶 L1 自动变道21、辅助 ALC 横纵向自动控制,实现自动变道 L1 交通拥堵辅助 TJA 横纵向自动控制,交通拥堵时辅助驾驶 L2 智能泊车功能 自动泊车 APA 自动泊入、泊出选定的车位 L2 遥控泊车 RPA 通过遥控装置,控制车辆自动泊车 L2 主动安全功能 前向碰撞预警 FCW 前方有碰撞风险时,发出预警 L0 自动紧急制动 AEB 前方有碰撞风险时,自动制动 L1 前方交叉区域辅助 FCTB 前方交叉区域有碰撞风险,自动制动 L1 车道偏离预警 LDW 车辆偏离车道时,发出预警 L0 车道保持辅助 LKA 车辆偏离车道时,自动横向控制保持 L1 资料来源:芝能智驾,长江证券研究所 规规则则驱驱动动的的22、辅辅助助驾驾驶驶算算法法存存在在较较多多 Corner Case。规则驱动的智能驾驶算法依赖于预定义的规则和情景,这种方法的优点是相对直观和易于理解,因为规则是基于人类的直观判断和现有的交通规则。然而,它也有局限性,因为现实世界的道路状况复杂多变,很难为所有可能的情况预先编写规则。所以,当遇到罕见或复杂的 corner cases,如极端天气、突然的路面障碍或未曾预见的驾驶行为,算法可能无法做出恰当的决策,这也是辅助驾驶需要人类接管的原因。感知信息计划孥位信息感知信息场景管理高精地图孱器消息处理ADCObstacleStorytelling场景感知优先级交互标签路权场景特征评估器环境信息模型轨23、迹意图预测器轨迹生成轨迹延伸%8 请阅读最后评级说明和重要声明 9/30 行业研究|深度报告 图 5:规则驱动的算法难以覆盖长尾场景 资料来源:medium,长江证券研究所 规规则则驱驱动动的的开开发发范范式式带带来来边边际际成成本本递递增增。在 L2 级的后期,规则驱动的算法开放范式只能通过查漏补缺的方式解决 Corner Case;而高度复杂化的算法规则也带来了成本端的快速上涨,为了提升 L2 级智驾在中低端车型的渗透率,智驾系统出现了舱驾融合等新技术路径。图 6:理想几千人的团队解决 Corner Case 图 7:高通新一代舱驾融合智驾芯片 资料来源:极客公园,长江证券研究所 资料来源24、:高通官网,长江证券研究所 从 L3 到 L5 级:数据驱动的系统化繁为简 数数据据驱驱动动实实现现了了系系统统化化繁繁为为简简。自 L3 级智驾开始,特斯拉 FSD V12 实现了从规则驱动逻辑到端到端神经网络架构的重大转变。在 L3 级智能驾驶出现之前,特斯拉依赖30 多万行 C 语言代码来为 FSD 划定“围栏”,根据环境情况翻阅规则库给出驾驶指示;而 V12 版则给系统投喂海量人类司机在海量的场景中的驾驶行为数据来训练自动驾驶神经网络大模型,系统本身精简到只有 3000 行代码;车辆在行驶时,FSD V12 会让神经网络 AI 根据实时环境自主决定驾驶方式,彻底重塑了智能驾驶系统的逻辑25、。%9 请阅读最后评级说明和重要声明 10/30 行业研究|深度报告 图 8:特斯拉 FSD V12 实现了端到端的自动驾驶 资料来源:智驾最前沿,长江证券研究所 数数据据驱驱动动的的系系统统泛泛化化能能力力与与执执行行效效率率更更高高。基于雷达控制的智能驾驶系统是代码驱动,可能在绝对安全性上的保障要更好,但天量的场景越积越多,算法就会变得越来越庞大和臃肿,导致自动驾驶决策越来越慢,决策效率下降;而基于神经网络大模型是数据驱动,随着算力和训练数据的飞速提升,大模型的能力和覆盖场景也能飞速进化,且执行端代码非常简洁,执行效率越来越高,执行结果比肩人类司机。从从 2021 年年开开始始,特特斯斯拉26、拉智智能能驾驾驶驶系系统统经经历历了了 HydraNets、Occupancy Network 和和端端到到端端系系统统三三次次迭迭代代。在早期阶段,特斯拉曾移植 MobileEye 的算法来构建智驾系统;后来随着特斯拉搭建自身的智能驾驶系统,在感知层采用了 Backbone(骨干网)架构;在在 2021 年年 AI Day,特特斯斯拉拉发发布布了了 HydraNet 神神经经网网络络;HydraNets 神经网络实现了20 多个感知神经网络的统一,能够完成多头任务,减少重复的卷积计算,减少主干网络计算数量,可以同时处理多个摄像头的数据。HydraNet 设计用于同时处理多种感知任务,能够在一27、个统一的框架内学习多个任务,优化共享特征的提取,提高了处理效率和性能。图 9:特斯拉 HydraNet 方案 图 10:2021 年特斯拉 HydraNet 智驾系统结构 资料来源:thinkautonomous,长江证券研究所 资料来源:特斯拉 2021 AI Day,长江证券研究所%10 请阅读最后评级说明和重要声明 11/30 行业研究|深度报告 2022 年年,特特斯斯拉拉发发布布了了 Occupancy Network。Occupancy Network 是在 HydraNet系统上的一次升级,把感知层从一个系统切割成 HydraNet 和 Occupancy Network 两部分28、;HydraNet 负责识别不同类型的物体、标志等信号,而 Occupancy Networks 可以直接感知 3D 空间中的体素(voxel),将世界划分为多个大小一致的立方体,快速识别每个体素是否被占用,继而判断车辆是否要躲避。图 11:Occupancy Network 可以识别 3D 空间的体素 图 12:2022 年特斯拉 Occupancy Network 智驾系统结构 资料来源:特斯拉 2022 AI Day,长江证券研究所 资料来源:thinkautonomous,长江证券研究所 2023 年年 11 月月,特特斯斯拉拉推推出出了了 FSD V12,实实现现了了端端到到端端的的29、自自动动驾驾驶驶。端到端的系统将感知、决策、控制整合为一个统一的神经网络模型。在之前的模块化算法中,车辆控制决策和路线规划算法是通过逻辑控制程序来实现的,而端到端方案则把这部分逻辑控制代码负责的功能也交由神经网络模型来实现,取消了传统的规则或者条件判断代码,也无需地图数据。表 2:FSD 迭代历程 发布时间 FSD 版本 主要效果和影响 2021-07-10 FSD Beta V9 仅使用纯视觉感知实现城市自动辅助驾驶;约 2000 名客户内测,强调用户专注于驾驶 2021-09-11 FSD Beta V10 通过 7 天安全考核的车主中筛选 2021-10-11 FSD Beta V10.30、2 首个向公众推送的 FSD 版本,安全分满分可订阅 2022-08-21 FSD Beta V10.69 改进原先的视觉系统,增加了占用网络,能够对低速物体进行测量 2022-11-12 FSD Beta V11 高速公路启用 FSD Beta,统一高速公路内外的视觉和规划系统 2022-11-18 FSD Beta V10.69.3.1 取消 FSD Beta 安全分限制,推送向北美所有订阅用户 2023-02-14 FSD Beta V11.3 强化感知规控能力,利用基于神经网络的自车轨迹估计,代替近似的运动学模型,合并高速和城区 FSD 2023-04-17 FSD Beta V11.31、4 增强了行人识别和响应能力,改进车道引导,将减少 64%的驾驶员干预 2023-05-10 FSD Beta V11.4.1 在占用网络中添加车道引导输入,减少 43%由其他车辆切入车道引起的干预 2023-06-19 FSD Beta V11.4.4 提高间隙选择的自信,更准确地预测弱势道路使用者的未来意图 2023-11-24 FSD Beta V12 实现全新的“端到端自动驾驶”2024-03-12 FSD Beta V12.3 大规模向用户推送 2024-03-30 FSD Supervised V12.3.3 更名为 Supervised,开启所有用户为期 1 个月免费试用 20232、4-06-06 FSD Supervised V12.4.1 放弃方向盘扭力监测系统,改用车内摄像头来监测驾驶员状态(基于神经网络)%11 请阅读最后评级说明和重要声明 12/30 行业研究|深度报告 2024-07-23 FSD Supervised V12.5 可处理更复杂的场景,包括在狭窄的单向道路上行驶,以及处理意外的道路封闭 资料来源:notateslaapp,长江证券研究所 数数据据飞飞轮轮使使得得系系统统迭迭代代速速度度大大幅幅度度提提升升。2024 年 1 月起,特斯拉向特定用户开放了FSD V12 的使用权限,并随着版本迭代陆续扩大用户触及面;与此同时,FSD 收集的驾驶里程33、数据也在指数级增长,截至 2024 年 7 月已超过 13 亿英里。特斯拉 FSD 系统已形成正向的数据飞轮,而数据飞轮加速了 FSD 系统的迭代速度。图 13:截至 2024 年 6 月,FSD 里程数据已突破 16 亿英里 资料来源:特斯拉财报 2024Q2,长江证券研究所 机器人软件:越过 L2,直接从具身智能开始 多多模模态态模模型型为为具具身身智智能能铺铺平平道道路路。在智能驾驶技术刚起步的 2010 年代,人工智能的技术发展还不完善,只能凭借堆叠深度学习模型(CNN、RNN)的形式,将成百上千算法拼接起来,自下而上地塑造智能驾驶模型;而如今 AI 模型的发展已经接近关键节点,多模态34、模型具备了一定的成熟度,为人形机器人系统的发展铺平了道路。因此,人形机器人模型可以采用自上而下的形式,直接从 L3 级开始构建模型系统。%12 请阅读最后评级说明和重要声明 13/30 行业研究|深度报告 图 14:AI 模型的演进方向 资料来源:甲子光年,长江证券研究所 数数据据驱驱动动是是机机器器人人系系统统的的最最佳佳开开发发范范式式。由智能驾驶的发展历程可以得知,如果以规则驱动的模式来开发算法,在功能丰富的过程中,算法必定极度复杂化,后期会存在大量 corner case 无法解决;此外,由于机器人的能力门槛比智能驾驶更高,算法的开发难度与 corner case 也会更高。因此在机器35、人时代,主流软件厂商都选择了数据驱动的开发范式。图 15:谷歌 RT-2 模型采用大模型作为底层框架 资料来源:谷歌 RT-2 官网,RT-2:Vision-Language-Action Models Transfer Web Knowledge to Robotic Control,Brohan et al.,长江证券研究所 数数据据驱驱动动的的机机器器人人模模型型具具备备较较高高的的泛泛化化能能力力。目前规则驱动的只能根据算法规则做出相应的判断,无法面对复杂性较高的场景,泛化能力较低。相比之下,数据驱动的机器人借力具身智能大脑,不仅可用于高复杂性场景,还能在环境沟通中自主学习。目前大语言36、模型(LLM)已有较高的成熟度,图像-语言多模态模型(VLM)也在快速迭代的过程中;而随着图像-语言-动作多模态模型(VLA)的推出,大模型实现了数据与处理任务的跃升。从 LLM 到 VLM 再到 VLA,大模型的数据模态逐渐丰富,数据规模的数量级迅速增长,大模型的应用场景和价值量也成比例扩张。多模理解多模生成GPT-4VDALLE3,Sora多模态模型统一理解和生成GPT-5?语言模型视觉模型声音模型GPT-4Whisper世界模型AGI通往AGI的路径方向早期阶段各个模态独立发展当前阶段多模态融合:模态融合&任务融合未来阶段主动探索物理世界模型能力Q*超级对齐System2:复杂任务规划抽37、象概念归纳具身智能环境交互figure.ai%13 请阅读最后评级说明和重要声明 14/30 行业研究|深度报告 图 16:VLA 是端到端的机器人系统,具备较高的运行效率 资料来源:长江证券研究所 受受限限于于算算力力不不足足以以及及数数据据集集短短缺缺,模模型型控控制制层层暂暂时时只只能能以以规规则则驱驱动动。目前主流机器人大模型偏向于任务理解和拆分,对于机器人运动控制的涉及较少,只是用端到端的训练方式生成了简单且离散分布的机械臂末端位置和底盘移动指令,未考虑连续路径和轨迹规划等更偏机器人领域的内容。以 RT-2 为例,RT-2-PaLI-X-55B 只能做到 1-3Hz的指令生成速度,在38、移动马克笔的任务中,因为其运控速度远低于马克笔的滚动速度而失败;并且其生成的运动指令只是机械臂的末端位置和姿势,未涉及传统机器人运控范畴。因此,目前机器人大模型更擅长任务级和技能级的控制,传统机器人算法擅长底层运控。以 Figure 01 为例,Figure 01 机器人采用了 VLM+控制小模型方案,VLM 部分由 OpenAI 赋能,频率达到了 200Hz,下游连接的控制小模型负责机器人的运控,指令生成速度达到 1kHz,可以较好应用于现实场景。图 17:机器人模型的两条技术路径 资料来源:高工移动机器人,长江证券研究所 Optimus 机机器器人人发发展展包包含含 6 个个重重要要时时间39、间节节点点:1)2021 年 8 月马斯克首次透露了要造人形机器人(Tesla Bot)的设想;2)2022 年 10 月 Optimus 人形机器人首次亮相。在 Demo 演示中,Optimus 展示了其搬箱子、浇花、在特斯拉工厂工作的画面;3)2023 年 5 月,Optimus 具备了流畅行走和抓取物体的能力;4)2023 年 9 月,Optimus 大脑快速进化,实现神经网络完全端到端训练,可以自主对物体进行分类;5)2023 年 12 月,特斯拉发布 Optimus Gen-2,在稳定性、灵活性、机动性方面有较大提升。6)2024 年 1 月 16 日,Optimus 可以实现叠衣服40、功能,动作控制更加精准。感知规划决策控制感知+规划决策控制感知+规划决策+控制传统算法VLM方案VLA方案HardDecisionHardDecisionHardDecision多模态大模型两条技术路线VLM+运控算法时延较低决策能力弱执行成功率高一体化VLA时延较高决策能力强执行成功率低SayCanPaLM-ERT-2RoboCat%14 请阅读最后评级说明和重要声明 15/30 行业研究|深度报告 表 3:特斯拉机器人发展的关键节点 时时间间 事事件件 内内涵涵 2021.08 Tesla 宣布要造人形机器人 特斯拉敏锐抓住人工智能的关键节点,尝试把智能驾驶汽车的成功经验复制到机器人领域 41、2022.10 Tesla 在 2022 AI Day 上发布人形机器人BumbleBee 确定了机器人雏形与大致能力范围,公布了人形机器人的身高、体重、行走速度等关键参数细节 2023.05 Tesla 公布了机器人在工厂中行走,以及人类动作数据示教的视频 Optimus Gen-1 机器人的运控能力与感知能力得到大幅度提升 2023.09 机器人实现神经网络完全端到端训练,可以自主对物体进行分类 机器人泛化能力得到提升 2023.12 Tesla 发布 Optimus Gen-2 机器人稳定性、灵活性、机动性方面有较大提升,并在手指搭载触觉传感器 2024.01 机器人可以实现叠衣服功能,42、动作控制更加精准 思维链额能力提升,可以将复杂任务拆解为简单步骤;控制能力同样得到了提升 资料来源:特斯拉机器人 X 账号,长江证券研究所 特特斯斯拉拉以以数数据据驱驱动动快快速速迭迭代代机机器器人人系系统统。2023 年 9 月起,Optimus 机器人即装载了端到端的神经网络。但早期的系统成熟度不高,在特斯拉公布的视频中可以看到机器人有机动能力不足、控制不够精准、感知反馈迟缓等问题;但随着拖动示教等项目推进,Optimus 得到了大量动作数据的投喂,性能得到了快速提升。目前特斯拉已将为数众多的 Optimus 放进汽车生产工厂,安排其协助完成工厂内的电池分拣工作,形成了数据飞轮。图 18:43、拖动示教快速丰富机器人动作数据 图 19:Optimus 机器人在工厂 资料来源:特斯拉 2022 AI Day,长江证券研究所 资料来源:Tesla X 账户,长江证券研究所 硬件:性能触及边界之后的再优化 智能驾驶硬件:性能与成本之间的平衡 硬硬件件性性能能的的提提升升给给智智能能驾驾驶驶整整体体发发展展提提供供了了有有力力的的基基石石。智能驾驶硬件主要可以分为摄像头、超声波雷达、毫米波雷达等传感器以及计算芯片。传感器负责收集周围环境的数据,而计算芯片则处理这些数据以实现决策和控制。近年来,传感器的数量、种类和性能都得到了明显增强,提升了车辆对周边环境的感知能力;与此同时,计算芯片对更大规44、模的环境数据进行处理,确保了更高的决策准确性。%15 请阅读最后评级说明和重要声明 16/30 行业研究|深度报告 图 20:智能驾驶感知硬件功能俯视图 资料来源:亿欧智库,长江证券研究所 传感器:多传感器融合与纯视觉的技术路线之争 从从 L0 到到 L2 级级,智智能能驾驾驶驶硬硬件件同同样样逐逐渐渐复复杂杂化化。以特斯拉为例,特斯拉智驾硬件经历了从 HW1.0 到 HW4.0 的多轮迭代。HW1.0 于 2014 年发布,最早被搭载于部分Model S 车型上,并逐步应用到 Model X 车型中。HW1.0 时期的传感器部分仅搭载了1 颗前置摄像头,1 个毫米波雷达与 12 个超声波雷达45、;此外,由于当时的特斯拉缺少芯片自研能力,智驾芯片采用的是 MobileEye 的 Q3 芯片,算力仅为 0.256Topsint8。相比之下,特斯拉在 2019 年实现了 L2.9 级的智能驾驶,此时的硬件无论是数量还是性能都得到提升。总计 8 个摄像头覆盖了长焦、中焦与广角三个层面,毫米波雷达与超声波雷达的性能也得到了提升,搭载的智驾芯片由两个大 FSD 芯片和两个小 NPU组成,总算力达到了 144TOPSint8。表 4:特斯拉智能驾驶硬件 项项目目 HW1.0 HW2.0 HW2.5 HW3.0 HW4.0 发布时间 2014 年 9 月 2016 年 10 月 2017 年 8 月46、 2019 年 3 月 2023 年 3 月 毫米波雷达 160m 170m 170m 300m 超声波雷达 Lidar*12(5m)Lidar*12(8m)Lidar*12(8m)-前置摄像头 1 颗 3 颗:长焦(35):250 m 中焦(50):150 m 广角(120):60 m 升级为 12 摄像头(1 个冗余,可用 11 个);摄像头像素从原来的 120万提升到了 500 万,探测距离至少 424 米 侧前摄像头-两颗摄像头(90):80 m 侧后摄像头-两颗摄像头(60):100 m 后摄像头-1 颗摄像头(150)芯片/核心处理器 Mobileye EyeQ3*1 Nvidia47、 Parker SoC*1 Nvidia Pascal GPU*1 英飞凌 TriCore MCU*1 Nvidia Parker SoC*2 Nvidia Pascal GPU*1 英飞凌 TriCore MCU*1 FSD 1 芯片(12 核心)*2 FSD 2 芯片(20 核心)*2 内存 256 MB 6 GB 8GB 8GB*2 8GB*2 FPS 36 110 110 2300-%16 请阅读最后评级说明和重要声明 17/30 行业研究|深度报告 算力(TOPS)0.256 12 12 144-资料来源:teslatap,评智,智能车情报局,长江证券研究所 数数据据驱驱动动的的系系48、统统降降低低了了对对雷雷达达等等传传感感器器的的需需求求。在配备了激光雷达、毫米波雷达的驾驶系统中,雷达传感器的优先级必须高于摄像头,才能实现雷达对安全性的兜底作用。这种系统本身就是一种规则设定,而不是经过神经网络进行决策。相比之下,由数据驱动的智能驾驶系统模拟人类的驾驶逻辑,舍弃了针对传感器和图像数据的控制算法和规则判决,对雷达等传感器的需求较低。因此,特特斯斯拉拉在在 HW3.0 后后期期舍舍弃弃了了全全部部车车载载雷雷达达,转转向向纯纯技技术术方方案案。图 21:视觉派和激光雷达派各自代表厂商 资料来源:量子位,长江证券研究所 图 22:特斯拉纯视觉传感器方案 资料来源:高工智能汽车,长49、江证券研究所 智驾芯片:性能提升与异构化%17 请阅读最后评级说明和重要声明 18/30 行业研究|深度报告 智智驾驾系系统统性性能能提提升升对对也也带带动动了了芯芯片片的的算算力力增增长长。早期特斯拉智驾系统移植了是MobileEye 的 Q3 芯片,算力仅为 0.256TOPSint8;随着算法模块数量增长,芯片算力也随之提升。截至 2024 年,新推出的 HW4.0 芯片算力有望在 HW3.0 的基础上更进一步,突破 300TOPSint8。图 23:特斯拉智驾系统算力迅速提升 资料来源:智能车情报局,长江证券研究所 智智驾驾软软硬硬件件性性能能的的提提升升除除了了推推动动了了智智驾驾芯50、芯片片的的算算力力提提升升,也也促促使使智智驾驾芯芯片片正正朝朝着着专专用用性性强强,特特定定领领域域效效率率高高的的方方向向发发展展。智驾芯片逐渐复杂化,从早期的 CPU、GPU 发展成 CPU、GPU、FPGA、ASIC 相结合的模式。其中 CPU、GPU、FPGA 均是前期较为成熟的芯片架构,属于通用型芯片,而 ASIC 属于为 AI 特定场景定制的芯片。目前通用的 CPU、GPU 等都能执行 AI 算法,但执行效率差异较大,而 FPGA 与 ASIC 每个逻辑单元的功能在重编程时就已经确定,不需要指令,因此计算效率较高。在智能驾驶领域,环境感知、物体识别等深度学习需要芯片保持高响应速度51、,且在保证高性能的同时低功耗,不能对智能汽车的续航里程造成较大影响,所以 CPU、GPU 的组合不适合智能驾驶场景,开发 FPGA、ASIC 成了必然选择。图 24:特斯拉 HW3.0 智驾芯片内部构造 资料来源:wikichip,长江证券研究所 0.25612144300-50050100150200250300350HW1.0HW2.0HW3.0HW4.0%18 请阅读最后评级说明和重要声明 19/30 行业研究|深度报告 表 5:不同芯片种类的优劣点 芯芯片片类类型型 基基本本情情况况 CPU 中中央央处处理理器器,Central Processing Unit。是运算核心(Core)和52、控制核心(Control Unit)。它的功能主要是解释计算机指令以及处理计算机软件中的数据 优优点点:通用芯片,有强大的调度、管理、协调能力,应用范围广灵活性最高,擅长逻辑控制、串行的运算 缺缺点点:运算量低,性能和功耗效率相对较低 GPU 图图形形处处理理器器,Graphics Processing Unit。又称显示核心、视觉处理器、显示芯片 优优点点:最初专用于图形处理制作,后逐渐应用于计算,适合执行复杂的数学和几何计算,尤其是并行计算。通用性较高,相比 CPU,性能好。缺缺点点:功耗效率依然不高 ASIC 专专用用集集成成电电路路,Application Specific Integ53、rated Circuit,为某种单一用途专门制作的电路 优优点点:计算能力和效率都需要根据特定算法进行定制,具备极高的性能和功耗效率。定制芯片成本最低,适合量产 缺缺点点:研发成本高,制作周期长、可复制性差、灵活性不足 FPGA 现现场场可可编编程程门门阵阵列列,Field Programmable Gate Array,半定制芯片。优优点点:可针对具体应用对算法结构进行深度定制,达到更高的性能和功耗效率,可以无限次编程;FPGA 相比 GPU 具有稳定和低延迟的优势,适用于流式的计算密集型任务和通信密集型任务 缺缺点点:基本单元算力有限,开发难度大、只适合定点运算、价格比较昂贵 资料来源:54、CSDN、艾瑞咨询,长江证券研究所 机器人硬件:性能优化与云边端协同 传感器:场景拓宽与性能优化 机机器器人人继继承承了了智智能能驾驾驶驶的的传传感感器器系系统统,并并在在此此基基础础上上根根据据场场景景增增加加了了新新传传感感器器种种类类。机器人从汽车感知系统上继承了摄像头、超声波雷达、激光雷达等传感器,并且提高了传感器数量和性能。此外,为了实现更精准的操控,机器人新增加了一维力和一维力矩传感器、关节电机内部的位置传感器、IMU、用于腕关节和脚部的六维力传感器、触觉传感器(指尖、手掌、高碰撞风险区)等部件。力力矩矩传传感感器器:关节的一维力和一维力矩传感器主要针对关节的运用状态、输出力或力矩55、进行监测和反馈。以旋转执行器为例,若采用谐波减速器会产生瞬时传动比不稳定等问题,因此需要一维力矩传感器对关节的力矩输出状态做实时监测。六六维维力力传传感感器器:一般用于人形机器人的脚部和手腕处,能随时精确测量机器人关节在空间中所受力及力矩,为优化手部运动控制及行走控制的重要部件。触触觉觉传传感感器器:协助人形机器人获取如接触力大小和方向、温度、湿度、形状纹理等信息,对非结构化环境中的稳定抓取、路径规划和避障等至关重要。根据敏感材料和工作原理的不同可分为压阻式、压电式、电容式、磁场式、光电式、超声波式等。IMU:运用于人形机器人实现协助身体平衡、定位导航等功能。IMU 具备加速度计、陀螺仪等结构56、能够负责感知和控制人形机器人姿态和平衡,同时,还可以与摄像头、力传感器等多传感器数据融合,达到预测人形机器人速度和轨迹并进行定位导航等功能。%19 请阅读最后评级说明和重要声明 20/30 行业研究|深度报告 视视觉觉模模块块:让人形机器人能“看得见”,包括环境感知、物体的识别和跟踪等,导入 A1、深度学习等技术后,人形机器人视觉可以实现理解并智能规划行进路线,准确判断物体类别、跟踪物体运动等功能。图 25:Optimus 手指采用触觉传感器 图 26:Optimus 脚部采用的力和力矩传感器或为六维力传感器 资料来源:Tesla X 账户,长江证券研究所 资料来源:Tesla X 账户,长江57、证券研究所 算力芯片:云边端协同与异构化 机机器器人人模模型型部部署署包包含含云云端端大大脑脑和和端端侧侧模模型型两两条条路路径径。当前条件下,如何平衡云端的计算延迟与端侧的算力不足是机器人 AI 大脑的核心矛盾之一。一方面,云端大脑受数据传输速率影响,计算频率往往只有 1-3Hz,导致机器人动作高度时延,不利于日常作业,因此机器人部分计算必须由端侧模型完成。另一方面,受限于端侧芯片的算力不足,目前超过百亿参数的模型难以下沉至端侧与边缘测,因此端侧模型的参数量需要压缩至百亿级以下才具备实用价值。放眼未来,机器人大脑在一段时间内或采用云端大脑与端侧模型并行的技术路径:端侧 VLA 模型有望蒸馏至58、百亿以下,主要负责日常低时延任务场景,同时端侧芯片算力也得到大幅度提升;云端大脑通过算力集群搭配千亿级别 VLA 模型,辅助负责需要高泛化能力的场景。图 27:云端大脑与端侧模型特点对比 资料来源:RT-2:Vision-Language-Action Models Transfer Web Knowledge to Robotic Control,Brohan,et al.,Figure AI X 账号,长江证券研究所 云端大脑端侧模型高时延:约1-5Hz低时延:约200Hz高泛化性、高思维链低泛化性、低思维链模型大小:千亿-万亿级别模型大小:十亿-百亿级别大型AI算力集群端侧ASIC芯片%59、20 请阅读最后评级说明和重要声明 21/30 行业研究|深度报告 在在云云端端,特特斯斯拉拉自自研研 Dojo 超超算算平平台台支支撑撑人人形形机机器器人人的的底底层层算算力力。特斯拉机器人Optimus 采用 Dojo 超算平台作为底层 AI 算力支撑。Dojo 芯片架构平台由 Dojo D1 芯片组成,拥有一个大规模计算平面,极高宽带和低延迟,训练模块最大程度上实现了带宽的保留。D1 芯片采用了台积电的 7 纳米制程工艺,芯片面积为 645 平方毫米,拥有 500 亿个晶体管。每个 D1 芯片包括 360 个内核,出于良率和处理器核心的稳定性考虑,其中只有 354 个内核是可用的。D1 60、芯片的计算能力在 BF16/CFP8 上达到 362TFLOPS,FP32 峰值算力为 22.6 TFLOPS,TDP(热设计功耗)为 400W。D1 每个芯片节点都具备一个内核,拥有专用的 CPU 内存和 I/0 接口,每个内核还拥有一个 1.25MB SRAM 作为主存储器 D1 架构通过矩阵计算单元来增强计算能力,SRAM 能以 400GB/s 的速度加载数据,并以 270GB/s 的速度进行数据存储。图 28:Dojo D1 芯片参数 图 29:DOJO D1 性能超越英伟达 A100 资料来源:特斯拉 2021 AI Day,长江证券研究所 资料来源:特斯拉 2022 AI Day,61、长江证券研究所 DOJO 算算力力集集群群构构建建了了特特斯斯拉拉核核心心竞竞争争力力。D1 芯片采用定制化的 ASIC 架构,聚焦于智能驾驶视觉数据,比传统 GPU 架构拥有更高的计算效率。据 2022 AI Day 数据显示,与英伟达的 A100 相比,一颗 D1 芯片在配合特斯拉自研编译器的情况下,在自动标注任务中最高能够实现 3.2 倍的计算性能,在占用网络任务中最高能够实现 4.4 倍的计算性能。预计到 2024 年 10 月,Dojo 超算平台的有望匹配 30 万块英伟达 A100 芯片的算力。据摩根斯坦利数据显示,特斯拉自研的 Dojo 超算平台有望为公司节省超过 65亿美元的算62、力投入(对比购入同等算力下的 A100 芯片算力集群)。图 30:Dojo 超算平台为特斯拉带来了什么 图 31:到 2024 年 10 月 Dojo 超算平台算力有望达到 100EFlops 资料来源:摩根斯坦利,长江证券研究所 资料来源:Verge,长江证券研究所%21 请阅读最后评级说明和重要声明 22/30 行业研究|深度报告 Dojo D1 超超算算芯芯片片优优化化了了 GPU 通通信信协协议议,相相比比 NVLink 架架构构效效率率更更高高。在大模型训练时,单独一块超算芯片的显存难以储存大模型所有的参数量,而是需要上千块超算芯片的显存分别承载其中一部分;为了保证超算显存之间的高效63、联通,就需要英伟达NVLink 这样的 GPU 通信协议。Dojo 超算平台优化了超算芯片结构,将 D1 芯片以5x5 的方式封装形成一个瓦片(training tile),然后将 6 个瓦片组合成一个服务器。瓦片之间可以进行快速互联,不需要经过中间步骤。数据可以通过接口处理器进行连接,通过充电瓦片之间的二维扩展,获得比 GPU 更高的互联带宽。此外,特斯拉在软件算法方面通过变更自己的配套式框架支持和编译的 LVM 价值取代驱动,从应用层到服务器层形成了架构的完整融合。Dojo 超算平台的架构使其在功耗、算力和成本方面都优于英伟达的 GPU。图 32:英伟达 NVlink 架构 资料来源:ne64、xtplatform,长江证券研究所 图 33:特斯拉 Dojo 超算中心结构 资料来源:特斯拉 2022 AI Day,长江证券研究所 商业模式:从制造到运营,机器人有望复刻路径 具具身身智智能能将将带带来来产产业业链链的的重重构构。传统的机器人产业链主要分为上游的零部件供应商、软件系统提供商、中游的设备制造商和下游的应用场景。而在具身智能时代,机器人产业链或将发生重大变化。从上游角度来看,具身智能机器人多为人形机器人,从成本、续航能力、零部件性能等方面对机器人提出了新的需求。在传感器方面,由于机器人多用于复杂场景,所需传感器数量和性能需求都得到大幅度提升;与此同时,芯片的算力需求也大幅度提65、升。中游的 OEM 厂商部分会选择自研软件系统,部分会采购25个D1组成1个tileD1 芯片6个tile组成一个tray2个tray组成一个服务器10个服务器组成一个算力中心%22 请阅读最后评级说明和重要声明 23/30 行业研究|深度报告 上游的软硬一体化解决方案。最后,下游的应用场景将不断拓展。具身智能机器人可以应用于制造业、服务业、医疗保健等多个领域,应用场景和能力边界都得到了拓展。图 34:人形机器人产业链图谱 资料来源:优必选招股说明书,行行查,长江证券研究所 软件在产业链中具备最高价值量 产产品品价价值值量量有有望望向向下下游游转转移移。回顾智能手机产业与新能源汽车产业链可以发66、现,在产业落地的早期阶段,由于产品成熟度不高,OEM 主要扮演零部件整合的角色。在此阶段,上游的 Tier1 厂商议价权较高,OEM 的核心竞争力在于产业链整合能力;而随着产品大规模渗透,产业链逐渐成熟,产品价值量也在向下游转移,此时的 OEM 更重视软件生态、芯片等关键零部件自研能力。软软件件在在人人形形机机器器人人产产业业链链中中具具备备最最高高价价值值量量。当前人形机器人产业链的硬件部分已有商业化落地的方案,产业驱动逻辑在于量产规模效应实现降本;而软件部分尚无成熟的技术方案,因此成为限制人形机器人发展的主要瓶颈。未来随着大模型的渗透率提升,机器人智能化程度有望大幅度提高。参考智能汽车领域67、的“软件定义汽车”逻辑,软件算法或成为人形机器人厂商的技术护城河,是机器人主机厂实现产品差异化的关键因素。图 35:全球 FSD 搭载比率 图 36:FSD 在全球各地的订阅收入(百万美元)资料来源:patreon,长江证券研究所 资料来源:patreon,长江证券研究所 核心部件各行业应用原材料及核心部件人形机器人组装与生产系统开发与集成运控算法传感器电机减速器电池伺服机构控制器EMSCPUGPU感知算法认知与决策算法整机组装与生产整机软硬件方案设计整机系统集成工业制造物流仓储危险场景安保巡检接待引导科研教育家庭消费2B2C上游中游下游0%10%20%30%40%50%60%70%80%9068、%2016Q42017Q12017Q22017Q32017Q42018Q12018Q22018Q32018Q42019Q12019Q22019Q32019Q42020Q12020Q22020Q32020Q42021Q12021Q22021Q32021Q42022Q12022Q22022Q3亚太地区欧洲北美平均0501001502002503003502016Q42017Q12017Q22017Q32017Q42018Q12018Q22018Q32018Q42019Q12019Q22019Q32019Q42020Q12020Q22020Q32020Q42021Q12021Q22021Q3202169、Q42022Q12022Q22022Q3亚太地区欧洲北美%23 请阅读最后评级说明和重要声明 24/30 行业研究|深度报告 表 6:AutoPilot 和 FSD 价格变化(美国,美元)开开始始时时间间 基基础础 AutoPilot 增增强强 AutoPilot 价价格格 FSD 价价格格 2016.10-2019.02-5000+3000 2019.02-2019.04-3000+6000 2019.04-2019.08 免费-6000 2019.08-2020.06 免费-7000 2020.07-2020.10 免费-8000 2020.10-2022.01 免费-10000 202270、.01-2022.06 免费-12000 2022.06-2022.09 免费 6000 12000 2022.09-2023.09 免费 6000 15000 2023.09-2024.04 免费-12000 2024.04-至今 免费-8000 资料来源:patreon,notateslaapp,长江证券研究所 人形机器人或复刻 RoboTaxi 路径 2024 年年 5 月月起起,萝萝卜卜快快跑跑在在武武汉汉推推出出了了全全天天候候 24 小小时时运运营营的的 RoboTaxi 服服务务。萝卜快跑的 RoboTaxi 与以往的不同点在于,车内无安全员监控,所有自动驾驶行为监控都发生在云端71、。萝卜快跑基于百度 Apollo 智驾平台,最新的第六代无人车是与江铃新能源合作,采用磷酸铁锂电池,改造前的整车的单价为 20.47 万元,总体投放数量超过400 辆。在具体的人员配置上,萝卜快跑在武汉配备了 200 名左右的测试人员,200左右的地勤,还有 60 到 70 个云端驾驶人员,和其他的后台人员。图 37:国内不同城市无人驾驶落地节奏 资料来源:远川汽车评论,长江证券研究所 RoboTaxi 有有望望颠颠覆覆智智能能驾驾驶驶商商业业模模式式。在 2024 年二季度财报电话会上,特斯拉首席执行官马斯克表示,Robotaxi 将于今年 10 月 10 日发布,预计今年年底前进入中国市场72、,目标是今年内全球上线。马斯克将特斯拉 RoboTaxi 服务表述成 Airbnb 和 Uber 的%24 请阅读最后评级说明和重要声明 25/30 行业研究|深度报告 结合体;拥有搭载 HW3.0 或 HW4.0 的特斯拉电动车车主可以在空闲时间,将车辆“出租”成为 RoboTaxi,从而参与收入分成。图 38:特斯拉设想的手机 App 的打车服务界面 资料来源:2024 年 Q1 财报会,长江证券研究所 数数据据驱驱动动的的 RoboTaxi 落落地地成成本本更更低低,渗渗透透速速度度更更快快。规则驱动智能驾驶厂商将车辆改装成 RoboTaxi,需要加装多个激光雷达、工控机、供电系统,雷达73、自清洁系统等部件,整体落地成本往往超过百万量级;而特斯拉仅需摄像头即可实现可靠的自动驾驶能力。因此,特斯拉 RoboTaxi 相比 Waymo、萝卜快跑等厂商具备较大的成本优势。另一方面,规则驱动的智驾公司仍需依赖高精地图,每新开一座城市的服务均需Waymo 团队在该城市进行绘图、测试和验证,无法像特斯拉 FSD 一样快速泛化至多个城市。因此,Waymo 为代表的科技公司,难以在 Robotaxi 的商业化竞争中击败特斯拉。人人形形机机器器人人有有望望复复刻刻 RoboTaxi 商商业业路路径径。4 月在特斯拉的一季度财报电话会议上,马斯克表示,“如果你拥有一个有感知能力的人形机器人,能够驾驭74、现实并根据要求执行任务,那么经济规模就没有任何有意义的限制。”从长期来看,人形机器人有望在近两年快速将本,仿照 RoboTaxi 的形式,在某些高价值场景中的成本低于人力成本,快速达到生产厂商的投资回报曲线门槛。%25 请阅读最后评级说明和重要声明 26/30 行业研究|深度报告 图 39:人形机器人有望仿照 RoboTaxi 模式,快速实现投资回报 资料来源:高盛,长江证券研究所 投资建议:关注模拟仿真相关标的 当当前前人人形形机机器器人人产产品品落落地地的的主主要要瓶瓶颈颈在在于于模模型型侧侧。当前 Optimus 等人形机器人落地节奏推迟的主要原因在于模型能力不足。受限于人形机器人的模型75、发展不成熟,当前机器人尚未实现较高的泛化能力,导致机器人在物理世界难以取代人类。模模型型侧侧对对机机器器人人多多模模态态对对齐齐数数据据有有较较高高的的需需求求。数据驱动的大模型需要大量机器人多模态对齐数据投喂,对机器人数据的数量和质量都有较高的需求。机器人厂商解决机器人数据短缺主要靠两种途径:1)通通过过为为数数众众多多的的机机器器人人在在物物理理世世界界中中收收集集数数据据。回顾人形机器人商业化落地,特斯拉 Optimus、优必选 Walker S、Figure 02 等人形机器人都选择汽车工厂作为首选落地方式。汽车工厂创造了较好的环境,可供机器人同时采集视觉、听觉、运控等多模态对齐数据。76、具体案例如谷歌在近期发布了 AutoRT 平台,可以同时指导多个配备视觉系统和末端执行器的机器人,在各种各样环境中执行多样化的任务,以此来主动收集机器人感知、决策与控制数据。全球电动汽车出货量全球智能手机出货量人形机器人出货量(理想推测)人形机器人出货量(乐观推测)人形机器人出货量(中性推测)人形机器人出货量(悲观推测)全球电动汽车出货量全球智能手机出货量人形机器人出货量全球电动汽车出货量全球智能手机出货量人形机器人出货量厂商两年投资回报期区间客户两年投资回报期区间%26 请阅读最后评级说明和重要声明 27/30 行业研究|深度报告 图 40:超过 20 个机器人使用 AutoRT 自主收集现77、实世界数据集 资料来源:AUTORT:EMBODIED FOUNDATION MODELS FOR LARGE SCALE ORCHESTRATION OF ROBOTIC AGENTS,Ahn et al.,长江证券研究所 2)通通过过 AIGC、数数字字孪孪生生等等方方式式合合成成仿仿真真数数据据。仅凭机器人在物理世界收集运控数据往往不够,模拟仿真通过另一种方式给机器人提供了充沛的数据源。具体案例如英伟达发布了 Isaac Lab、GROOT 等多款机器人开发中间件,可以运行数千个用于机器人学习的并行仿真。Isaac 软件解决方案包含 Isaac 机器人操作系统和Issac 软件开发平台,78、可以快速实现机器人的软件开发。图 41:ISSAC 数字孪生系统提升了机器人可用训练数据规模 资料来源:英伟达官网,长江证券研究所%27 请阅读最后评级说明和重要声明 28/30 行业研究|深度报告 风险提示 1、人形机器人仍处于技术突破的关键时期,若未来技术突破不及预期,人形机器人难以实现较强的智能化水平,产业发展或受阻。2、人形机器人产业处于发展初期阶段,产品需求具备较高弹性。若未来人形机器人产品需求不及预期,产业发展或受阻。%28 请阅读最后评级说明和重要声明 29/30 行业研究|深度报告 投资评级说明 行业评级 报告发布日后的 12 个月内行业股票指数的涨跌幅相对同期相关证券市场代表79、性指数的涨跌幅为基准,投资建议的评级标准为:看 好:相对表现优于同期相关证券市场代表性指数 中 性:相对表现与同期相关证券市场代表性指数持平 看 淡:相对表现弱于同期相关证券市场代表性指数 公司评级 报告发布日后的 12 个月内公司的涨跌幅相对同期相关证券市场代表性指数的涨跌幅为基准,投资建议的评级标准为:买 入:相对同期相关证券市场代表性指数涨幅大于 10%增 持:相对同期相关证券市场代表性指数涨幅在 5%10%之间 中 性:相对同期相关证券市场代表性指数涨幅在-5%5%之间 减 持:相对同期相关证券市场代表性指数涨幅小于-5%无投资评级:由于我们无法获取必要的资料,或者公司面临无法预见结果80、的重大不确定性事件,或者其他原因,致使我们无法给出明确的投资评级。相相关关证证券券市市场场代代表表性性指指数数说说明明:A 股市场以沪深 300 指数为基准;新三板市场以三板成指(针对协议转让标的)或三板做市指数(针对做市转让标的)为基准;香港市场以恒生指数为基准。办公地址 Table_Contact 上海 武汉 Add/虹口区新建路 200 号国华金融中心 B 栋 22、23 层 P.C/(200080)Add/武汉市江汉区淮海路 88 号长江证券大厦 37 楼 P.C/(430015)北京 深圳 Add/西城区金融街 33 号通泰大厦 15 层 P.C/(100032)Add/深圳市福田区81、中心四路 1 号嘉里建设广场 3 期 36 楼 P.C/(518048)%29 请阅读最后评级说明和重要声明 30/30 行业研究|深度报告 分析师声明 本报告署名分析师以勤勉的职业态度,独立、客观地出具本报告。分析逻辑基于作者的职业理解,本报告清晰准确地反映了作者的研究观点。作者所得报酬的任何部分不曾与,不与,也不将与本报告中的具体推荐意见或观点而有直接或间接联系,特此声明。法律主体声明 本报告由长江证券股份有限公司及/或其附属机构(以下简称长江证券或本公司)制作,由长江证券股份有限公司在中华人民共和国大陆地区发行。长江证券股份有限公司具有中国证监会许可的投资咨询业务资格,经营证券业务许可证82、编号为:10060000。本报告署名分析师所持中国证券业协会授予的证券投资咨询执业资格书编号已披露在报告首页的作者姓名旁。在遵守适用的法律法规情况下,本报告亦可能由长江证券经纪(香港)有限公司在香港地区发行。长江证券经纪(香港)有限公司具有香港证券及期货事务监察委员会核准的“就证券提供意见”业务资格(第四类牌照的受监管活动),中央编号为:AXY608。本报告作者所持香港证监会牌照的中央编号已披露在报告首页的作者姓名旁。其他声明 本报告并非针对或意图发送、发布给在当地法律或监管规则下不允许该报告发送、发布的人员。本公司不会因接收人收到本报告而视其为客户。本报告的信息均来源于公开资料,本公司对这些83、信息的准确性和完整性不作任何保证,也不保证所包含信息和建议不发生任何变更。本报告内容的全部或部分均不构成投资建议。本报告所包含的观点、建议并未考虑报告接收人在财务状况、投资目的、风险偏好等方面的具体情况,报告接收者应当独立评估本报告所含信息,基于自身投资目标、需求、市场机会、风险及其他因素自主做出决策并自行承担投资风险。本公司已力求报告内容的客观、公正,但文中的观点、结论和建议仅供参考,不包含作者对证券价格涨跌或市场走势的确定性判断。报告中的信息或意见并不构成所述证券的买卖出价或征价,投资者据此做出的任何投资决策与本公司和作者无关。本研究报告并不构成本公司对购入、购买或认购证券的邀请或要约。本84、公司有可能会与本报告涉及的公司进行投资银行业务或投资服务等其他业务(例如:配售代理、牵头经办人、保荐人、承销商或自营投资)。本报告所包含的观点及建议不适用于所有投资者,且并未考虑个别客户的特殊情况、目标或需要,不应被视为对特定客户关于特定证券或金融工具的建议或策略。投资者不应以本报告取代其独立判断或仅依据本报告做出决策,并在需要时咨询专业意见。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可升可跌,过往表现不应作为日后的表现依据;在不同时期,本公司可以发出其他与本报告所载信息不一致及有不同结论的报告;本报告所反映研究人员的不同观85、点、见解及分析方法,并不代表本公司或其他附属机构的立场;本公司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。本公司及作者在自身所知情范围内,与本报告中所评价或推荐的证券不存在法律法规要求披露或采取限制、静默措施的利益冲突。本报告版权仅为本公司所有,。未经书面许可,任何机构和个人不得以任何形式翻版、复制和发布给其他机构及/或人士(无论整份和部分)。如引用须注明出处为本公司研究所,且不得对本报告进行有悖原意的引用、删节和修改。刊载或者转发本证券研究报告或者摘要的,应当注明本报告的发布人和发布日期,提示使用证券研究报告的风险。本公司不为转发人及/或其客户因使用本报告或报告载明的内容产生的直接或间接损失承担任何责任。未经授权刊载或者转发本报告的,本公司将保留向其追究法律责任的权利。本公司保留一切权利。%30