人工智能细分之GPU芯片概念股梳理

AI时代，视觉计算成为主流，图形处理再次将GPU推向巅峰。GPU是 2T（to Things）的主要算力承载，GPU占据算力自主可控设计环节的核心位置。大家都在抢购GPU。英伟达也因此赚得盆满钵满。细分的AI芯片领域（包括训练和推理）的市占率，英伟达80%以上；人工智能每次技术突破炒作的思路都是先炒软件应用，热度下来了再炒硬件设备方向，并在中间穿插着各种AI细分支概念的炒作。不管去年的chatGPT诞生行情，还是今年SORA（文生视频）技术突破都是这个炒作逻辑；软件应用端：chatGPT、AIGC、AI多模态、游戏、文化传媒、SORA、AI教育、AI医疗、智能驾驶等方面的应用概念，硬件设备端是：先进制程制造、共封装光学（CPO）->以Chiplet为代表的2.5D/3D封装、HBM存储芯片->AI芯片->GPU->板卡组装->交换机->光模块->液冷->AI服务器->IDC出租运维、AI机器人等等。

一、GPU定义及AI发展中的重要性

GPU是一种专门用于图形处理的硬件设备，最初是用于游戏、电影和其他图形密集型应用程序的。GPU的基本原理是通过并行处理大量的计算任务，从而提高计算速度和效率。与CPU不同，GPU可以同时处理数百个线程，每个线程都可以执行不同的计算任务，因此GPU可以在短时间内完成大量的计算任务。GPU对AI发展的重要性有以下几点：

【1】并行计算能力：AI计算通常涉及大量的并行计算，以处理海量的数据。GPU的设计理念是针对大规模并行计算，它拥有数千个处理核心，能够在同一时间内完成比CPU更多的计算工作。

【2】提高计算速度和效率：GPU通过并行处理大量的计算任务，可以大幅提高AI算法的训练和推断速度。例如，深度学习模型中的矩阵运算可以在GPU上迅速完成，从而加速模型的训练和推理过程。

【3】节省时间和成本：在传统的CPU上训练深度学习模型可能需要数周甚至数月的时间，而在GPU上可以在数小时或者数天内完成训练。这不仅节省了时间，还可以降低训练和推断的成本。

【4】支持深度学习算法：深度学习算法需要大量的计算资源，而GPU可以提供这些资源。例如，Google的TPU（Tensor Processing Unit）是一种专门用于深度学习的硬件设备，其基本原理和GPU类似，但提供更高效的计算性能。

【5】更大的存储空间和促进AI技术的发展：GPU的广泛应用促进了AI技术的发展。通过GPU的高速计算能力，开发者可以更快地训练模型、测试算法，从而推动AI领域的新算法、新模型的研发。GPU还可以用于运行这些机器学习训练模型，以便在云端进行分类和预测，从而在耗费功率更低、占用基础设施更少的情况下能够支持远比从前更大的数据量和吞吐量。总之，GPU作为一种专门用于图形处理和计算的硬件设备，在人工智能领域的发展中发挥着重要的作用。GPU的高速计算能力、节省时间和成本以及支持深度学习算法等特点，使其成为人工智能领域不可或缺的一部分。随着未来GPU技术的不断发展，其计算速度、智能化、节能和普及等方面都将不断提升，为人工智能技术的发展带来更多的可能性。

二、A股中GPU计算芯片的相关概念股：

国产GPU 持续发力，对标行业龙头缩小差距。GPU 有两条主要的发展路线：分别为传统的 2D/3D 图形渲染 GPU 和专注高性能计算的 GP GPU。近年来，国产GPU 厂商在图形渲染 GPU 和高性能计算 GPGPU 领域上均推出了较为成熟的产品，在性能上不断追赶行业主流产品，在特定领域达到业界一流水平。生态方面国产厂商大多兼容英伟达 CUDA，融入大生态进而实现客户端导入。

【1】景嘉微：景嘉微是国产GPU市场的主要参与者，也是国内唯一自主研发GPU并用于商用的公司。公司先后自研制成功 JM5 系列、JM7 系列、JM9 系列高性能 GPU 芯片，其中最新的 JM9 系列两款图形处理芯片皆已完成阶段性测试工作，并进入放量阶段。JM9 系列芯片应用领域广泛，可满足个性化桌面办公、网络安全保护、轨交服务终端、多屏高清显示输出和人机交互等多样化需求。预计能够顺利运用在党政军及其他部门办公电脑。在前款芯片研发基础上，已着手开展下一代图形处理芯片研发工作。景嘉微致力于信息探测、处理与传递领域的技术和综合应用。公司产品涵盖集成电路设计、小型雷达系统、无线通信系统、电磁频谱应用系统等方向，广泛应用于有高可靠性要求的航空、航天、航海、车载等专业领域。

【2】海光信息：海光信息主要从事高端处理器、加速器等计算芯片产品和系统的研发、设计和销售。公司的产品包括海光通用处理器（CPU）和海光协处理器（DCU），具有成熟而丰富的应用生态环境，内置专用安全硬件，可满足互联网、金融、能源等行业的广泛应用需求。公司 DCU 系列产品海光 8100 采用先进的 FinFET 工艺，以 GPGPU 架构为基础，兼容通用的“类 CUDA”环境以及国际主流商业计算软件和人工智能软件，可充分挖掘应用的并行性，发挥其大规模并行计算的能力。

【3】龙芯中科：龙芯中科坚持自主研发核心IP，形成了包含系列化CPUIP核，GPUIP核，内存控制器及PHY，高速总线控制器及PHY等上百种IP核。与国内多数CPU企业主要基于ARM或者X86指令系统融入已有的国外信息技术体系不同，龙芯中科推出了自主指令系统LoongArch，并基于LoongArch迁移或研发了操作系统的核心模块，包含内核，三大编译器（GCC，LLVM，GoLang），三大虚拟机（Java，JavaScript，.NET），浏览器，媒体播放器，KVM虚拟机等。形成了面向服务器，面向桌面和面向工控类应用的基础版操作系统。与国内多数CPU设计企业主要依靠先进工艺提升性能不同，龙芯中科通过设计优化和先进工艺提升性能，摆脱对最先进工艺的依赖。通过自主设计IP核，克服境内工艺IP核不足的短板。

【4】寒武纪：2022 年 3 月 21 日，公司正式发布新款训练加速卡 MLU370-X8，搭载双芯片四芯粒思元 370，集成寒武纪 MLU-Link™多芯互联技术，在业界广泛应用于YOLOv3、Transformer 等训练任务中。MLU 370-S4、MLU370-X4 和 MLU370-X 均基于思元 370 智能芯片的技术，通过 Chiplet 技术灵活组合产品的特性，可满足更多市场需求。公司主要提供云端智能芯片及加速卡、训练整机、边缘智能芯片及加速卡、终端智能处理器 IP 及配套基础软件开发平台，产品广泛应用于消费电子、数据中心、云计算等诸多场景。

【5】中科曙光：公司背靠中科院国家资源，专注于高端计算机及信息系统领域，形成了高性能计算机，通用服务器，存储产品和围绕高端计算机的软件服务，系统集成及技术服务四大业务，完整覆盖客户对信息系统建设的需求，相关产品广泛应用于政府，能源，互联网，教育，国防等领域。高性能计算机方面，具有业界最完整的高性能计算机产品线，拥有支持TC3600/TC4600集群架构和GPU异构云计算技术的曙光星云、TC2600集群架构的曙光5000系列、支持GPU异构计算技术的GHPC1000、个人高性能计算机、刀片服务器等。

【6】芯原股份：公司可提供高清视频、物联网连接、数据中心等多种一站式芯片定制解决方案，拥有自主可控的图形处理器 IP、神经网络处理器 IP 等五类处理器 IP 及 1400 多个数模混合 IP 和射频 IP，可快速打造出从定义到测试封装完成的半导体产品，业务范围覆盖消费电子、汽车电子、物联网等多种应用领域。据 IPnest 在 2021 年的统计，芯原的半导体 IP 销售收入排中国大陆第二，全球第七，其中公司的图形处理器 IP 排名全球前三。公司的 GPU IP 已被众多主流和高端的汽车品牌所采用，同时，公司基于约 20年 Vivante GPU 的研发经验，所推出的 Vivante 3D GPGPU IP 还可提供从低功嵌入式设备到高性能服务器的计算能力，满足广泛的人工智能计算需求。

【7】通富微电：公司充分利用通富超威苏州和通富超威槟城这两个高端CPU、GPU量产封测平台，积极承接国内外客户高端CPU、GPU的封测业务，与博通、三星、IDT、NXP以及中国国产CPU芯片公司的业务合作进展顺利。2022年1月26日公司在互动平台表示，公司的封测业务包含CPU和GPU。50%以上的世界前20强半导体企业和绝大多数国内知名集成电路设计公司都已成为公司客户，公司全力支持国内客户的发展。

【8】卓翼科技：卓翼科技2018年2月在投资者互动平台上回答投资者提问时介绍，2017年初公司开始自主研发生产多卡GPU挖矿机，在经历长期的测试后，现已开始量产，充分彰显了公司的研发实力和市场前瞻能力。

【9】航锦科技：高性能图像处理器研发，长沙韶光与中船重工709所合作研发的高性能图像处理器2018年2月一次流片成功，可实现3D图像处理，性能指标处于国内领先地位。公司自主研发高性能GPU芯片预计2019年量产推广。 2020年5月12日，在互动平台称：公司电子板块以芯片为核心产品，围绕高端芯片与通信两大领域，涉及GPU/FPGA/存储芯片/总线接口芯片、北斗3芯片（北斗产业）、通信射频三大主要产业。

【10】全志科技：公司在超高清视频编解码，高性能CPU/GPU多核整合，先进工艺的高集成度，超低功耗等方面处于业界领先水平，是全球平板电脑，高清视频，移动互联网设备及智能电源管理等市场领域的主流供应商之一。

【11】好利科技：子公司合肥曲速主要从事GPU芯片、ADAS视觉芯片的研发和销售工作。合肥曲速正在研发的GPU芯片采用模块化设计，可根据市场需求通过减少核心数目组合成面向各档次需求的产品。相较于国内同档次产品，其拥有更高的算力，性能、功耗优势明显；相较国外同档次产品，其性价比更高。合肥曲速主要从事GPU芯片，ADAS视觉芯片的研发和销售，目前相关芯片仍处于研发阶段。根据合肥曲速未来发展计划，未来仍需持续，大量的资金投入，投资周期较长。ADAS视觉芯片主要与国家可信嵌入式软件工程技术研究中心深度合作研发，将利用合肥曲速在GPU芯片设计领域的经验，打造车规级视觉芯片产品，主要应用于 L3-L4 高阶自动驾驶领域。目前合肥曲速的GPU芯片和ADAS芯片仍处于研发阶段。

【12】奥比中光：公司是国内率先开展3D视觉感知技术系统性研发，自主研发一系列深度引擎数字芯片及多种专用感光模拟芯片并实现3D视觉传感器产业化应用的少数企业之一，是市场上为数不多能够提供核心自主知识产权3D视觉感知产品的企业，也是全球少数几家全面布局六大3D视觉感知技术的公司。为了满足更广泛的市场需求，公司对结构光，iToF，双目，dToF，Lidar，工业三维测量技术进行全面布局，并研发针对各个场景应用的具体产品，截止至目前公司已自主研发并商业化量产基于结构光，双目，iToF技术的系列3D视觉传感器。截止至报告期末，全球已掌握核心技术并实现百万级面阵3D视觉传感器量产的公司仅有苹果，微软，索尼，英特尔，华为，三星和奥比中光等少数企业。

【13】天准科技：公司深耕智能网联领域，逐渐发展出了智能驾驶域控制器，车路协同方案，AI边缘计算平台等产品线。智能驾驶域控制器基于边缘计算芯片研发，应用于国内众多头部自动驾驶公司的无人物流车，无人出租车，无人巴士，无人工程车等车辆的前装和后装，车路协同方案基于边缘计算MEC研发，提供多传感器融合感知全息路口解决方案，应用于多个国家级智能网联示范区，公司在2021年成为英伟达Jetson产品线解决方案金牌合作伙伴，基于英伟达的嵌入式GPU打造AI边缘计算平台，深度应用于智能网联领域的各种场景。

【14】中电港：公司是英伟达在国内的授权分销商之一，分销产品以图形处理器（GPU）为主，公司的主营业务是电子元器件分销、设计链服务、供应链协同配套和产业数据服务。深圳中电港技术股份有限公司的主要产品为处理器、存储器、射频与无线连接、模拟器件、分立器件、传感器件、可编程逻辑器件。公司已连续20年荣获行业权威媒体《国际电子商情》授予的“十大中国品牌分销商”；

【15】中科创达：公司获得Jetson和DRIVE两大平台的驱动开发和画质调优(ISP Tuning)权限，成为中国首家获得英伟达画质调优授权的公司，可为英伟达生态伙伴提供全面系统的技术培训和跟踪式问题解管支持;公司拥有英伟达专用实验室，以及基于DRIVE 和Jetson两大平台的专业驱动、画质调优、画质测试(lQ test) 团队，并在汽车和物联网领域积累了丰富的成功案例；

【16】北京君正：北京君正是国内GPU领域的龙头企业之一，在存储芯片、智能视频芯片、模拟与互联芯片等领域具有领先的技术和市场地位。公司主营业务包括存储芯片、智能视频芯片、模拟与互联芯片等，在国内外市场均有销售。作为gpu绝对龙头，北京君正在GPU领域具有较高的知名度和竞争力。

还有六家没有上市的GPU技术公司：

①摩尔线程：公司专注于设计高性能通用 GPU 芯片，提供图形计算和 AI 计算的元计算平台的集成电路高科技公司。公司高管团队来自英伟达、AMD、ARM 等知名芯片公司，拥有丰富的 GPU 研究经验，致力于创新面向元计算应用的新一代GPU，构建融合视觉计算、3D 图形计算、科学计算及人工智能计算的综合计算平台，建立基于云原生 GPU 计算的生态系统。

②壁仞科技：公司于2022 年 8 月发布的通用 GPU 芯片 BR100 创下全球通用 GPU 算力记录，峰值算力达到国际厂商在售旗舰产品 3 倍以上。BR100 率先采用 Chiplet 技术、新一代主机接口PCIe 5.0、支持 CXL 互连协议，确立了公司在国内厂商间的技术领先地位。公司坚持自主研发，同步推出原创架构“壁立仞”和自研BIRENSUPA 软件平台，实现了 BR100 性能的大幅提升。

③芯动科技：公司瞄准商用市场推出芯动风华系列 GPU。该系列 GPU 性能强劲、跑分领先、功耗低、自带智能计算能力，且全面支持国内外 CPU/OS 和生态，包括 Linux、Windows 和 Android。

④上海兆芯：公司将自身 GPU 业务进行切分独立，建立了格兰菲智能科技有限公司。公司目前已推出 Arise-GT10C0 芯片及 Glenfly Arise-GT-10C0 显卡。芯片内置完全独立自主研发的新一代图形图像处理引擎，兼容银河麒麟 KOS、统信软件 UOS、Windows 等主流操作系统，同时可在 X86、ARM、MIPS 等主流硬件台操作运行，支持多种图形和图像的 API 接口标准。

⑤天数智芯：公司推出通用 GPU 推理产品“智铠 100”及其丰富的 AI 应用案例。智铠 100 计算性能高、应用覆盖广、使用成本低，支持 FP32、FP16、INT8多精度混合计算，可提供最高 384TFlops@int8、96TFlops@FP16、24TFlops@FP32 的峰值算力，800GB/s 的理论峰值带宽以及 128 路并发的多种视频规格解码能力。

⑥沐曦公司：拥有完全自主研发的 GPU IP、指令集和架构，以及兼容主流 GPU 生态的完整软件栈（MXMACA），产品具备高能效、高通用性。目前已推出 MXN 系列GPU（曦思）用于 AI 推理，MXC 系列 GPU（曦云）用于 AI 训练及通用计算，以及 MXG 系列 GPU（曦彩）用于图形渲染，可满足数据中心对高能效和高通用性的算力需求。

特别声明：内容仅代表个人观点，不构成任何投资指导，据此买卖，盈亏自负，股市有风险，投资需谨慎！

幸福双城资讯网

光模块要凉? 关于CPO传言

台积电产能拉满, 中芯国际也没料到, 反转竟来得如此之快

大陆花10万亿也造不出1颗高端芯片! 张忠谋露出“真面目”!

交易实践