首页 > 互联网+ > 2024,AI芯片的三场关键战事

2024,AI芯片的三场关键战事

[2024-01-16 16:21:02] 编辑:国民经略 点击量:45
评论 点击收藏
导读:竞争驱动洗牌,洗牌催生跨越。我们深知,适应比预测更重要。无论是如今写在历史中的大公司们,还是依旧寻找方向的创业公司,无一例外不经历着一次又一次的洗牌,又在一次又一次的洗牌中或退场、或重生。这是一个洗牌年代,也是一个值得书写的年代。 .....

竞争驱动洗牌,洗牌催生跨越。

我们深知,适应比预测更重要。无论是如今写在历史中的大公司们,还是依旧寻找方向的创业公司,无一例外不经历着一次又一次的洗牌,又在一次又一次的洗牌中或退场、或重生。

这是一个洗牌年代,也是一个值得书写的年代。

「硅基研究室」在年末之际,将推出「洗牌年代」系列策划,我们将以公司与行业分析为抓手,聚焦「洗牌年代」中的「人、事、物」,将行业共识凝练成经验,将预测化为分析观察。

本篇为本系列的第一篇,我们聚焦 AI 芯片行业的三场战事。

2024 年注定是 AI 芯片厂商们捉对厮杀的一年。

过去一年时间里,AI 赛道烈火烹油,以英伟达为代表的 GPU 厂商手握算力心脏,背靠 AI 企业扩大云计算规模和训练大模型的需求,吃下了 AI 时代的第一笔红利,赚得盆满钵满。

随着时间来到 2024,AI 从云端蔓延向终端,「AI+ 产品」概念下的许多新物种逐渐走到消费级的临界点。为了捕捉这些增长点,雄踞于各个细分领域的 AI 芯片龙头纷纷开启了跨界合作,一手推出新品,一手寻找新的合作伙伴。

即便是确定性相对较强的云端算力市场,也透着一股「山雨欲来风满楼」的气息。谷歌、微软、亚马逊先后宣布推出或计划推出自研 AI 芯片,AMD 的新产品 MI300X 在性能上紧咬英伟达 H100,英特尔 CEO 基辛格透露:" 整个行业都被推动来减少 CUDA的市场。"

2024,AI 芯片市场的格局将迎来什么变化?而这泼天富贵,又将花落谁家?

2024,AI芯片的三场关键战事

从云端需求和企业动作来看,2024 年研发下一代大模型仍将是各大科技公司竞争的核心,其中多模态模型占比逐渐提高的趋势带动了更大的算力需求。

C 端 AI 应用数量的增加也为云市场的增长注入了稳定性。过去,模型的预训练是 GPU 消耗最大的环节,大约 80%,但随着越来越多的消费者开始调用模型进行推理,未来推理和训练的算力占比将倒置。晚点 LatePost 报道,多位大模型从业者估算,如果千亿参数或更大的人工智能模型被广泛使用,大模型的训练成本和推理成本会达到 2:8,甚至 1:9。

对 AI 创业者以及科技巨头来说,这个消息忧喜参半。

2023 年,所有涌向 AI 的掘金者都对上游芯片供应商有一种复杂的情绪。研发 AI 产品离不开 AI 芯片这颗算力心脏,但高昂的价格和短缺的产能同时也令他们无时无刻不被焦虑包围。

除了恐惧拿到芯片的同行领先自己在市场上铺开业务,更担心卖方市场的格局仍将持续下去,无法摆脱向上游「纳税」的命运。

但令人意外的是,这些赚得盆满钵满的卖水人同样不安。GPU 龙头英伟达创始人黄仁勋在去年十一月的一场演讲中表示:" 我们不需要假装公司一直处于危险之中。我们一直处于危险之中。"

黄仁勋在 AI 的暴风眼站了一年,这句话大概是他的真实感受。

压力首先来自于同行竞争。

作为市场上唯一有希望在 GPU 领域挑战英伟达的企业,AMD 每次发布新芯片,英伟达都会被拿出来做对比,你甚至可以在去年 12 月的多轮交锋中看到火花迸射。

AMD12 月 6 日推出 MI300x 时,宣称表现优于英伟达的 AH100。英伟达随后发布了自己的基准测试作为回应,表明 AH100 在正确的设置下仍然更好。AMD 再次对此做出回应,发布了新的基准测试,再次显示 MI300X 在正确的设置下表现出色。

2024,AI芯片的三场关键战事

此外,英特尔虽然在 GPU 领域鲜有建树,但仍未放弃这块甜美的蛋糕。英特尔声称,将在 2024 年上市的 Gaudi 3,性能超过了英伟达的 AI 芯片 H100。

除了同行,英伟达的客户们也并不忠诚,谷歌、亚马逊、特斯拉、阿里、百度、微软 …… 几乎所有的大客户都宣布将自研 AI 芯片。

这些客户还对英伟达的生态护城河发起了猛攻。" 整个行业都被推动来减少 CUDA 的市场 ",英特尔 CEO 基辛格最近公开表示,MLIR、谷歌和 OpenAI 等都在转向一个 " 以 Python 语言为基础的编程层 ",以使 AI 训练更加开放。

自研芯片和生态建设并非易事,为何反倒成为了行业共识?英伟达的「镰刀」实在太锋利了。

《财新》的一篇报道中显示,哪怕花英伟达同样的成本,只要做出十分之一的效果,这些科技厂商便已经有利可图。更具体的案例是,按照谷歌的报价,使用其最新的 AI 芯片 TPUv5e 在训练、推理参数少于 2000 亿的大模型时,成本低于用 A100 或 H100。

英伟达抢客户的行为也让云厂商难以接受。去年 3 月 GPU 最稀缺的时候,英伟达推出云计算服务 DXGCloud。简单来说就是把卖给云厂商的 GPU 再租回来,进一步优化后再出租给需要 GPU 算力的客户。一来一去,云厂商承担了数据中心的建设成本,但客户却去了英伟达。

2024,AI芯片的三场关键战事

对英伟达来说,最大的变量可能还是在中国。近日外媒的一篇报道显示,由于对华出口芯片的性能被一压再压,中国玩家正在对其失去兴趣,这意味着它可能失去接近五分之一的营收。

当然,作为硅谷最具战斗精神和固执的企业之一,坐以待毙从来不是英伟达的风格。过去的一年里,凭借占市场份额接近 95% 的最大 GPU 卖方身份,英伟达的护城河其实被拓宽了。

英伟达的核心竞争力主要由三个板块构成——供应链优势、软硬件生态、投资。

软硬件生态方面,预计 2024 年出货的 AI 芯片 H200 及生态配件,仍是市场上最适合大模型生长的「土壤」。而投资方面,2023 年英伟达完成了 20 多笔投资,投资版图涵盖 AI 相关的各个行业,即便未必能从中稳定获利,过程中积累起的 KnowHow,也将逐渐成为其它初创企业选择英伟达的理由。

真正决定 2024 年市场格局的,是英伟达的供应链优势。

AI 芯片产业链冗长、复杂,每个细分领域都有各自的领头企业,只有将它们集成到一起,才能生产出性能最好的芯片。

英伟达笼络它们的手段是承诺不可取消的订单。目前,英伟达有 111.5 亿美元的采购承诺、产能义务和库存义务,另外还额外签订了价值 38.1 亿美元的预付费供应协议。这些被承诺的订单中包含台积电近六成产能和 SK 海力士、三星、美光 HBM 的大部分供应。

台积电封装对芯片性能的影响无须多言,HBM 同样关键。HBM 是高带宽内存芯片,而 GPU 只有内存足够大、数据传输速度足够快,才能保证运行效率。

单从这方面看,没有其他供应商可以与之相媲美,因此他们也将无法参与正在发生的狂热 AI 浪潮,即便是谷歌等科技巨头。

综上所述,2024 年的云端战事确定性较强,虽然英伟达遭遇围剿,但无论是自研芯片还是生态建设都需要时间来慢慢发酵,至少在供应链紧张的问题解决之前,英伟达的统治地位不会被动摇。

2024,AI芯片的三场关键战事

淘金先富卖铲人,背后的 AI 芯片厂商已经摩拳擦掌。分行业来看,AI PC、AI Phone、AI Car 是其中关注度最高的三个板块。

AI Phone:亟待 AI 拉动新增量

过去几年时间里,手机处于增长乏力的状态,即便厂商在硬件上「卷」到了极致,仍难以掩盖创新缺失的残酷真相。除了华为 mate 60 横空出世给市场带来了一些新鲜血液,就连苹果的发布会都难以讲出说服消费换机的新故事。

AI 是它唯一能拉动增长的发力点。「AI 上机」的传说从 ChatGPT 向 C 端开放起就飘荡在市场的上空,被谈论了一整年。但在大模型向小型化发展之前,硬件与模型规模之间的矛盾几乎不可调和。

事实上在手机端,至今也很难在保证模型性能的情况下,避免手机发热、内存占用量过大等体验对消费者购买欲产生的影响。

年初,手机芯片双雄之一高通演示了在安卓上运行 Stable Diffusion 的效果,并在近期宣布将推理时间缩短到 1 秒以内,但另一雄的联发科工程师表示,本地运行 13B 体量的小模型就意味着需要占用约 13GB 的内存,再加上安卓本身的 4G,在不下载任何其他 App 的情况下,就已经超过了大多数手机 16GB 的内存容量。

2024,AI芯片的三场关键战事

即便如此,市场仍为 AI Phone 领域的增长投下了赞成票。它们的理由是,手机是人们日常使用频率最高的电子产品,基于入口优势,虽然本地部署还存在一定的困难,但云端运行 AI 带来的增量仍不容忽视。分析机构 Canalys 预测,2024 年全球智能手机出货量将在 2024 年恢复增长,增幅约为 4%。

AI PC:硬件、框架之争

相比之下,AI PC 的进展则顺利得多。理由也很简单,与手机相比,PC 的体积更大,芯片性能的上升空间更广。IDC 预测,2024 年将成为 AI PC 快速发展的第一年,2024 年整体 PC 市场 AI PC 占比将达到 55%,而 2027 年将达到 85%。

目前 PC 端的 AI 芯片厂商已经释放出了浓烈的火药味,彼此间的混战一触即发。

NPU 与 GPU 之争是混战的第一个赛点。

GPU 无需多言,关键是 NPU 为什么能站上擂台。与算力中心背靠成千上万台集成了 CPU、GPU 等各种芯片的服务器不同,PC 的算力主要集中在一块「总芯片」当中,这块芯片由 CPU、GPU、NPU 等「分芯片」构成,各芯片分工不同。其中 NPU 就是专门被设计出来处理 AI 相关运算任务的。

因此,矛盾产生了。虽然 GPU 的定义是图形处理器,但同时它浮点、并行运算的特性也促使它成为了运行 AI 运算的最佳载体之一,这一点在云端已经被证明。一旦 AI PC 实现,大量 AI 运算任务势必带动 GPU 的销量。本次 CES 展开幕之前,英伟达连发三款消费级 GPU,显然是向市场释放信号。

X86 构架和 ARM 构架之争,是混战的第二个赛点。

2024,AI芯片的三场关键战事

X86 和 ARM 是芯片的两种构架。X86 构架是英特尔的代名词,在 PC 芯片端,直接与英特尔展开竞争的是采用 ARM 构架的手机芯片龙头高通和联发科。

X86 和 ARM 的区别可以简单概括成前者性能、功耗双高,后者双低。过去,ARM 一般被用于手机,但近年内,随着 ARM 芯片的性能不断提高,低功耗的优势正在引起业内玩家的注意。微软、苹果、Meta 等厂商都在支持基于 ARM 的 PC。据界面新闻报道,英伟达和 AMD 正在考虑 2024 年为移动 PC 提供基于 ARM 的解决方案。

高通对于 AI PC 垂涎已久,去年 10 月面对 Windows 11 发布的骁龙 X Elite 芯片与同级 X86 相比,性能可达竞品的两倍,而达到相同峰值性能时,功耗仅为竞品的三分之一。

AI Car:两大阵营跑马圈地

虽然 AI PC 的战场已经硝烟四起,但若是与 AI Car 相比,甚至能被称作一团和睦。背后的原因也很好理解,PC 和手机是为存量市场里找增量,而车载 AI 则是实打实的蓝海。

「AI 上车」同样有两个赛点,分别是智能座舱和自动驾驶。

在智能座舱领域,高通率先采用 SoC 逻辑设计车载 MCU 芯片的举措为它带来了先发优势,因此扮演着守城者的角色。眼下,它正面临着英伟达、联发科、英特尔等企业的多重围攻。

去年 6 月,联发科宣布将与英伟达合作,为下一代软件定义汽车提供全套车载人工智能座舱提供解决方案,覆盖从豪华到主流的所有汽车细分市场。

双强合作的模式是,联发科将开发集成英伟达 GPU 的汽车 SoC。而英伟达则是目前高端车型主要采用的自动驾驶系统供应商,客户资源广泛。本次 CES 展中,英伟达公布了 DRIVE 系列汽车业务的最新进展,理想、长城、极氪、小米等企业均已采用 DRIVE Orin 平台为其智能自动驾驶系统提供支持。

2024,AI芯片的三场关键战事

英特尔亦在 CES 宣布了进军汽车行业的重要战略,推出专为下一代汽车设计的 AI 增强软件定义车辆系统芯片 ( SoCs ) 。其旗下的自动驾驶解决方案公司 Mobileye 一直处于世界领先的地位。

在自动驾驶领域,则呈现两强争霸的格局。英伟达与地平线分别包揽高端和低端车型,按覆盖车型价格区间的广度排名,地平线第一,英伟达第二。

与英伟达 CUDA 类似,地平线也有自己的生态护城河。同时,作为本土供应商,地平线在交付效率上更具优势。

2024,AI芯片的三场关键战事

各家芯片厂商在 AI PC、AI Phone、AI Car 卷出天际,在这个堪比「春秋战国」的新竞争时代,即便英伟达依旧遥遥领先,一些关键问题也随之而来:2024 年,谁能杀出重围?谁又是英伟达之外最关键的变量?

毫无疑问,这将是一场格局之战。我们可以从蛛丝马迹中对 2024 年谁将杀出重围做出一些预判。

虽然三大热门场景都有变化,但增量的绝对值不尽相同。综合硬件性能、用户需求、市场规模等因素,「硅基研究室」判断,AI Car 会是增量最大的领域,AI Phone 次之,AI PC 最末。

车端可能是 2024 年最扑朔迷离的 AI 芯片战场。

市场上玩家布局的路线主要可以归纳成两条。一条从自动驾驶出发,向智能座舱拓展,譬如英伟达和 Mobileye。另一条则是从智能座舱出发,向自动驾驶拓展,譬如高通。

在智能座舱领域,眼下市场上各家新能源车企的竞争,与其说是芯片性能之争,不如说是对用车场景的理解之争。而在自动驾驶领域,因为和安全息息相关,必须要保证硬件运行的稳定性,并且需要经过市场验证,领先玩家具备更高的壁垒。

2024,AI芯片的三场关键战事

从这个角度出发,英伟达、Mobileye 将率先受益,地平线等二线厂商有望凭借低成本、高成熟度的产品成为车企的替代方案。

但是,如果将视角切换到交付的稳定度和市场铺开面上,则是地平线、华为等国产玩家具备更强的潜力。

一方面,在地缘政治背景下,AI 芯片的对华出口能否持续、稳定,需要画一个问号。性能和生态固然是一道门槛,但正在解决当中。

另一方面,虽然目前地平线主要在低端车型中铺开,但企业在自动驾驶领域的发展高度依赖数据积累,未来以更快的速度对先进厂商完成反超也并非没有可能。

在手机领域,AI 芯片厂商享受红利的前置条件是大模型本地部署。

2024,AI芯片的三场关键战事

众所周知,大模型上机有两种模式,一种是云端接入,另一种是终端部署。前者靠将用户的诉求反馈至云端,运算后在将结果发回手机。后者全流程均依靠本地硬件完成。

从能实现的功能上来看,两者类似,唯一对消费者购机意愿影响较大的因素是 " 是否愿意将本地数据上传至云端 "。从这一点出发,本地部署确实存在需求,手机 AI 芯片的增长值得期待。

那么高通和联发科谁能将占据领先地位呢?

从市场站位来看,高通和联发科分别占据高端和中低端手机市场,向上突破的难度远大于向下兼容,并且目前推出 AI 手机的厂商均将价格定位在高端。

高端的市场站位给高通带来了更丰厚的毛利率,对比财报来看,高通第三季度的毛利率约为 55.1%,联发科毛利率水平为 47.4%,这意味着高通有更多的「余钱」来推动研发。滚雪球效应下,恐怕联发科想要追赶高通仍有一段路要走。

值得一提的是,苹果和华为的 AI 芯片计划也会对市场格局产生影响,但程度较轻。

近年来,苹果手机芯片的性能提升幅度与高通、联发科等竞争对手相比均不占优势。不久前登场的两大安卓芯片——高通 8 Gen3 以及联发科天玑 9300,在 CPU 多核性能、CPU 多核能效比、GPU 峰值性能、GPU 能效比等核心技术指标上均已领先同时期的苹果 A17 Pro。

华为方面,受到地缘政治因素影响,目前在芯片性能方面还难以和国际一流芯片厂商掰手腕。

在 PC 端,虽然近日 AI PC 的声量不小,但距离它真正撬动 C 端市场的销量,还需要一些时日。

从 C 端场景出发,可以大致将 AI 应用区分为办公和娱乐两大类。

办公场景中,虽然微软、金山办公、Midjourney、Adobe 等软件已经将 AI 功能融入其中,但它们的推理任务主要还是由云端负担,并且已经形成了按次付费的商业模式,不需要本地硬件具备太高的性能。

在娱乐场景中,在 AI 热兴起之前,为了支撑游戏流畅运行,本身就对 GPU 为代表的图形处理能力有较高的要求。按照眼下能被「塞」进 PC 的模型规模,过去用于渲染游戏画面的 GPU,完全有充足的算力支撑 AI 衍生应用运行。

仍以英伟达为例,虽然在本次 CES 揭幕之前发布了三款新的消费级 GPU,但三款 GPU 的性能均未超越 2022 年发布的 RTX 4090。

2024,AI芯片的三场关键战事

综上所述,2024 年,在云计算等传统领域,英伟达得益于供应链优势等护城河,最值钱的卖水人地位短期内不会发生改变。

而在 AI PC、AI Phone、AI Car 三大场景中,分别在技术和渠道方面占据优势的英伟达和地平线将率先吃到 AI Car 的红利,而高通有望在亟需新故事拉动增长的 AI Phone 品类杀出重围,至于 AI PC,在新场景和新工作范式出现,并带动更强的硬件需求之前,相关企业的市场份额及销量还有待观察。

2024 年是 AI 芯片厂商迎来泼天富贵的一年,但同时,也能感受到水面之下酝酿着激烈的变化。企业和投资者当然可以投身这片蓝海,但最好时刻保持警惕。

热门搜索:
网友评论
本文共有 0人参与评论
用户名:
密码:
验证码:  
匿名发表

投稿咨询