kaiyun官方注册
您所在的位置: 首页> 模拟设计> 业界动态> “卷王”英伟达的真面目

“卷王”英伟达的真面目

2022-04-05
来源:脑极体
关键词: 英伟达 GPU 台积电

GTC 2022过后,广大人民群众纷纷奔走相告,黄仁勋又带着他的新“核弹”来“炸街”了。

具体发布的新产品和技术,很多文章都已经详尽地介绍过了,一言以蔽之:牛!其中最炸裂的是H100GPU,采用了台积电4纳米制程工艺,集成1800亿个晶体管,浮点计算能力相比前一代A100快了三倍,被看作英伟达的新一代“核弹”。

一时间锣鼓喧天、鞭炮齐鸣,工业界盼到了“算力怪兽”,消费者们也迎来了显卡降价的日子。

但冷静下来想一想,英伟达是“为AI继算力,为众人送温暖”的大善人吗?无论粉丝还是看客,都必须承认,英伟达是一个商业奇才。作为最传奇的数字经济股,它的营收远低于英特尔或Meta,但市值却遥遥领先,这显然不是“技术信仰”所能够解释的。

用黄仁勋本人的说法,英伟达历史上几次具有里程碑意义的关键技术推出,背后其实都是对自家 GPU 技术的发展成果进行了“泛化”(generalize),发现它居然可以做更多不同的事情。

03205705663498.jpg

究竟是新需求催生了新产品,还是新产品激活了新需求,这是一个“鸡生蛋蛋生鸡”的问题。但我们可以从英伟达的行动与结果的相关性中,总结出一个屡试不爽的模板:

在主流需求未曾触顶的时候,扩充丰富产品线,哪怕“穿马甲”也要全面布局,将利基市场挖掘到最大价值;而一旦主流需求出现颓势和退潮,超过当前市场需求的核弹级产品就会被抛出(当然功耗也爆炸了),再次点燃大众和华尔街对GPU的想象空间,进一步英伟达的估值推向新高。

比起“卷王之王”,英伟达更像是稳坐钓鱼台的姜太公,把全球消费者和产业界拿捏得明明白白。

四次供需“反弹”,英伟达的算力霸主之路

英伟达的算力霸主地位,究竟是怎么实现的呢?细数历史上的几次里程碑事件,会发现有四次关键“反弹”。

第一次反弹:个人电脑的增长风暴。

从1993年成立到1999年这段时间里,英伟达在群雄林立的显卡市场中并没有占据太大的领先优势。

当时研发显示芯片的厂商多如牛毛,除了IBM、索尼、东芝等开云棋牌官网在线客服巨头,垂直赛道如Matrox、3dfx、Trident、S3 Graphics都曾引领风骚。英伟达先后发布的NV1、NV2都没有什么竞争力,差点破产。1999发布的TNT2(也就是“NV5”)虽然夺得了性能桂冠,但速度只比NV4提高了10%至17%,跟主要竞争对手3dfx Vodoo3也没有拉开差距。

于是,第一个“核弹”来了,英伟达推出了NV10,也就是GeForce 256——第一款专业图形处理核心,直接轰开了个人电脑游戏加速的市场。

在此之前,GPU显示芯片都属于固定功能的芯片,而GeForce 256的出现,成为了第一款“集成了转换、照明、三角形设置/剪裁和渲染引擎的单芯片处理器”,能够每秒处理至少1000万个多边形,让GPU可以从CPU手里接管大量几何运算的工作,解决通用计算无法解决的问题,极大地推动了PC游戏、创意设计等对GPU的需求。

为了充分发挥GeForce 256的计算潜力,英伟达还基于该芯片推出了Quadro框架,服务于专业绘图工作站,用来帮助创意和技术人员更高效地工作。随后又推出了可编程 shader,让开发者可以在GPU上发挥更多创意,比如3D渲染、游戏开发、特效制作等……

用黄仁勋的话来说就是:鼓励或者调动全球人民的激情,让他们了解什么叫三维的图形处理器,给他们提供很多工具进行创新。

GeForce256发布的第二年,英伟达就接到了微软的订单,为Xbox视频游戏机开发显卡。此后靠的则是“半年更新、一年换代”的市场操作。GeForce系列产品线不断丰富、全面布局,覆盖了高中低端各类市场,还学会了穿“马甲”,在原有芯片基础上稍作提升和改进,就作为新系列快速推向市场。将竞争对手卷得苦不堪言,英伟达也因此占据了GPU市场70%以上的份额。

到了2007年,英伟达市值已经上涨了500%以上,被《福布斯》杂志评为年度公司。

第二次反弹:并行计算的强劲推力。

早在2006年,英伟达就推出了革命性的通用计算架构CUDA,以及通用计算硬件Tesla GPU。但在当时,深度学习并没有现在这般受欢迎,只有一些大型企业、研究机构需要GPU来进行药物发明、天气建模、金融分析等高性能计算任务。

英伟达是从何时起开始加大力度激活对GPU并行计算能力的需求呢?答案是2009年。

这一年,英伟达举办了首届“GPU技术会议”,面向“使用GPU解决重要计算工作的开发者、工程师和科研人员”布道。

2006-2009年间,市场发生了什么变化?受摩尔定律的统治,个人消费者对电脑显卡的性能需求开始倦怠了。

期间,英伟达其实也有不错的产品发布,比如重量级的Tegra移动处理器,集成了ARM架构处理器和Geforce GPU,功耗比普通PC笔记本电脑低30倍。产品虽好,却很难激发起消费者的澎湃热情,毕竟市场上还有那么多显卡在卖,只要愿意等,就能以更香的价格入手。

同时,因为一些被OEM整合到苹果、戴尔、惠普的笔记本当中的GPU缺陷,导致“异常故障率”而成为集体诉讼的对象。仅2008年第一季度,英伟达的收入减少了约2亿美元。股价也从37美元一路跌到6美元左右。

于是英伟达开始加大高性能计算领域的布局,在首届GPU技术会议上,推出了代号为 “Fermi” 费米的下一代CUDA GPU架构,并大力宣传GPU在大规模并行计算任务的优势。

费米架构作为“核弹”是称职的,一方面,它的性能很高,基于该架构的Geforce 4系列产品在性能上成功压制了竞争对手,但这一架构的功耗和发热量也十分恐怖。

无论如何,自此之后,英伟达在计算领域广受欢迎,2010年全球最快的超级计算机天河-1A,就采用了7168颗英伟达的Tesla M2050 GPU,将大规模并行GPU与多核CPU结合,成为当时异构计算的代表。

2012年深度学习三巨头之一Geoffrey Hinton及其学生Alex,使用GPU来加速训练深度神经网络,在ImageNet竞赛中一鸣惊人,掀开了人工智能第三次浪潮的大幕,进一步带动了英伟达GPU的销量。

AI需求的增长,还帮助英伟达开拓了汽车市场,紧接着2013年发布的Geforce GTX Titan泰坦,代表了开普勒架构的顶级水准,成为自动驾驶汽车和高级驾驶辅助系统的算力基础,支撑关键的计算机视觉功能。

人工智能从学术界到工业界的强劲需求,推动了GPU价格和英伟达股价水涨船高,完成了一次惊艳世界的“反弹”。

第三次反弹:矿难之后,图灵破局。

英伟达在深度学习领域的身位持续领先,但别忘了,规模庞大的零售市场可是现金牛啊。

2018年8月14日的SIGGRAPH 2018上,英伟达全新一代“图灵”架构GPU问世,支持实时光线追踪,专用于AI加速计算的张量核心首次加入了民用3D计算产品,为游戏世界带来了逼真的照明和反射效果。

在此之前,普通消费者早就“苦挖矿久矣”。

数字货币的爆火,让挖矿成了一门好生意,GPU被“矿厂”大量收购,一时间供不应求,加上黄牛囤积居奇,导致显卡的市场价格比零售价格高出了好几倍,普通消费者只能望洋兴叹。直到时间进入2018年,数字货币的潮水逐渐褪去,矿卡销量急剧下滑,显卡库存增加,一卡难求的局面有所缓解。

显卡厂商不仅面临降价杀估值的压力,随着大量矿卡流通到零售渠道中,还亟须打消消费者持币观望的情绪。这个时候,黄仁勋带着“英伟达十多年来在计算机图形领域最重要的创新”,再一次刺激了市场。

全新的技术和架构,将GPU的性能和英伟达的市值,又推到了一个全新的高度。

第四次反弹:币圈走熊,但产业智能方兴未艾。

今年最大的变化,是缺芯情况有所缓解,同时币圈再次走熊,比特币和以太坊价格都创下新低,GPU价格再一次回落。根据国外媒体报道,英伟达已经通知合作伙伴 GPU 的生产成本将下调 8% - 12%。如果显卡价格进一步下降,市场对英伟达的信心也会过度反映到股价上。

不过,你永远可以相信英伟达“核弹工厂”的能力。诚如大家在GTC 2022大会所看到的,全新一代产品和技术全部瞄准了最具想象空间的产业AI应用场景。

最新一代“核弹”H100 GPU,和Hopper 架构,专为Transformer大参数模型打造,可以说是完美迎合了预训练大模型的需求。

NVIDIA Quantum-2,主芯片包含570亿个晶体管,为云服务商和超算中心提供AI算力,正对应着如火如荼的AI基础设施建设。

AI超级计算机NVIDIA Jetson AGXOrin,简直是自主机器人研发人员“捕获器”。

更不要提开放式平台 NVIDIA Omniverse,试问哪个想做元宇宙的公司能不心动呢?Meta就用英伟达DGX A100系统构建了自己的首台AI超级计算机。

凭借这几个“大饼”,黄仁勋也在GTC大会上自信地指出,英伟达未来有能力实现万亿美元的销售收入,可以说是完美化解(或者说让大众忽略)了GPU市场波动。

英伟达的“核弹”背后,都是跟随着GPU市场变动,不断创造需求、刺激供给的过程。商业价值不断飙升的同时,确实给GPU技术带来了巨大提升。

这能说明,黄仁勋是“商业奇才”吗?恐怕不行。

姜太公钓鱼,把反弹效应玩明白了

凭借GPU在图形计算上的贡献,黄仁勋也被江湖人称“AI教父”,甚至一度想要干掉摩尔定律,推动自己的“黄氏定律”主宰计算市场。

但其实从四次供需“反弹”中可以看到,英伟达不过是把摩尔定律的“反弹效应”拿捏得明明白白了。

所谓“反弹效应”(Rebound effect),也被叫做“收回效应”(take-back effect),最早是由威廉·斯坦利·杰文斯在《煤炭问题》一书中提出的,指的是提高效率的新技术,最终预期收益减少的情况。

放在IT领域,就是“What Andy gives,Bill takes away”安迪(英特尔CEO安迪·格罗夫)带来的CPU硬件性能提升,最终会由比尔(微软CEO比尔盖茨)通过软件/服务不断扩大而收回。

结果就是,虽然摩尔定律会推动计算硬件不断提效降价,但因为“反弹效应”,不断产生新的需求/应用/场景,吃掉硬件性能提升带来的好处。

只有这样,用户才会愿意掏钱更新机器,以便能享用到更新更消耗资源的服务。

回望个人电脑、智能手机的发展历程,无不是在摩尔定律及其反弹效应下发展起来的。而英伟达所在的GPU市场,显然没有脱离这一范畴。

一方面,英伟达的产品性能提升速度,虽然超过了摩尔定律所规定的“18个月翻一倍”,实现了AI计算性能的逐年翻倍,也就是“黄氏定律 (Huang’s Law)”。但从最新一代H100 GPU的性能提升上,显然还依赖于延续了半个多世纪的开云棋牌官网在线客服制程工艺限制,采用了台积电的4nm(而非此前业界猜测的5nm)工艺,再结合全新的架构设计,才能达到“核弹”级别。

另外,性能提升必须通过新的服务/应用“take back ”,不然用户只需要等相同性能的GPU降价就可以了,没有必要花大价钱去买新的。这也是为什么AI大模型训练、自动驾驶、元宇宙、机器人……作为GTC大会的“全家桶”才会同时登场,通过各行各业的智能化来消耗掉新技术带来的AI算力资源。

黄仁勋也曾在采访中提到过,英伟达“甚至用了市场营销的预算,帮开发者营销他们用我们架构开发的产品,来创造市场需求”。

所以说,英伟达的每一次“核弹”炸街,其实都是在硬件性能回收出现不顺利的时候,再一次开辟出更大的需求空间,以缓解技术收益减少的局面。

“What NVIDIA gives,AI takes away”,英伟达靠这一手,把全球玩家和华尔街投资人拿捏得明明白白,市值也就次次化险为夷“稳坐钓鱼台”了。

愿者上钩:自己卷自己有什么问题吗?

某种角度来说,英伟达对“反弹效应”和大众需求的拿捏,是“姜太公钓鱼,愿者上钩”。只要研究人员觉得模型训练时间从十几天缩短到几个小时很值;只要游戏玩家觉得更逼真的渲染效果真香;只要Meta觉得GPU对元宇宙来说不可或缺……这不就够了吗?

确实,乍一看,好像通过刺激需求来避免技术收益降低,是在和大家作对,但实际上,科技企业对反弹效应的努力规避,也会带来很多衍生好处。

一方面,新技术的反弹效应是不可避免的。

这会直接降低技术产品的成本,除非你是追逐最新显卡的发烧友游戏玩家,否则只要愿意等待,总能以更低的价格买到更高性能的GPU,谁跟真金白银有仇呢?

此外,为了避免新技术收益降低,科技企业不得不投入大量精力开发下一代产品,卷过了竞争对手还不行,还得自己卷自己。如今英伟达已经占据GPU的绝对优势地位,但依然在不断推陈出新,不然就要被骂“挤牙膏”。对于有替换需求的群体来说,总有更好的产品可以选择。

同时,更高的性能和资源,也会孕育出很多前所未有的应用和服务,计算机刚诞生时格外昂贵,只能为美国顶尖大学研究机构所用,而且还只会下棋,现在一部千元手机就可以让偏远山区的农民上网直播卖水果。同样,我们往后看五到十年,如果自动驾驶汽车的比例从现在的不到1%变成50%,人们停留在元宇宙的时间和现在玩手机一样频繁,那么这会催生多少新兴的服务和商业公司呢?

黄仁勋本人曾回忆第一个GPU产品的研发过程,他说:“可能也没有人知道自己需要什么。因为事情经常是这样,你没看到过一个东西,就不会知道自己是否需要。”

不过回想一下,很多曾经我们以为可有可无的功能,比如视频通话、在线直播、高清视频……在今天都已经成为必备功能。需求确实是可以被创造的,不过,需求也有轻重缓急,英伟达不断甩出的“鱼钩”,对你是否有吸引力呢?




最后文章空三行图片.jpg


本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306116;邮箱:aet@chinaaet.com。
Baidu
map