芯片制造商英特尔的老板Pat gelsinger喜欢吹嘘他的公司通过进入“埃时代”引领了半导体技术的发展。埃是为了纪念 19 世纪瑞典物理学家 Anders Jonas Ångström 而命名的,是一个相当古老的单位,相当于十分之一纳米(0.1nm 或一百亿分之一米)。
英特尔最新芯片的“工艺节点”被称为“20 a ”和“18 a ”。如果将这两个后缀A理解为表示“埃”——英特尔从来就没明确说过它们代表什么——那就从另一方面代表着尺寸只有 2nm 左右。在某一时刻,工艺节点几乎与晶体管栅极长度同义。
但请别再幻想晶体管只有九个或十个原子宽了。这家陷入困境的公司刚刚放弃了“20 A ”架构,将 18 A 的晶体管数量翻了一番,这种晶体管的栅极长度约为 14 纳米——140 埃,或 140 Å。
栅极长度为 140 Å 的“20 A”节点只是普遍趋势的一个例子。在过去十几年里,公司在营销中提到的尺寸和芯片结构的尺寸已然浮现分歧。
在 20 世纪 70 年代,工艺节点的大小被认为是晶体管两端(源极和漏极)之间的距离,也称为栅极长度。实际上,这在某种程度上预示着工艺节点也是芯片的“金属半节距”。半节距是一条金属线(用于传输数据的连接线)末端与下一条金属线起点之间距离的一半,粗略地说,这在某种程度上预示着芯片元件之间距离的一半。
20 世纪 90 年代中期,栅极长度开始比半节距缩短得更快。随后,在 21 世纪,由于电力和废热问题,栅极长度缩短的进程急剧放缓。公司所参考的测量值赶上了栅极长度,并低于栅极长度(见图表)。无论工程限制如何,营销部门都将成为遵守摩尔定律的企业公民。
这种说法被认为是合理的,部分原因是栅极的内部结构比其总长度要小。英特尔曾一度制造出金属半间距为 40 纳米、栅极长度为 26 纳米、鳍式场效应晶体管内鳍片宽度为 8 纳米的芯片。它们被随意地称为“22 纳米”。
业内大多数人认为,栅极长度将在 12nm 左右触底,金属间距将在 14nm 左右触底。这大约是使用asml最好的光刻机可以打印的最小尺寸。但业界不能放弃谈论其在越来越小且完全是概念性的节点尺寸方面的进步。2021 年,英特尔将其“10nm”节点更名为“Intel 7”,删除了“nm”。台积电谈论 3nm 和现在的 2nm 节点(据称比英特尔的 18A 更先进)。3 月,在线出版物ZDNet 报道称,三星已将其 3nm 工艺更名为 2nm。令人难以置信的缩小言论仍在继续。
一个世纪前,加利福尼亚州山景城圣安东尼奥路 391 号曾是一家杏子包装棚的所在地。如今,它只是繁忙道路上众多低层办公大楼之一,这里汇聚了硅谷的科技初创公司和亿万富翁。然而,在它前面矗立着三座巨大而奇特的雕塑,两条腿和三条腿的造型让人想起水塔。它们是两个二极管和一个晶体管的巨型版,都是电子电路元件。1956 年,圣安东尼奥路 391 号成为肖克利半导体实验室的所在地,这家初创公司致力于用硅制造此类元件。这里是硅谷的发源地。
该公司由晶体管的共同发明人威廉·肖克利 (William Shockley) 创立,但最终却以失败告终。而对硅的接纳却并非如此。1957 年,肖克利的八名员工(肖克利先生称之为“叛徒八人”)叛逃到距离这里不到两公里的地方创办仙童半导体公司。这中间还包括芯片制造巨头英特尔的未来联合发起人戈登·摩尔 (Gordon Moore) 和罗伯特·诺伊斯 (Robert Noyce),以及开创性风险投资公司凯鹏华盈 (Kleiner Perkins) 的联合发起人尤金·克莱纳 (Eugene Kleiner)。硅谷大多数著名的科技公司都能直接或间接地追溯到仙童半导体公司的早期员工。
在半导体元件发明之前,计算机是房间大小的机器,使用脆弱而精密的真空管。半导体是一种能控制电流流动的固体材料,能够给大家提供更坚固、更灵活、更小巧的元件。当这些元件主要由硅制成时,就可以在一块硅片上制造出一大堆这样的元件。硅“芯片”上的微型晶体管、二极管等可以连接在一起,形成用于存储或处理数据的“集成电路”。
1965 年,摩尔还在仙童公司工作时就注意到,在给定成本的情况下,集成电路中可以装入的晶体管数量年年都会翻一番(后来他将翻一番的时间放宽到每两年一次)。他的观察结果被编纂为“摩尔定律”,发挥了及其重要的作用。1971 年生产的芯片每平方毫米有 200 个晶体管。2023 年,美国半导体公司AMD制造的处理器mi 300在同样的面积上塞进了 1.5 亿个晶体管。晶体管越小,开关速度就越快。mi 300的组件比 50 年前的上一代快了数千倍。
从个人电脑和互联网到智能手机和人工智能 ( ai ),计算领域的所有重大突破都可以归因于晶体管慢慢的变小、慢慢的变快、越来越便宜。晶体管的进步推动了技术的进步。
有一段时间,硅片的技术核心地位与制造芯片的企业的重要性不相上下。20 世纪 70 年代,制造芯片、使用芯片的计算机以及在芯片上运行的软件的 IBM是一家无与伦比的巨头。20 世纪 80 年代,微软证明了一家只销售软件的公司可能更具吸引力。而制造微软软件所用芯片的英特尔本身就是一股巨大的力量。在 2000 年互联网泡沫破灭之前,英特尔是全球市值第六大的公司。
然而,在经济衰退之后,谷歌和 Meta 等企业来提供的“Web 2.0”服务占据了中心地位,其平台所依赖的半导体也日益商品化。风险投资家马克·安德森 (Marc Andreessen) 在 2011 年表示,软件而非硅片“吞噬了世界”,如果要描述大型科技公司增长背后的动态,那一定是软件,而不是硅片。
人工智能的蓬勃发展改变了这一现状,其进步依赖于巨大的计算能力。2010 年之前,训练领先AI系统所需的计算量大致符合摩尔定律,每 20 个月翻一番。此后,每六个月翻一番(见图 1)。这在某种程度上预示着对更强大芯片的需求慢慢的变大。Nvidia 是一家美国公司,专门生产一种很适合主导人工智能的大型语言模型 ( LLM ) 需求的芯片,目前是全球第三大最有价值的公司。自 2023 年底以来,摩根士丹利资本国际芯片制造公司指数十多年来首次大幅跑赢其软件公司指数(见图 2)。
随着人工智能再次让芯片制造变得重要,有人工智能野心的公司也加入其中。驱动力不仅仅是训练,还有后续使用(也称为“推理”)。使用LLM回答查询虽然没有一开始就训练它们那么困难,但仍然是一项巨大的计算任务,每天有必要进行数十亿次。由于定制电路比大多数半导体供应商销售的通用电路更有效地完成此任务,因此一些运行LLM的公司选择专门为此目的设计芯片。苹果、亚马逊、微软和 Meta 都已投资打造自己的定制人工智能芯片;谷歌设计并用于数据中心的处理器数量比除 Nvidia 和英特尔之外的任何其他公司都要多。全球十大最有价值的公司中有七家现在从事芯片制造业务。
芯片的复杂程度主要根据其特征有多小;目前,尖端技术的定义是“工艺节点”尺寸小于七十亿分之一米(七纳米,或 7nm——请参阅后面的方框,了解对此的看法)。这就是人工智能行动的中心。但超过 90% 的半导体制造能力都采用 7nm 或更高的工艺节点。这些芯片的技术挑战性较低,但应用场景范围更广,从电视和冰箱到汽车和机床,无所不在。
2021 年,在新冠疫情最严重的时候,此类芯片的严重短缺扰乱了包括电子科技类产品和汽车在内的各个行业的生产。该行业对效率的追求使其业务遍布全球,不一样的地区专注于供应链的不同环节:美国负责芯片设计;欧洲和日本负责芯片制造设备;台湾和韩国负责使用这一些设备的晶圆厂;中国和马来西亚负责芯片的封装和组装。当疫情扰乱这些供应链时,各国政府都注意到了这一点。
2022 年 8 月,美国政府推出了一项 500 亿美元的补贴和税收抵免计划,以吸引芯片制造业回归美国。别的地方也纷纷效仿,欧盟、日本和韩国承诺提供近 940 亿美元的补贴。美国试图通过出口禁令切断中国获取尖端芯片及其制造工具的渠道,这让情况变得更复杂。中国对这些禁令的回应是限制两种对芯片制造至关重要的材料的出口。
但芯片制造商最大的担忧不是产业政策或国家竞争,而是技术。五十年来,晶体管的缩小在不增加能耗的情况下提高了性能。现在,随着芯片密度慢慢的升高、人工智能模型慢慢的变大,能耗也在飙升。为了保持性能的指数级增长,芯片制造商需要新的想法。有些想法是渐进式的,比如硬件和软件之间更紧密的集成。另一些想法则是激进的:重新思考硅片或放弃数字处理而采用其他技术。
芯片制造业长期处在一种偏执的乐观状态。自从戈登·摩尔观察到解决能力大约每两年翻一番并被他人编入“摩尔定律”以来,一批专家一直在警告该定律即将终结。这种恐惧夹杂着一种坚定的信念,即总有办法阻止这一必然结果,但结果令人瞩目。
在过去 50 年里,处理器的工作速度提高了数万倍,在相同面积上存储的数据量增加了一百万倍。晶体管的成本也下降了十亿分之一,使技术成为全世界通货紧缩的力量。它们也无处不在:半导体现在是全球交易额第三大的商品,仅次于石油和汽车。
但数十年的成功并未平息业界对摩尔定律即将终结的担忧。2017 年,全球市值最高的芯片公司英伟达的老板黄仁勋宣布摩尔定律已死。今年 6 月,摩尔先生共同创立的英特尔公司首席执行官帕特·基辛格坚称摩尔定律“依然活着”。我们大家都认为,即使摩尔定律没有灭亡,它也只能勉强维持生命。
在晶体管的大部分历史中,它都遵循着“快乐缩放”的路径——随着逻辑门的缩小,它们变得更快,功耗更低。那个时代已结束了。前沿人工智能处理器在单个芯片上塞入更多晶体管,或将多个“小芯片”堆叠到一个封装中,以提高计算能力。但性能的提升是有代价的:芯片的能耗激增。一块 Nvidia 最新推出的 Blackwell 芯片的工作速度比其前代产品快 5 倍,但功耗却增加了 70%。
数据中心将数百或数千个耗电芯片捆绑在一起,以运行大型人工智能 ( ai ) 模型。据估计,Chat gpt的制造商 Open ai耗费了超过 50 千兆瓦时的电力来训练其最新模型(见图表)。国际能源署 (International Energy Agency) 计算,2022 年数据中心消耗了 460 太瓦时的电力,几乎占全球电力需求的 2%。该机构预计,到 2026 年,这一数字将翻一番。
芯片制造商为提升人工智能模型的解决能力而不导致能源增长失控而采取的技巧暗示着半导体行业正在发生转变。第一个变化是计算机作为通用机器的衰落。麻省理工学院的尼尔·汤普森认为,几十年来,摩尔定律一直将计算联系在一起。每一代半导体技术都比上一代更快、更节能。这使得科技界可以依赖通用处理器——中央处理器 (CPU ) ——它可以被编程来执行许多任务。但摩尔定律的终结使得现在提高所有应用程序的性能变得更困难。
就人工智能芯片而言,应对措施是针对特定软件专门设计或微调芯片。汤普森认为,这可能会将计算分成两条车道:快车道,尖端应用受益于强大的定制芯片;慢车道,普通应用只可以使用通用芯片,而通用芯片的进展正在放缓。
专业化的需求促成了第二次转变——同时控制硬件和软件的公司的崛起。五十多年来,科技界被分成了两个阵营:一派是搞电路的硬件,一派是编写软件的编程极客。“Wintel”联盟让计算机在英特尔生产的芯片上运行微软的 Windows 操作系统,这是科技史上最成功的合作伙伴关系之一。
如今,两大阵营之间的隔阂已经破裂。Nvidia 首席科学家 Bill Dally 表示,软件和芯片架构的改进比采用更新的制造工艺能带来更大的收益。在尖端领域,专用硅片是未来,而巨头们自己也在做很多这方面的工作。
苹果、亚马逊、谷歌、微软和 Meta 现在都使用针对自家软件优化的定制硅片。谷歌的处理器专为运行其机器学习软件 TensorFlow 而设计。苹果的自制芯片经过调整,可以在其生产的设备上运行自家的软件。这一些企业与美国芯片公司 Broadcom 等公司合作设计这些芯片,并与台积电等代工厂合作生产这些芯片。Nvidia 是唯一一家通过为其他公司制造人工智能芯片而大获成功的公司——但这在某些特定的程度上是因为它的芯片针对其软件平台CUDA进行了优化,而该平台已成为行业标准。
据咨询公司 bcg称,2018 年至 2023 年期间,“六大”公司(五大科技巨头加上 Nvidia)约占科技行业价值的 60%。但这不会减缓创新。这个新世界比引发计算机革命的上一个时代更具创造力。现在,计算机能够最终靠更多方式变得更好——通过硅片的巧妙设计、更好的封装、创新的芯片设计和新材料。它将以 Wintel 世界从未有过的方式展开竞争,并可能创造出更精彩的东西。硅片、恐惧和坚定信念的结合将在未来 70 年取得比过去 70 年更大的成就。