8.2 Getting AI datacentres in the UK

这篇文章深入探讨了英国在人工智能数据中心建设方面的潜力,强调了核能作为低碳能源的关键角色。作为风险投资人,我意识到在AI和能源领域的交集提供了新的投资机会,尤其是在推动低碳技术和基础设施建设方面。文章提出的‘特殊计算区’概念,可能为投资者提供了一个新的切入点,尤其是在政策支持和市场需求日益增长的背景下。

ONE SENTENCE SUMMARY:

英国需要创建特殊计算区,以应对AI数据中心的能源需求和建设障碍,从而促进经济增长和技术发展。

MAIN POINTS:

TAKEAWAYS:

html

以下是当前情况的一些背景信息:

报告导航

概述 可以单独阅读。更多详细信息…

  1. AI进展非常迅速 ,解释了投资者在购买什么。

  2. AI如何变得计算密集 ,提供了一个简短而简单的技术介绍,说明为什么AI系统使用如此多的计算能力。

  3. AI系统的进一步进展和部署将使用10到100吉瓦 展示了计算密集度的历史趋势以及对AI能量密集度的前瞻性估计。

  4. 英国将使用核能而非风能和太阳能为AI数据中心供电 评估了低碳能源的适用性。

  5. 没有AI数据中心将是一个错误 阐述了为什么英国需要拥有AI数据中心,而不是依赖国际市场。

  6. 核能建设缓慢且昂贵,但可以更便宜和更快 ,诊断了为什么英国核电建设成本如此之高,以及如何解决这个问题。

  7. 英国应创建特别计算区 ,建议了使英国成为世界上建设AI数据中心的最佳地点的实施细节。

我们要感谢John Myers、Robert Boswall、Nathaniel Read、Freddie Poser、Ben Southwood、Mustafa Latif-Aramesh和Samuel Hughes对这项工作的反馈和评论。

我们还要感谢 Britain Remade 的工作,特别是 Sam Dumitriu ,其对核能和基础设施成本的高质量分析在本提案中发挥了重要作用。

概述

某些类型的增长难以实现。人们创造经济增长的一种方式是通过在实验室中进行新的发现,进行工程工作将这一发现转化为产品,然后经营企业将产品分发到世界各地。学术文献表明,这种增长类型随着时间的推移变得越来越困难——需要增加 越来越多的研究人员来维持一致的突破率 。这就是经济学家所说的“前沿”增长——这需要做一些以前没有人做过的事情。另一方面,某些其他类型的增长相对简单:投资者可能会出现,想要重复在其他地方证明有效的技术,并希望建造某种工厂来复制它。实现这种“追赶”增长是一种选择。

英国多年来一直 没有 增长。自2007年以来,人均GDP仅增长了 0.35%每年 ,总要素生产率增长 一直持平

有时,一种新的前沿增长类型会出现:一系列科学突破将导致新 “通用技术” 的诞生。现代历史上有三种:蒸汽机、电力和信息技术(计算机)。这些技术将传播到许多行业,并成为进一步技术发展的平台。每种通用技术都需要几十年才能达到大规模采用,但每种都提供了巨大的经济增长机会。工业革命是围绕通用技术组织的:第一次工业革命是蒸汽动力,第二次是电气化,第三次是数字化。

今天,这样的突破正在人工智能(AI)领域发生

AI有望对认知劳动产生类似于蒸汽机对体力劳动的影响

一种思考AI影响的方法是使用蒸汽机作为类比。在第一次工业革命中,有一个明确的输入和输出关系——投入煤炭,输出曲轴的旋转动力,可以用于各种下游任务(火车、工厂、 更多 煤矿开采)。这种力量之所以强大,是因为它是 可靠的 ——每次添加煤炭时,他们都知道会发生什么;它是 通用的 ——旋转运动可以应用于任何这些用例;并且它是 可扩展的 ——只要能设计出更大的蒸汽机,就没有限制可以有效转换为动力的煤炭量。

我们今天拥有的一种潜在资源——就像十八世纪下半叶的英国人拥有大量地表煤一样——是计算机芯片中的计算能力。在过去的60年里,芯片上的晶体管数量(可以理解为计算能力单位)每两年翻一番,给我们提供了巨大的计算能力供应。对AI领域试图回答的问题的一种直观理解是,“我们如何将这种计算能力转化为有用的信息处理能力?” 1 这需要找到管道和阀门的系统——在这种情况下,是架构、算法、数据和训练程序的组合——以使输入输出关系起作用。

html

在过去的12年中,AI研究人员找到了可以让他们增加更多输入的广泛变量组合。如今的最先进系统在能力基准测试中得分非常高。它们在测试科学专业知识的基准上 表现优于 博士级专家 ;在美国法学院入学考试(LSAT)中 得分达到99百分位 2 ;并且能够在国际数学奥林匹克竞赛(针对世界上最优秀的高中生)中赢得 银牌 。这些能力已经转化为 经济上有用的表现 :在 软件工程任务 客户支持 材料发现 中。

AI系统将通过三种主要方式支持经济增长:

  1. AI将让我们 自动化 现有的 信息处理任务

  2. 随着信息处理成本降至零,我们将 利用这种新丰裕创造新产品和服务

  3. AI可以帮助 加速研究和开发 以推动前沿增长。

关于AI系统的输入输出关系,重要的是要理解它们在 特定任务 上有极其可靠的改进。然而,通用AI系统主要被训练来预测序列中的下一个词,因此 在文本预测上的改进是否会继续转移到系统中的有用能力上是确实不确定的 ;并且由此推论,这些是否会转移到经济上有用的任务中。OpenAI的GPT-3是大多数人通过ChatGPT体验的第一个系统,它有一些有用的能力——比如擅长写十四行诗——但 GPT-4 才开始能够进行编码。到目前为止,这些改进继续转移,这解释了AI系统令人印象深刻的能力和经济兴趣。

AI的计算和能量密集度只会越来越大

由于计算和“能力”之间的这种不确定交换率,AI开发者希望 继续增加创建和运行这些系统的计算输入 并且 他们希望尽可能广泛地销售当前的能力 。挑战在于增加计算能力是极其耗能的。AI系统使用专用芯片,主要是NVIDIA设计的图形处理单元(GPU)。每个最先进的GPU使用大量的电力:如果持续使用,它 将消耗比英国平均居民多44%的电力 3 为了支持这种能量和计算密集的过程,AI芯片被安置在数据中心。这些是专门的仓库,优化以管理芯片的冷却和能量需求。从外面看,这些是工业园区中的普通建筑。

Meta最近的AI系统(称为Llama 3.1)在单个数据中心 使用16,000个活跃的GPU进行训练 估计需要27兆瓦 (MW)的装机电力容量。这大约相当于 88,000个英国家庭 4 一个有用的直觉是,单个数据中心将使用与一个小城市相同的电力。

随着开发者押注于输入输出关系的持续性,计算能力正在以惊人的速度扩大——自2017年以来,用于训练AI系统的计算能力每年增长 5倍 。如果当前趋势持续到2030年,训练最大的AI系统将需要 大约2.15倍于英国 整个 电力生产 5 Meta在2024年7月发布的Llama 3.1可能会显得非常小!运行这些系统也将变得更加耗能:已经开发出新方法,在模型运行时输入额外的计算能力,以进一步增强能力。NVIDIA的CEO黄仁勋预计这将增长 十亿倍 。更多关于这些趋势的细节在正文中有介绍。

未来十年将有一波资本投资用于建设10到100吉瓦的数据中心和电力

为了继续增加计算能力的输入,AI开发者和向他们出售数据中心容量的“云提供商”正在尽可能快地扩大他们的业务。SemiAnalysis 估计AI数据中心的电力需求 将在全球范围内 到2026年增长40吉瓦(GW),仅在美国,到2028年将增长47.8 GW,从2024年的8.5GW 。为了更好地理解,一个GW的持续电力需求是利物浦平均电力需求的五倍。 6 未来两年全球新增的AI数据中心将使用大约200倍于利物浦的电力需求。

这种巨大的需求增长受到电力生产的限制。电力供应根本不足。因此,AI开发者正在签署长期电力购买协议以重新启动核电站,并与“小型模块化反应堆”(SMR)的开发商签署开发协议。也许最引人注目的是,Elon Musk的公司x.ai甚至在孟菲斯将一个工厂改造成一个拥有100,000个GPU的数据中心,仅用了19天,并且 在外面使用天然气发电机 来弥补所需的电力。

没有开发者会选择在英国建AI数据中心

目前,未来的资本投资浪潮将绕过英国。没有AI开发者或云提供商会选择在英国用新电力建AI数据中心:

目前的规划、监管审批和建设速度太慢,无法跟上投资浪潮。

如果英国想要AI数据中心,核电将是最安全、最清洁、占地最少的,并且也可能是最便宜的。

我们调查了哪种能源生成方式最适合为AI数据中心供电。我们比较了核电,或风能、太阳能、电网电池储存和天然气备份的混合方案的可行性。

我们计算了将可再生能源与电池和天然气结合以提供数据中心所需的永久电力供应的成本最小化方式,发现每千兆瓦的稳定电力需要8 GW的太阳能装机容量,0.37 GW的风能,12 GWh的电池备份,完整的天然气备份,以及451百万立方米天然气的液化天然气进口能力。这在多个方面变得不可行:

html
  1. 土地强度——8GW的太阳能电池板和0.37GW的风力涡轮机分别需要 160平方公里和41平方公里的土地 。(作为参考,卡迪夫市面积为140平方公里,雷丁市为40平方公里。 7 )这种需求 扩展性很差 。一些数据中心园区的规模远超一吉瓦,例如,为了给 微软和OpenAI在弗吉尼亚的5GW数据中心园区 供电, 需要超过1000平方公里的连续土地。

  2. 排放——由于风能和太阳能的不稳定性,天然气将产生28%的电力,这 将比同等核能容量多产生40%的碳排放

  3. 安全性——天然气排放造成的空气污染将比核事故的风险 危险许多倍 导致预期死亡人数多27倍

  4. 液化天然气(LNG)进口能力的有限接近性。英国有三个LNG进口终端,一个在肯特,两个在南威尔士。天然气发电终端需要远离人口中心以减少空气污染,但也要足够接近进口终端以避免需要天然气管道。要么需要找到方法在肯特或南威尔士建造这些发电设施 同时与 太阳能和风能发电场相邻,要么可能需要建造新的LNG进口终端,但这两种方法都不具备良好的扩展性,后者还会大幅增加成本。

  5. 成本——我们计算出风能、太阳能、电池和天然气混合的平准化成本为106英镑/兆瓦时,低于欣克利角C核电站当前的CfD价格(143英镑/兆瓦时 8 ),尽管核能有很大的成本节约空间——韩国的建造成本大约是英国的25%——因此如果能缩小与韩国的成本差距的三分之二,成本将比可再生能源便宜37%。(在德克萨斯州,相同排放强度的可再生能源成本为74英镑/兆瓦时。)

在英国建造核电站一直以来都很慢且昂贵,但不一定非得如此。一些相关事实:

小型模块化反应堆(SMRs)为英国提供了巨大的机会。因为大部分组装是在工厂进行的,制造过程中可以实现大幅度的生产力提升,现场施工只需几个月。此外,SMRs特别适合AI数据中心,因为可以有一支舰队为数据中心园区供电,因此当发生故障时,电力供应是多样化的。

让英国的核电具有竞争力是吸引AI数据中心的唯一途径:如果数据中心提供商想要使用可再生能源的混合方案,他们很可能在西德克萨斯州会更好。

有可能降低成本——有很多低垂的果实可以摘取!

英国需要AI数据中心以确保经济安全、促进前工业地区的增长,并抓住未来前沿增长的机会

此时,怀疑者可能会问是否值得尝试。一般用途技术革命中,大部分收益来自 采用 新技术,似乎不太可能归于那些托管AI数据中心的国家。也许这波投资即将发生,但英国不能只专注于“高价值”活动,如整合AI系统和构建AI应用。

我们不这样认为——首先也是最重要的,没有稀缺资源被用于允许这种增长,所有资本都来自私人投资者,而英国 需要 增长。最重要的是,英国需要其未来经济引擎的关键投入,旧的经济教条——即可以坐在价值链顶端,只专注于“高价值”活动——是错误的。这导致了行业的空心化,忽视了允许我们实现未来增长的宝贵“通过实践学习”。没有数据中心的英国将缺乏其未来经济引擎的关键投入。

财政大臣Rachel Reeves经常推广一种新的 “安全经济学” 理论,其核心原则是在“充满不确定性的时代”优先考虑 经济安全 ,不依赖于来自伦敦和东南部的狭窄行业来推动全国的增长,并 抓住快速变化的世界的机遇

在英国托管AI数据中心是所有三个原则的核心。

首先,随着AI系统越来越多地融入经济,尤其是融入英国的专业服务出口业务, 英国的大部分资本存量将被创建、存储或运行在AI数据中心中 。英国希望这些AI数据中心在这里,而不是在海外通过海底电缆连接,以确保能够保护这些资产。此外,由于采用对于获取收益至关重要,英国需要确保其拥有所需的计算能力。随着全球对计算能力的需求上升,可能会出现英国企业无法获得这种能力的情况。微软的CFO在 两周前的财报电话会议 上表示,他们的云业务收入增长了33%,但“[d]emand continues to be higher than our available capacity.”

其次, 政府的AI行业研究 显示,75%的英国AI公司位于伦敦、东南部或东英格兰。这是可以预料的:AI应用开发者将聚集在伦敦,因为它拥有除旧金山外最好的风险投资生态系统和AI人才密度。然而,正如财政大臣 所说 ,“[a] misconceived view held that a few dynamic cities and a few successful industries are all a nation needs to thrive…[t]he result was a paucity of ambition for too many places, the hollowing out of our industrial strength and a tragic waste of human potential across vast swathes our country.” 现在很少有增长可以如此轻易地导向具有强大工业历史的地区,但这就是AI数据中心的机会——如果规则允许,可以将第四次工业革命带到英国的其他地区。

最后,鉴于AI系统可能在研究和开发中发挥关键作用。英国拥有世界领先的科学和技术集群,其工作可能会被AI系统彻底改变。运行支持研究和开发的AI系统——科学AI—— 将是未来几十年英国任何前沿增长的关键 ,而且不可能依赖国际数据中心市场来提供对我们未来繁荣至关重要的服务。它们需要在这里。

英国已经错过了前沿增长的机会——像Geoffrey Hinton和Demis Hassabis这样的英国科学家曾站在AI革命的前沿,现在这场革命正由少数美国公司商业化。英国即将错失最简单的增长机会——有人想要建造AI数据中心和支持它的电力。 资金想要流动 ,但我们当前的监管和规划系统的显性偏好是它不应该流动。

英国可以成为世界上建设AI数据中心及其支持电力的最佳地点

这一切都可以在短短几周内得到解决。为此,我们建议创建“特殊计算区”——提供一种替代的规划和监管审批流程,以解决当前方法的问题。它将提供 确定性、速度,因此,也提供了便宜的机会, 这是目前所缺乏的。

开发商可以获得所需电力、数据中心以及传输和网络基础设施的 单一签署点 。在这些区域内,将有 “默认同意” ——意味着建设的默认答案是“是”——并且建设许可必须在申请后三个月内受到挑战。通常,规划决策将权衡每个项目的相对优点;但在“特殊计算区”内,将决定 通过创建一个区域, 这种成本效益是预先考虑的,因此审批将取决于 “基于条件的方法” ——如果开发商能证明项目符合特定标准,就可以进行。在欧盟和西班牙有这种方法的 先例 ,那里“可再生能源加速区”使用基于条件的方法。我们在下面提供了更多实施细节。

错过这波资本投资就像错过铁路一样

在1841年至1850年间,私人投资者累计将 40%的英国GDP投入到铁路建设中 ——想象一下,如果我们的规划和监管制度阻止了这项投资和英国的快速经济增长!英国至今仍在收获这一增长时期的红利,170年后。

有时增长难以获得,但在这种情况下,增长是一种选择: 我们所需要做的就是解开束缚。

1. AI进展非常迅速

AI研究的目标是普遍智能系统

首先,澄清AI研究的目标是有用的,因为人们使用了许多不同的术语。这些术语包括人工通用智能(AGI)、人工超级智能(ASI)、人类水平的AI、强大AI和变革性AI。这些术语可能有些误导——“人类水平的AI”是指在 平均 人类水平上表现的AI系统,还是在 最聪明 的人类水平上表现的AI系统?此外,AI系统的发展是“不平衡”的,在某些方面,当前系统已经超越了最聪明的人类,但在其他方面却远远不及。

关于这些定义的争论可能会分散对最重要事情的关注:在我们尚未明确“真正的”AGI是否需要情感智能之前,可能会创造出非常强大的系统。为了避免这些陷阱,三个术语可能是有用的:

AI研究实验室的明确目标是创建一个专家科学家级别的软件程序。当DeepMind在2010年成立时,他们的使命是 “解决智能问题,然后用它来解决其他所有问题。”

AI研究人员正在朝着这个目标取得进展

在当前技术范式下,专家科学家是否可能实现尚不确定,但当前最先进的系统已经能够做到很多:

AI未来的进展方向非常不确定

虽然AI进展的历史轨迹显然非常陡峭,但很难知道这是否意味着能力的提升将继续,以及 具体 会是什么样子。最重要的是,我们没有大量的基准来评估最先进AI系统的能力。由于AI系统进步如此之快,我们的评估‘饱和’,意味着所有系统得分都高得无法区分。例如, MMLU MATH 是2020年和2021年发布的基准,专门设计以抵抗这种饱和。GPT-2在发布时在 MMLU 上得分32.4%,在 MATH 上得分6.9%,但仅仅三年后,它们接近饱和: GPT-4 在MMLU和MATH上的得分分别为86%和84%。下图显示了基准饱和的例子

11

我们用于评估科学能力的一些最佳基准—— GPQA diamond LAB-bench ——要求模型回答关于主题的多项选择题。这些问题可以精心设计,但从这些测试中得出的结论是有限的。它们表明系统在回答一组狭窄的科学问题上非常出色,但并不意味着模型能够 完成工作。 值得一提的是,AI系统显然不仅仅是多项选择机器——系统 似乎能够解决 著名的困难问题 经典电动力学 ,这可能需要研究生级别的物理学家花费数天的努力。

一种理解AI系统科学能力的方法是将研究过程分解为离散的步骤,并逐步评估每个步骤。例如,这篇论文测试了 假设生成 ,并发现,“LLM生成的想法被认为比人类专家的想法更具新颖性(p < 0.05),但在可行性上略显不足”。AI开发者以及英国和美国的安全研究所可能会维护更全面的私人分类法,以跟踪研究流程中的进展,尽管这些组织有强烈的动机不公开这些信息。

除了基准测试之外,清晰地解读进展可能会很困难,因为处于 最前沿 的人,最能看清进展方向的人,往往是对当前技术范式深信不疑的人。有时,这些研究人员被视为资本家,通过“炒作”未来的潜在能力来筹集资金或开展项目。这种看法是不完整的——毫无疑问,AI实验室中有些人确实在“销售”未来,但也有许多研究人员非常真诚地认为AI系统将具备变革性的能力。例如,Anthropic的首席AI科学家Jared Kaplan,他也是约翰霍普金斯大学的理论物理学教授, 在CERN的一次演讲中说 :“我认为在某些方面,AI系统正在接近人类水平的表现。我认为继续这一进展存在一些挑战,但我认为没有任何真正令人信服的障碍阻止AI在自动化科学方面的应用。”同样,OpenAI的联合创始人兼前“后训练”负责人John Schulman 预测 ,AI系统将在5年内与顶尖AI研究人员匹敌,而Google DeepMind的CEO Demis Hassabis 相信 ,“我们距离治愈所有疾病已经不远了”。这些说法应该以健康的怀疑和严肃的态度对待,不应被轻易否定。

这一情况因学术界的扭曲而变得更加复杂。由于AI开发者支付的薪水是学术界的10倍或更多,导致大量人才从大学流向OpenAI、Google DeepMind和Anthropic。留下的人则往往对当前技术范式持怀疑态度。

关键的结论是,迄今为止,AI能力取得了非常陡峭的进步,正如我们将在下一节中讨论的,有充分的理由相信这种进步将继续。但这种进展将如何演变,以及最终会走向何方,仍然非常不确定。然而,最乐观的情况——这是许多在前沿领域工作的人真诚持有的观点——是这可能会带来一段爆炸性的经济增长期(GDP增长约20%或更多)。 12 虽然不太可能,但在可能的范围内。

2. AI如何变得计算密集

一些突破性技术解锁了我们将潜在资源转化为有用输出的能力。蒸汽机就是这样——投入煤炭,蒸汽机可靠地将能量转化为曲轴的旋转。这有各种下游用途:移动火车车厢、驱动工厂中的滑轮或抽水。同样,在哈伯-博施法中,投入氢气和氮气,就能得到氨,可以用作肥料。使这些过程如此强大的原因在于它们的可扩展性:在蒸汽机出现之前,要运输更多的货物,需要增加更多的驮马来沿着收费公路运输货物;在哈伯-博施法出现之前,种植更多的作物意味着要派遣更多的船只前往钦查群岛收集鸟粪。通过技术,可以实现可靠的杠杆作用——可以不断增加潜在资源并获得有用的输出。

计算能力是大脑和计算机中信息处理的单位。如果我们能开发出一种技术,允许我们投入计算能力并将其转化为有用的信息处理能力,那将是非常有用的。“普通”计算机在某种程度上实现了这一点;但它是脆弱和有限的。普通计算机只能执行事先由程序指定的处理任务,而AI系统则具有学习的能力。这是AI研究正在做的一个直观理解:它正在寻找可靠且可扩展的机制——就像蒸汽机或哈伯-博施反应器一样——允许我们将处理能力转化为灵活和适应性的智能。

这并不直观。 乍一看, AI研究应该是对智能本质有深刻见解,并设计出反映这些见解的机器。计算机科学家Rich Sutton称这种认识为 “痛苦的教训” ——推动AI进步的不是研究人员的深刻理论,而是允许AI系统利用更大计算能力的一般策略。在早期的AI方法中,研究人员会 “手动编码” 他们认为AI系统应该如何学习,例如,识别图像中哪些特征以便对图片进行分类;但神经网络,现代AI的基础,允许系统通过训练过程 自行学习 哪些特征是显著的。

在训练过程中增加计算能力

神经网络就像一个小型计算机,可以通过调整一系列旋钮来编程。神经网络的目标是处理输入以预测输出。调整这些旋钮以改进预测的迭代过程称为“训练”。创建网络的人通过展示数据和答案来监督训练过程,但关键是,这不涉及告诉网络 如何 处理和理解图像。换句话说,我们通过试验和改进旋钮的调整过程,基本上是让这个小计算机自行搜索最佳编程方式以实现其目标,而不像普通计算机需要人类先找出程序然后以某种方式传达给计算机。Dario Amodei 这样描述 训练过程:

“你[AI研究人员]为他们扫清障碍。你给他们好的数据,给他们足够的操作空间,不要做愚蠢的事情,比如在数值上给他们不良的条件[即,错误地调整旋钮],他们想要学习。他们会做到的。”

你的神经网络最终会学到什么取决于你给他们追求的目标,以及你要求网络预测什么。有两种方法可以做到这一点:

  1. 直接优化特定能力。

  2. 优化 相关 目标,并希望重要的能力在下游出现。

大型语言模型是最近AI进展的基础,采用了第二种方法。语言模型被优化以预测序列中的下一个词 13 ,基于之前的词。Google DeepMind的Gemini 1.5模型能够接收 近百万个词的输入 ,以给出最细致和准确的下一个词的预测。这并不是一个 本质上 有价值的任务,就像一个神经网络被训练来预测屏幕上的一个点是肿瘤还是无害的囊肿 本质上 有用一样。

虽然预测下一个词本身并不具有内在价值,但 追求这一目标 仍然具有巨大威力。文本具有非常丰富的结构,这意味着词语并不是随机排列的:撰写者选择它们的顺序是为了传达一个想法。如果神经网络能够理解这种结构——比如,通过在训练过程中解析所有人类知识——网络就拥有了一个关于一切如何组合在一起的表示。研究人员称之为“世界模型”。

预测 是一个有意义的任务——如果网络可以将一本书的大部分作为输入,并在没有见过这本书的情况下预测结尾,那么在某种意义上,它理解了内容。 14

这些预测与现实的偏差被称为“训练损失”。模型的大小、使用的训练数据量、训练所用的计算能力(计算量)与模型的损失之间存在 极其 可预测的关系。随着模型变得更大,训练的数据更多,使用的计算量更多;其损失下降。换句话说,其预测变得更好。Amodei 指出 这些下降“有时甚至可以精确到几个有效数字,这是在物理学之外看不到的。”

这些训练损失的下降是否会转化为有用的能力则不太可预测。迄今为止,改进下一个词预测 确实 转化为有用能力的效果令人惊讶。预期这些能力,AI开发者大幅扩展了他们的模型:Google DeepMind的Gemini 1.5于2023年12月发布, 其训练使用的计算量是 2017年6月训练的最先进大型语言模型的670万倍。从 更广泛的角度来看 ,自2012年以来,用于训练最大模型的计算能力增长了1亿倍。

在模型运行时使用更多计算

到目前为止,我们只描述了在 训练过程中 投入额外计算以获得有用输出的机会。在模型使用时投入额外计算也是可取的;技术上称为“推理”。一个利用“推理时计算”的AI系统的典型例子是DeepMind的 AlphaGo 。AlphaGo被训练来玩棋盘游戏 围棋 ,或者, 具体来说 ,它被训练来从给定的棋盘状态中找到最大化胜率的下一步。系统 可能 解决这个问题的一种方法是模仿人类专家的走法。事实上,这是训练的初始方法。但更高级的学习方法是让模型与自己对弈,预测未来可能发生的走法并从中学习。这种规划也可以在模型对弈时使用。当DeepMind的系统在选择走法前被允许使用这种额外能力时,表现从1500 ELO 跃升至3000 ELO。

AlphaGo能够在推理时交换计算以获得能力的飞跃,因为围棋游戏非常适合运行某种形式的 树搜索 。它有一个非常明确的目标(赢得比赛),并且有一个相对受限的搜索空间(围棋棋盘上的潜在走法)。确定最佳下一步相对简单。

相比之下,“语言空间”并不是这样的。许多提示没有正式的“正确”回应——确定什么是“更好”更具主观性。此外,语言的“空间”比围棋棋盘上的潜在下一步大得多,尤其是当回应变得更长时。为语言设计的树搜索程序很难知道搜索的方向。因此,当ChatGPT于2022年11月发布时,它已经在5000亿个标记(可以理解为词语)上进行了训练,但它只能使用4096个标记来回应每个提示。它无法在运行时使用更多计算来生成更好的答案;它受到了限制。

这一切在2024年9月发生了变化。OpenAI发布了“o1”系列新模型,这些模型在响应提示之前会生成“思维链”。思维链使模型在回答更复杂的问题时能够使用额外的处理能力。在 o1发布博客文章 中,OpenAI展示了一张图表,表明 随着计算预算的增加 ,其在美国数学奥林匹克资格测试中的表现有所提高。

这一部分的重要结论是,AI开发者正在不断提高他们对如何利用更多计算能力来增强模型有用功能的理解。当然,目前应用额外计算的方法可能会停止产生回报,但我们很可能会在未来找到继续遵循这一模式的方法。

在当今世界,智能是稀缺而特殊的——就像蒸汽机发明前的化肥或机械动力一样。虽然听起来很奇怪,但今天创造更多智能是费力的:它仅发生在人类身上,而人类需要几十年才能成熟并接受大量教育。在不久的将来,等同于或超越人类水平的智能将仅受限于我们投入计算机芯片和电力的能力。

3. AI系统的进一步进展和部署将使用10到100吉瓦的电力

让我们从历史趋势开始。自2012年以来,用于训练最大模型的计算能力增加了一亿倍:我们是如何做到的?有一些 有利的顺风 :最先进的AI芯片的计算能力每2.3年翻一番,如下图所示;硬件的能效每3年翻一番。 15

16

然而,训练计算的增长速度超过了硬件改进的速度:自2010年以来,训练计算每六个月翻一番!语言模型的速度更快:大约每五个月翻一番,如下图所示。

17

在家使用电脑并不耗能,但AI系统所需的计算却非常耗能。NVIDIA制造的最先进芯片H100图形处理单元(GPU),其年耗电量比英国平均居民高44%! 18 下一代芯片(B200)的耗电量将增加到比英国平均居民高150%。Google DeepMind、Anthropic和OpenAI用于训练其系统的确切电量因竞争原因而保密,但Meta在2024年7月发布的最新模型报告中指出,训练其最大模型 使用了16,000个活跃的GPU 。第三方研究机构EpochAI 估计 这需要27兆瓦(MW)的装机电力容量。 19 这大约是88,000个英国家庭所需的电力供应,超过了约克的家庭数量。 20

一个有用的直观理解是,每个AI芯片的电力需求相当于一个人,或者很快会相当于一个家庭,而每个AI数据中心的电力需求相当于一个小城市。大型数据中心园区将类似于最大的城市。当然,训练当前AI系统所需的电力是相当惊人的,但陡峭的趋势线表明,这种计算能力和能量的需求很快会变得相对较小!

AI数据中心和能源需求的未来是什么?

一份由前OpenAI员工Leopold Aschenbrenner撰写的 报告 推断了当前计算能力增长的趋势线,并指出当前的增长率意味着:

这令人望而生畏。Meta用于训练其最新模型的16,000个H100,其所需电力与约克相同,与本世纪末的简单推算数字相比显得微不足道。如果这一趋势线持续,并且训练运行的长度 达到最佳 2030年最大的单一模型将需要比2021年英国整个电力生产多2.15倍的电力。 21 当然,这不是预测,仅仅是对直线延续的观察。

到目前为止,我们只描述了训练计算的趋势,而不是系统推理(即模型运行时)的趋势。如果OpenAI开发的推理时间计算范式可以进一步扩展,推理的计算强度将急剧上升。这将因模型推理的 频率 增加而加剧。随着AI系统越来越多地融入经济,推理将成为AI计算的主要形式。NVIDIA的CEO Jensen Huang 预计 推理的数量将增加‘十亿倍’(鉴于过去十年训练计算增加了一亿倍,我们认真对待这一估计!)

SemiAnalysis在2024年3月 发布 了一项估计,认为美国的‘AI数据中心关键IT电力’将从2024年的8.5GW上升到2028年的56.3GW。全球范围内,他们 预计 AI数据中心的电力需求到2026年将增加约40GW。这些趋势提供了关于当前时刻关键性的一个重要指标:这非常是建设的开始。

AI数据中心的增长受到能源可用性的限制。全球并没有40GW的备用能源容量,因此云服务提供商正在采取措施满足其电力需求。云服务提供商已经抢购了有限的备用容量,例如,Amazon购买了一座 960MW的核反应堆 ,而Microsoft则与Constellation Energy签署了一项20年的电力购买协议,以重新开放 三里岛的836MW反应堆 SemiAnalysis 报告 “[T]he search for power is so dire, X.AI is even converting an old factory in Memphis Tennessee into a datacenter due to the lack of other options.” 作为建设强度的一个指标:为了为这个数据中心创造电力供应,x.ai…

“[P]ut a bunch of mobile [natural gas] generators usually reserved for natural disasters outside, add[ed] a Tesla battery pack, [drove] as much power as we can from the grid, tap[ped] the natural gas line that's going to the natural gas plant two miles away, the gigawatt natural gas plant…[and got] a cluster built as fast as possible."

html

这个项目在19天内完成,尽管构建一个10万GPU的集群通常需要一年时间。(通常成本为10亿美元,但他们愿意花费40到50亿美元。)

为了推动进一步增长,云服务提供商正在推动新型能源资产的建设。Oracle已经获得了 建造三个小型模块化反应堆(SMR)的许可 ,而Google宣布了一项合作,将为其数据中心提供七个SMR,预计从2030年开始提供500兆瓦的电力。Amazon则与Dominion Energy合作,计划为数据中心建造SMR。最具雄心的是,OpenAI向拜登政府提出请求,希望在美国各地建设五到七个5GW的数据中心园区。

大科技公司在AI基础设施上的资本支出(更不用说在能源生成资产上的支出)很难从其财报中分离出来。 有估计表明 ,大科技公司将在2024年花费超过1000亿美元用于AI基础设施,而SemiAnalysis估计Microsoft将单独花费超过500亿美元。未来资本支出的估计从数千亿美元到 九万亿美元 不等。

正如AI领域的许多事情一样,这一切都不确定,但可能会很大。

4. 英国将使用核能而非风能和太阳能为AI数据中心供电

我们调查了哪种电力生成方式最适合英国的AI数据中心,以确定改革的重点。我们比较了两种低碳能源——核能,或风能、太阳能、电池备份和天然气储备的混合。我们没有考虑完全使用天然气为AI数据中心供电的可能性,因为我们认为这与减排目标不符,尽管这是一种潜在的方法。

需要注意的是,AI数据中心不仅需要大量电力,还需要极其可靠的电力。数据中心需要高正常运行时间——其服务水平协议通常规定“99.999%的可靠性”,这意味着数据中心在一年内的停机时间只能有5分钟15秒。这实际上要求电力不能中断,正如 这份报告 指出的那样,“即使是25毫秒的电力中断也可能导致整个数据中心停机数小时甚至数天。”

AI数据中心需要可靠性的主要原因有两个:

  1. 当前训练大型模型的技术体系需要计算资源之间的同步。如果AI数据中心在训练步骤中断线,将会扰乱整个训练过程。

  2. 其次,尽管GPU的电力密集度很高,电力仅占“总拥有成本”的一小部分:每月的GPU服务器托管成本仅为1872美元,而服务器资本成本为7026美元。因此,让GPU闲置比建立冗余更昂贵。

可再生能源、电池和天然气的混合方案成本高昂,污染严重且占地面积大。

要考虑最佳混合方案的运作方式;理解权衡是有意义的。首先,风能和太阳能高度间歇性,因此要获得稳定的输出,需要建造比简单估算更多的设施。(一个1GW的太阳能电站实际上只有在夏季最强烈的时刻才能提供1GW,大多数时候会低于这个值。)其次,因为有时风大而不阳光明媚,有时阳光明媚而无风,我们说风能和太阳能具有协方差,因此在混合中总是有价值的。太阳能和风能成本相当,因此成本不是选择哪种的主要决定因素。

一天中会有既不阳光明媚也无风的时刻。为此需要使用电池。这并不能完全解决问题,因为有时会有一周的低风速和多云天气,虽然可以通过建立完整的电池备份来解决,但这会变得极其昂贵。电池在被频繁使用时(大约每四小时)具有成本竞争力,但闲置时成本高昂,因此电池在夜间使用效率高,但长时间使用不切实际。在风速低和多云的长时间内,需要使用天然气备份。

我们估计,为了以成本最小化的方式使用太阳能、风能、电池和天然气的混合;每1GW的稳定输出需要8GW的太阳能电池板,0.37GW的风能,12GWh的电池备份,完整的天然气备份,以及451百万立方米的液化天然气进口能力。(我们的方法包含在 技术附录 中。)

这带来了许多挑战:

  1. 土地使用。 建造8GW的太阳能和0.37GW的风能容量需要160平方公里和41平方公里的土地。(我们假设风能在陆上,因为海上成本更难预测,且将能量传回陆地更困难)。这意味着 每个千兆瓦 需要超过200平方公里的连续土地。作为参考,卡迪夫市面积为140平方公里,雷丁市为40平方公里。这种规模扩展性很差。一些数据中心园区远大于一个千兆瓦,例如,想象一下 Microsoft和OpenAI的5GW数据中心园区 在英国由可再生能源供电,将需要超过1000平方公里的连续土地。

  2. 土地需要靠近液化天然气进口能力。 英国有三个液化天然气进口终端,一个在肯特,两个在南威尔士。天然气发电终端需要远离人口中心以减少空气污染,但也要足够靠近进口终端以避免需要天然气管道。要么需要找到方法在肯特或南威尔士建造这些发电设施 同时与 太阳能和风能农场相邻,要么可能需要建造一个新的液化天然气进口终端,但这两种方法都不具备良好的扩展性,后者会大幅增加成本。

  3. 排放。 由于天然气将产生28%的电力,在其预期生命周期内,可再生能源混合方案将比等效的核能容量产生多40%的碳排放。

  4. 成本。 平准化成本将为106英镑/兆瓦时。这在国际上对于创建AI数据中心来说没有竞争力——在德克萨斯州以相同碳足迹生产能源的等效成本为74英镑/兆瓦时。如果希望进一步减少排放,输出电力将变得更加不具竞争力。

  5. 安全性。 即使天然气仅使用28%的时间,与核能相比,这种混合方案导致的“预期死亡”每太瓦时多27倍(主要来自空气污染)。

提醒一下,这些数字是针对1GW的稳定输出,而全球数据中心的建设预计到2026年将达到约40GW。 22 预计未来几年电力需求将达到数十千兆瓦。可再生能源方案将无法扩展到这一水平,也无法为最大的数据中心园区提供所需的电力集中度。

核能更适合,因为它可靠且安全

与风能和太阳能相反,核能输出非常稳定,非常适合满足数据中心的“99.999%”可靠性要求。 23 美国的核能 容量因子为92.5% ,作为一个基准。下图显示了去年三月美国一周的总能量生成;注意核能是底部的绿色块——极其稳定!

24

此外,国际社会已经意识到核能是安全、清洁且必要的,以实现气候目标。在COP 28会议上,包括美国和英国在内的20个国家 宣布计划到2050年将全球核能容量增加三倍 。世界上最大的投资银行 宣布计划为这一目标提供资金 意大利 印度 宣布加速核电站建设计划,而 日本则计划重启13座核反应堆 。此后,美国表示将 到2050年增加200吉瓦的核电

核能的负面印象主要来自于其与核武器的关联,以及罕见但显著的反应堆熔毁事件和随后的疏散。普里皮亚季的摩天轮和空荡荡的游泳池对我们集体的核能安全心理产生了显著影响,但我们对1975年造成17.1万人死亡的板桥水库溃坝事件却没有类似的联想。

与其他能源来源相比,尤其是实际稳定的发电替代方案,核能在每太瓦时的发电量上相对更安全和清洁。

25

历史上有三次高调的反应堆熔毁事件:三里岛(1979年)、切尔诺贝利(1986年)和福岛(2011年)。三里岛的熔毁事件没有直接或间接导致任何死亡,居住在新泽西工厂附近的220万人所受到的辐射剂量“与从纽约飞往洛杉矶的辐射剂量大致相同”。 26

html

独立研究机构“我们的世界数据”对切尔诺贝利和福岛的死亡人数进行了 审查 。他们的文献综述估计,切尔诺贝利事故导致了300到500人死亡,其中30人为直接死亡,其余为间接死亡。2011年福岛事故中没有直接死亡。事故导致40到50人受伤,事故发生7年后,有报告称一名工人因辐射暴露导致的肺癌死亡。然而,大规模的撤离估计导致了2313人死亡,这些死亡是由于撤离(尤其是从护理院等地方)带来的身体或精神压力所致。要区分这些死亡中哪些是由于核事故后的撤离,哪些是由于地震和海啸的更广泛影响,实属不易。

人们对化石燃料和核能的态度存在明显的不一致。与核能不同,化石燃料正在持续且逐渐地降低数十亿人的预期寿命,但从未有一个明确的时刻让人们感受到这种影响。 这份报告 指出,“搬到东京会使人口的死亡风险增加三倍[因为空气污染],相比之下,搬回福岛剩余的禁区则不会。” 这篇论文 估计,切尔诺贝利事故后核电建设的放缓导致英国损失了3300万预期寿命年,约相当于40万人,因为颗粒物中毒。

总而言之,英国将无法为AI数据中心生产具有成本竞争力的可再生能源,无法扩展到所需的数十吉瓦。然而,核能具备所有必要的属性——它更清洁、更安全、发电更可靠——正如我们在 进一步讨论中 提到的,它也可能在国际上具有成本竞争力。

5. 没有AI数据中心将是一个错误

一种怀疑的观点可能会说,虽然AI进步正在发生;AI数据中心和电力将大幅增长;核能将成为主要能源;但这并不一定意味着英国应该关注托管AI数据中心。最强烈的这种观点认为:经济历史的模式是,通用技术的收益往往来自于采用,或许英国居民和企业可以通过国际购买AI数据中心的访问权,而英国可以专注于AI价值链的“最高价值”部分。

这种观点是不够的——没有AI数据中心将是一个错误。英国可以坐在价值链顶端,并选择性地参与“高价值”行业的经济学说,导致了工业的空心化,使英国没有增长。托管AI数据中心将增强英国的经济安全,允许在前工业区进行定向增长,并促进未来的前沿增长。

英国的大部分资本存量将存在于AI数据中心

计算能力很可能成为商品和服务生产的关键投入,类似于能源。正如风险投资家Marc Andreessen在2011年所说,“软件正在吞噬世界”,AI系统的信息处理能力将紧密融入所有现有和未来的业务流程。这对于英国的专业服务出口尤其如此。因此,英国的大部分资本存量将被创建、存储和运行在,或至少依赖于AI数据中心。英国希望这些AI数据中心在这里,而不是在海外,通过海底电缆连接,以确保能够保护这些资产。

此外, 正因为 AI的收益来自于采用,英国需要确保获得计算能力。随着全球对计算能力的需求上升,可能会出现英国企业无法获得所需计算能力的情况。目前,Microsoft的CFO在 最近的财报电话会议 上表示,他们的云业务收入增长了33%,但“[d]emand continues to be higher than our available capacity.”

几十年来,英国决定不追求能源自给自足。重复同样的错误以计算能力是不明智的。

将增长引导至前工业区

采用和开发AI应用的工作可能会集中在伦敦。 政府的AI行业研究 显示,75%的英国AI公司位于伦敦、东南部或东英格兰。AI应用开发者可能会在这里聚集,因为伦敦拥有除旧金山外最好的风险投资生态系统和AI人才密度。此外,AI系统的采用可能会首先集中在专业服务领域和科学研究的业务流程自动化上,这也可能在“金三角”内开始。

AI数据中心不依赖于网络聚集。其建设和运营可以更容易地被引导到金三角以外具有强大工业传统的地区。很少有投资机会是与地点无关的。核能和数据中心建设和运营行业可以创造数千个技术工作岗位。

此外,发展这些行业会带来溢出效应。英国工人将学习如何从韩国电力公司建造核反应堆,该公司以25%的价格建造反应堆;或从Google学习如何以1.1的电源使用效率建造AI数据中心。

如果英国想参与未来的前沿增长

英国在科学方面具有巨大的优势,通过其世界领先的大学和研究机构。研究和开发的过程可能会在未来几年被AI系统转变,因此保持英国的科学优势及其提供的未来增长前景可能需要将AI系统差异化地整合到研究周期中。未来的英国增长很可能来自于AI支持的科学发现,例如未来版本的AlphaFold的新药发现。在这种情况下,计算能力将是一个关键投入——仅依赖国际市场来获取如此重要的资源是不明智的。

简单来说,AI数据中心是一个不对称的赌注——如果AI“牛市”是正确的,那么英国拥有数据中心对于未来的增长和安全至关重要,扩展其计算行业至关重要。如果“AI熊市”被证明是正确的,AI系统的推出将是一个多年代的通用技术整合,因此运营AI基础设施将提供就业机会和公共服务的税收收入;以及在英国建造廉价发电设施的溢出效应。由于私人投资者提供资本,创造条件让他们投资并没有消耗稀缺资源。决定追求AI数据中心和核能发电的门槛很低,因为英国迫切需要增长。

6. 核能建设缓慢且昂贵,但可以更便宜和更快

英国的核能建设 非常 缓慢且昂贵。 27 目前,没有私人投资者会选择在英国建造核电站来为AI数据中心供电。然而,有大量的低垂果实可以摘取,以在国际上具有竞争力。

在本节中,我们诊断了高成本的原因,并在 后续章节 中,我们提出了基于此诊断的改革方案。

背景介绍:

如果能以低利率借款,核能的总成本将减半

理解核能项目最重要的一点是,资本成本主导了项目的总体成本。利息约占欣克利角C成本的 三分之二 31 这份报告 估计了欣克利角C成本的分解如下:

电力成本对建设借贷成本非常敏感:国际能源署在2020年的一份报告中使用了法国的一个原型EPR-1600,指出当资本成本从10%降至3%时,能源的平准化价格降低了超过一半(53%)。 32

这对我们的目的有何影响?有两个启示:

  1. 速度很重要 ;不仅因为可以开始发电,还因为这意味着可以停止借贷。

  2. 确定性很重要 ;当投资者认为项目风险较低时,他们会以更低的成本提供资金。 这份报告 称EDF预计在欣克利角C的资本回报率为9%。

任何对规划和监管的改革不仅通过简化直接节省资金,还通过减少项目风险和时间表,从而间接节省利息支付。

通过“成批”建造反应堆可以再次将建设成本减半

韩国能够以低成本建造核电,因为它“成批”建造反应堆,即重复相同的反应堆设计8到12次。这种重复创造了项目之间的 “学习” 。(学习描述了由之前经验驱动的成本下降)。最明显的学习例子是更好地执行技术任务。由于核电站项目规模庞大,这些收益甚至在项目内部也存在:EDF声称在欣克利角C的第二个反应堆的焊接速度是 前者的两倍。 但同样重要的学习类型来自开发商了解监管者的需求—— 建设 只是启动核反应堆活动的一小部分,很多精力花在质量保证和安全上。当一个反应堆被多次重复时,监管者和开发商之间的相互理解会在项目之间转移。

成批建造还支持 供应链的确定性 。核电供应链需要比普通工业项目更高的质量保证标准和更严格的组件测试,这通常需要一个单独的供应链。如果有大量已获批准的反应堆要建造,核电供应链可以生产组件而无需指定具体反应堆。同样适用于 技能供应链 。当有明确的建设项目管道时,投入时间成为核焊工是一个明智的职业选择,因为这将长期提高工资。

英国的做法与成批建造相反。 英国最后一个完成的核项目是1995年的Sizewell B。这是一个压水反应堆,直到21年后才开始建设下一个核反应堆欣克利角C。这是一个不同的设计,EPR-1600。正如我们所指出的,这一基本反应堆设计之前在法国和芬兰使用过,然而EDF 表示 英国核监管办公室(ONR)要求 7000项设计更改 ,包括增加25%的混凝土和35%的钢材,以便在英国获得批准。ONR 对此表示异议 ,但无论责任在谁,当反应堆变得越来越 不相似 时,从先前地点转移学习就变得更加困难。

低水平的监管确定性和没有明确的独特反应堆先例的结合,意味着供应链可能没有信心在最终建设决策做出之前准备组件。同样,由于项目之间的巨大间隔,“技能供应链”较弱:工人发展核项目所需技能的动机较低,并转向其他职业。例如,Sizewell C的批准延迟意味着核焊工将无法直接从欣克利角C过渡到新项目。

核审批过程是 否决制 ——系统中没有积极力量来抵制时间延误和成本增加。

导致核项目缓慢且昂贵的下一个最大因素是国家审批责任的分散。要批准一个新的核电站:

ONR是一个独立的法定机构,负责核裂变安全。这意味着其任务和责任是防止可能由核电站引起的事故。ONR没有权力或责任去权衡不建核电的反事实风险:例如,自切尔诺贝利事件后核电站建设放缓以来,英国因空气污染而损失的约 3300万生命年 ,或持续的温室气体排放造成的环境损害,或 高能源价格对人们 或企业的影响,或任何其他挑战。

ONR的激励和责任是将核事故风险降到最低。全球安全监管标准,要求在英国的所有行业中,电离辐射暴露的风险要“尽可能低”(注意:在某些情况下,这可能是“尽可能合理地低”)。由于ONR没有设定平衡目标,这种合理性被定义为任何可以提高反应堆安全性的措施,直到某项措施被证明是“严重不成比例的”。

同样,冗长且不确定的环境影响评估(EIA)的后果也未被考虑。Sizewell C 的 EIA 有 44,260 页 ;而 Hinkley Point C 的则有 31,401 页。EIA 的问题并非核电独有,因此我们将这些问题留给其他来源。然而, Sam Dumitriu 的一份报告 声称,EDF 在 Hinkley Point C 花费了“数亿英镑”安装水下扬声器,以阻止大约 112 条鱼进入水冷系统。

与英国不同,在韩国,核安全与安保委员会直接向总理报告。 34 这份报告 表明,政治监督改变了监管者的激励平衡,更适当地平衡了增量安全法规的成本和收益。尽管 ONR 是独立的,但它也是工作和养老金部的一个公共公司,因此部长对核电建设的兴趣或精力较少。

‘监管正当性’被误用

‘监管正当性’是源于 1996 年欧盟指令的要求,规定用于能源生产的电离辐射的收益必须大于成本。这在原则上似乎不是一个坏主意—— 支持 在成本超过收益的情况下使用电离辐射?然而,该要求适用于每个‘实践’,即电离辐射使用的实例。目前的解释是 每个反应堆设计 都是一个独立的实践,必须单独评估其监管正当性。有充分的法律论据认为,核电或使用低浓缩铀和轻水作为冷却剂和慢化剂等广泛特征应被视为单一实践,其‘监管正当性’应一次性确立。

由于‘功能分离’,该决定的权力属于环境、食品和农村事务部,决策需要两年时间。这是重复的,因为规划过程的目的是权衡新项目的相对优劣。法国、芬兰和瑞典将‘监管正当性’纳入其规划决策中。

这一多余的步骤增加了项目的不确定性和持续时间,因此通过导致更长和更有风险的借贷来提高项目的总成本。

总之,系统中有许多可以说‘不’的参与者,或者可能增加核电厂建设的增量延迟和成本增加,这相当于 事实上的 ‘不’;但没有积极的力量来抵制缓慢、昂贵以及两者的反事实损害。通过一种权衡成本和收益的方法,包括对速度和确定性的连锁影响,英国可以建立一个具有国际竞争力的核电规划和监管制度。

7. 英国应创建‘特殊计算区’

这一改革提案的目的是解决一个不一致之处:

以下是我们关于如何解决这一问题的提案。

在‘特殊计算区’内,核反应堆、AI 数据中心及其所需的传输和网络基础设施有一个替代的规划和监管审批过程。目标是提供 确定性、速度,因此有机会变得便宜 ,使英国成为世界上建设 AI 数据中心最具竞争力的地方。

在这些区域内,将有‘视为同意’——意味着建设的默认答案是‘是’——并且必须在申请后三个月内对建设提出异议。通常,规划决策会权衡每个项目的相对优劣;但在‘特殊计算区’内,将决定 通过创建一个区域, 这一成本效益已经被考虑,因此审批将取决于‘基于条件的方法’。这意味着如果开发商能证明项目符合特定标准,就可以继续进行。西班牙和欧盟有地点政策的先例。 35 在西班牙,政府通过了一项法令,允许可再生能源项目在满足某些 条件 的情况下免于环境影响评估:

这份报告 指出,这一变化使项目速度加倍,并将 2030 年太阳能建设的预测增加了 13GW。 36

欧盟已于 2023 年 9 月要求成员国在 2026 年 2 月之前至少指定一个“可再生加速区”。为实施这些区域,成员国 准备 ,“一个缓解‘规则手册’,其中包含在特定区域采取的缓解措施规则,旨在避免或在不可能的情况下显著减少项目安装在这些区域所产生的环境影响。”

科学、信息和技术部的国务卿将能够 提供单一签署 以批准项目。这意味着核电、AI 数据中心以及网络和传输基础设施将 一起 获得批准,以提高项目的确定性。与可再生能源区一样,开发商将向国务卿申请,国务卿将有三个月的时间对建设申请提出异议,否则项目将自动获得许可。这使政府的激励与快速响应申请保持一致,因为开发同意令的平均考虑期为 22 个月。 37 此外,非异议程序,而不是对每个地点的积极决定,降低了司法审查的风险。司法审查程序可能会使建设延迟大约两年;因此开发商可能希望明确一切可能的措施已被采取以避免司法审查。为了进一步降低司法审查的风险,特殊计算区的主要立法可以:

一个需要进一步调查的领域是,是否所有的申请过程都需要在建设开始前前置,或者是否可以并行化。例如,一些环境许可和缓解(即处理工厂运营的环境影响)可能与建设同时进行,但需满足工厂不能开始运营直到这些问题得到解决的条件。国际上对此有先例:美国的核电开发商可以选择通过《美国联邦法规》第 50 部分许可其反应堆,该部分授予他们单独的建设和运营许可证。(通常开发商使用第 52 部分,该部分同时授予建设和运营许可证。)开发商在未获得运营许可证的情况下开始建设时承担了一些风险。

“特殊计算区”需要允许核电运营商与数据中心运营商签订‘表计后’电力购买协议。电网网络费用占电网电力成本的 20-25%,因此有必要使英国成为一个具有竞争力的建设地点。

如何指定这些区域?

特殊计算区的主要立法可以指定 所有 前核电、煤炭和天然气发电厂址、前钢铁厂和港口为特殊计算区,并赋予国务卿取消指定或指定个别地点或类别的权力。主要立法需要指定足够广泛的 地点类别 以避免成为混合法案。这是因为混合法案的议会程序要长得多,因此需要更长的时间才能通过,这将使英国更难参与建设 AI 数据中心。通过主要立法将所有这些类别指定为特殊计算区,并赋予国务卿反对和取消指定的权力,司法审查的风险比国务卿必须决定指定每个特定地点要低得多。这反过来意味着更有可能建设 AI 数据中心。

国务卿还应被赋予权力,根据高水平环境评估确定每个区域适用的环境条件,以提供环境保护。根据该法案,符合这些条件将成为取消 EIA 需求的依据。

前能源生产和钢铁生产地点特别适合成为特殊计算区,因为它们有电网连接,并且以前的环境影响可能等于甚至大于核电厂运营。这提高了简化监管和规划过程的便利性和论据的力度。港口适合常规核电,因为通过船舶将材料运送到现场比其他地点要容易得多。例如,在 Hinkley Point C,需要建造码头以减少卡车的数量。

可能还有其他规划和监管审批的选项,值得作为替代途径纳入,尽管它们不太可能在上述提案所需的时间框架内交付结果。例如,地方规划当局可以为新核电和数据中心授予同意,前提是申请符合特殊计算区要求的条件。为了激励地方政府允许更多的电力和数据中心,他们可能被允许永久保留 100% 的商业税率 ,用于通过此机制批准的项目。

条件应该是什么?

为了适用视为同意,反应堆必须获得公认的国际监管机构(即美国或欧盟)的批准。引入国际认可将加快审批和建设速度。 38 实际上,国际认可将允许已经建造过反应堆舰队的国际团队来到英国,提升当地工人的技能,并复制他们以前的工作,利用他们在工作中学到的经验节省成本。

工人和公众的辐射剂量暴露条件可以取自 2017 年电离辐射条例

html

一些条件将涉及施工和运营的环境影响,以简化和替代环境许可和影响评估,并可能包括要求开发商支付到重野化基金的选项。这将确保环境影响得到解决,而不会造成不确定性和昂贵的延误。

一些条件将解决通常在核电站许可证中处理的问题。例如,应对技术故障和场地周围人口密度的紧急规划有要求。

关键是,这些条件应在传统核电和小型模块化反应堆(SMR)之间有所不同。例如,安全要求应与电厂的规模相称。

我们应该如何处理“监管正当性”?

由于监管正当性是欧盟指令,因此需要将其纳入规划决策中,按照法国、芬兰和瑞典的方法,或者可以通过第9条规定的决定来宣布所有类别的核电为新的正当实践,或通过第12条规定的决定来声明核能是一种现有实践,因为在指令引入之前已经有Magnox、先进气体反应堆和Sizewell B的运行。

技术附录

该模型解决了太阳能、风能和天然气的最佳组合,以最小化电力的平准化批发成本。 39 该模型生成了100组可能的365天的太阳能和风能输出,并在4000种可能的太阳能、风能和电池输出组合中优化选择。

太阳能

太阳能在模型中有两个变异来源——一个是由月平均输出变化引起的,另一个是由云层覆盖和类似因素引起的日变化。平均输出因北半球在冬季倾斜远离太阳而变化——这不仅通过三角学直接减少了入射量,还通过迫使阳光在到达地球表面之前穿过更厚的空气间接减少了入射量。因此,12月的平均太阳能输出比夏季低 72% ——这一效应远大于温度变化所暗示的,因为空气可以在地球上移动。云层覆盖也会减少输出,使日变化遵循 伽玛分布 ,形状参数为3.5。在英国,太阳能的容量因子为 10% ,平准化成本为 £49/MWh ,1GW 占地 20平方公里。在德克萨斯,平准化成本范围为 $24到$96 ,中心估计为$46/MWh。德克萨斯的太阳能输出波动性较小,冬季仅下降 40%

风能

风能的输出因风速的变化而变化,这种变化发生在日和季节之间。冬季,英国的风速比夏季高 25% ,使其具有与太阳能弱负相关的有利特性。然而,风中储存的能量随风速的立方增长,因为每个分子的动能随风速的平方增长,并且随着风速的增加,每秒撞击涡轮叶片的空气分子线性增加。尽管风力发电在实践中会遇到收益递减并最终在风速中减少功率输出,但在英国的大部分风速分布中,我们仍处于立方——因此高度波动——的部分。这被基础分布的高波动性所加剧—— 瑞利分布 ,其标准差为平均值的一半。在英国,风能的容量因子为 27% ,平准化价格为 £53/MWh ,1GW的风能 占地 110平方公里。成本范围为 $24到$75 ,意味着中心估计为£38/MWh。

电池

电池提供了平滑可变输出过程的能力,并提供数据中心高效运行所需的恒定电力流。此外,由于它们主要在夏季使用,太阳能在一天中的扩展仍然只需要12GWh来实现连续运行。然而,它们仍然在参与超过一天的时间尺度的平衡方面过于昂贵,并且通常仍然只能以与放电相同的速率充电——这意味着跨季节的可再生能源过剩发电很难利用。现有的电网规模储能价格为 $400/MWh ,至少可以持续 2000个周期

天然气

天然气的平准化价格为 £136/MWh ,其中一半以上是碳定价。容量因子接近100%,与可再生能源相比,占地面积非常小。在德克萨斯,成本为 $39-$68 ,中心估计为£41。

结果

在最佳分配中,采购了8GW的太阳能和0.4GW的风能,成本为£106/MWh,其中28%的电力由天然气发电。如果在可再生能源过剩期间以£30/MWh的价格出售给电网(可能过高,因为这是全国相关的),那么最佳太阳能数量增加到12GW,最佳风能数量保持不变为0.4GW,碳强度下降到0.17GW,平准化成本下降到£98/MWh。由于之前的分配仅浪费了18%的总输出作为可再生能源的削减,因此在没有通过补贴引发的销售保证价格的情况下,这导致价格变化很小。考虑到电网连接当然需要建设和维护,这使得其提供不太可能降低整体成本。每GW年预期死亡人数为7.06。德克萨斯的最便宜的等效排放选项成本为£74/MWh,由0.7GW的风能和4.7GW的太阳能组成。如果德克萨斯面临与英国天然气相同的碳定价,成本仍然大大低于£89/MWh。

1

这与“普通”计算不同,后者只能精确和具体地执行其程序(信息处理的预设指令)告诉它的操作。相反,AI系统更像大脑,能够学习并具有灵活和适应性的信息处理能力。

2

95.6%的原始百分比得分 通常会落在LSAT表现的第99百分位。

3

英国居民的年均能耗为4266kWh,而H100芯片每年将使用6132kWh。下一代B200芯片在一年内(假设持续运行)将使用10512kWh。

4

OfGem的中型家庭每年使用2700kWh的电力,那么27MW的装机容量为87600户家庭。

5

2021年,英国生产了310TWh的电力,100GW的发电运行9.12个月将产生665.18TWh的电力。

6

在一年中,一个1GW的数据中心将使用8760GWh的电力,但在工业和家庭需求中,利物浦在2022年仅使用了1696GWh。

7

卡迪夫和雷丁的 来源 面积

8

2012年,CfD为£92.50/MWh,自那时以来通货膨胀率为 54.5% ,意味着2024年的价格为£142.83/MWh。

9

可能包括用于创建更好AI系统的科学研究,尽管探索这种可能性的细节超出了本报告的范围。

10

超级智能的定义必然较弱,因为我们对这种系统的外观不太确定。

11

https://ourworldindata.org/grapher/test-scores-ai-capabilities-relative-human-performance

12

这篇论文 回顾了支持和反对的论点,而 这份报告 由一位前OpenAI员工撰写,论述了AI系统将很快具备支持爆炸性增长的能力,同时指出了潜在的瓶颈。

13

从技术上讲,语言模型被训练来预测称为“标记”的“子词单元”,因此这一任务有时被称为“下一个标记预测”。

14

关于神经网络的预测是否构成“真正的”理解,这是一个常见的讨论点。鉴于模型已经具备的巨大下游能力, 如前所述 ,我们认为很明显模型内部正在发生重要的事情,而语义争论往往会分散对如何将强大系统整合到社会中的更紧迫问题的关注。

15

值得注意的是,提高硬件的能量和计算效率将进一步增加对硬件的需求。这是一个 杰文斯悖论 。(效率通常意味着 减少 ,但在这种情况下并非如此。)

16

https://epochai.org/blog/trends-in-machine-learning-hardware

17

https://epochai.org/blog/training-compute-of-frontier-ai-models-grows-by-4-5x-per-year#language-models-caught-up-to-the-frontier-around-2020

18

英国居民的年均能耗为4266千瓦时,而一块H100芯片在一年内(假设持续运行)将消耗6132千瓦时;一块B200芯片将消耗10512千瓦时。

19

https://epochai.org/blog/can-ai-scaling-continue-through-2030#the-current-trend-of-ai-power-demand

20

根据 最近的人口普查 ,约克有85492户家庭。

21

背景:英国在2021年生产了310太瓦时的电力,而100吉瓦的发电量运行9.12个月将生产665.18太瓦时的电力。

22

根据 这份SemiAnalysis报告 ,2026年至2027年以及2027年至2028年“AI数据中心关键IT电力”的增长率分别为46.9%和36.2%。

23

根据运营实践的不同存在一些变动——根据 这篇文章 ,“韩国的工厂因计划外停机而失去产能的可能性比英国工厂低五倍”。

24

https://www.visualcapitalist.com/how-does-u-s-electricity-generation-change-over-one-week/

25

https://ourworldindata.org/safest-sources-of-energy

26

为什么核能一直是个失败,https://gordianknotbook.com/,第171页;通过 这个来源

27

本节借鉴了英国重塑(Britain Remade)智库的工作,该智库致力于经济增长。我们感谢他们在核能建设方面的高质量工作,这为本提案提供了很多信息,我们会在适当的地方链接到他们的工作。

28

请注意,EDF正在为建设支付费用,而不是纳税人。政府与EDF达成了一项差价合约(CfD),以2012年的价格提供每兆瓦时92.50英镑的能源。

29

基础设施成本:核能版英国曾在核能领域领先世界。这是一个分裂原子的国家,建造了世界上第一个全规模核电站,随后在接下来的十年中又建造了九个。当卡尔德大厅开放时,枢密院大臣理查德·巴特勒指出:“可能在1965年之后,每个新建的发电站都将是一个……阅读全文一年前 · 24个赞 · 8条评论 · Sam Dumitriu和Ben Hopkinson

30

Wylfa、Moorside和Oldbury。

31

EDF没有公开的详细成本分解,但国际能源署在2020年发布了一份报告,称建造欧洲压水反应堆(Hinkley Point C使用的反应堆)的隔夜资本成本(即不包括利息)为2018年美元4013美元/千瓦。按2018年英镑汇率( 1:0.75 )兑换,并调整为2024年价格( 26%通胀 ),意味着每个反应堆的隔夜资本成本为2024年英镑6.26亿英镑。 项目总成本 调整通胀 为2024年英镑413.1亿至453.1亿英镑。这表明资本成本的69.7%至72.3%是利息。与专家的对话表明,这与其他估计一致,尽管可能在较高端。

32

https://iea.blob.core.windows.net/assets/ae17da3d-e8a5-4163-a3ec-2e6fb0b5677d/Projected-Costs-of-Generating-Electricity-2020.pdf , 第59页

33

自然资源威尔士、苏格兰环境保护署或北爱尔兰环境署。

34

韩国的国家组织与英国不同;总统在行政管理中发挥积极作用。

35

感谢Sam Dumitriu在他的Substack上 强调了这一点

36

彭博新能源财经的2030年太阳能预测从2022年4月的73吉瓦提高到2022年10月的86吉瓦。

37

再次感谢 Sam Dumitriu 在他的 Substack 上 强调了这一点

38

再次感谢 Sam Dumitriu 在他的 Substack 上 强调了这一点

39

这隐含地假设了仅发生热电联产,因为这可以忽略运输成本——这意味着风能被认为是完全在陆上而非海上。

文章来源:Getting AI datacentres in the UK

关键问题与行动计划

关键问题 1: 如何在英国推动AI数据中心的建设以满足日益增长的计算需求?

行动计划:

  1. 制定“特殊计算区”政策:研究团队将撰写详细的政策建议,提出在特定区域内简化AI数据中心和核电站的规划和审批流程,以加快建设速度并降低成本。
  2. 进行利益相关者咨询:数据团队将收集和分析来自政府、能源公司和AI开发者的反馈,以确保政策建议能够满足各方需求并获得广泛支持。

关键问题 2: 如何评估核能在支持AI数据中心方面的经济性和可行性?

行动计划:

  1. 进行成本效益分析:研究团队将对比核能与其他可再生能源(如风能和太阳能)在满足AI数据中心电力需求方面的成本和环境影响,形成详细报告。
  2. 开展市场调研:数据团队将调查全球范围内核能项目的成功案例,分析其建设和运营成本,以为英国的核能发展提供参考。

关键问题 3: 如何吸引投资者在英国建设AI数据中心和相关基础设施?

行动计划:

  1. 制定投资激励政策:研究团队将提出一系列税收优惠和补贴政策,以吸引国内外投资者在英国建设AI数据中心。
  2. 组织投资者峰会:数据团队将策划并组织一次专门针对AI数据中心投资的峰会,邀请潜在投资者、政府官员和行业专家进行交流,展示英国在AI基础设施建设方面的潜力和机会。

请告诉我们你对此篇总结的改进建议,如存在内容不相关、低质、重复或评分不准确,我们会对其进行分析修正