编者按:本文来自微信公众号 半导体产业纵横(ID:ICViews),作者:米乐,创业邦经授权转载。
人工智能(AI)已成为主流。随着 OpenAI 的 ChatGPT 等解决方案的推出,在一夜之间赢得了数亿用户,人工智能模型也不再在后台“低调”工作。相反,它已经占据了舞台的中心。
没有数据中心,AI产业就无法正常发展。如今的AI数据中心,真香了吗?
01下一个爆火的风口
数据中心是用于在网络上传递、加速、展示、计算和存储数据信息的物理场所,主要应用于对数据计算和储存有较大需求的组织。一个完整的数据中心由数据中心IT设备和数据中心基础设施构成。
数据中心IT设备主要包括连接器(光纤、光模块)、网络设备(交换机、路由器)、算力设备(服务器)、存储设备(存储器)等。数据中心基础设施是支撑数据中心正常运行的各类系统的统称,主要包括供配电设备(UPS、蓄电池、柴油发电机、配电单元)、温控设备(冷源设备、机房空调、新风系统)等。
从根本上说,人工智能和机器学习算法非常擅长发现数据集中的模式。然后,他们将学到的知识应用到未来的任务中——自动化和简化许多日常操作,这称为预测分析。
近年来,数据中心运营商纷纷采用人工智能来帮助简化服务的日常运行。在最近的一项调查中,57% 的数据中心所有者表示他们会信任人工智能模型来做出运营决策,这一数字比上一年增加了近 20%。
以超大规模运营商的大型数据中心数量角度来看,随着行业集中度的逐步提升,全球超大型数据中心数量总体增长。据Synergy Research Group的最新数据,截至2021年超大规模提供商运营的大型数据中心总数增加到700个左右,较2020年同比增长17.25%。根据Synergy Research Group最新预测,凭借目前已知的314个未来新超大规模数据中心的规划,运营数据中心的安装基数将在三年内突破1000个大关,并在此后继续快速增长。
具体来说,运营商可以使用预测分析来实时改进数据中心冷却系统等领域。提供现代计算需求所需的电力和存储会产生令人难以置信的热量。通过使用人工智能更有效地冷却硬件,提供商可以降低成本并提高能源效率。例如,Google 的 AI 实施将其冷却成本降低了 40%。
人工智能还可以帮助降低 IT 基础设施的低效率。预测分析可以帮助提供商微调电力分配和机架空间。其结果是降低了运营成本、提高了用电效率 (PUE) 以及更明智的数据驱动决策。
现代公司在数据中心基础设施上运行要求极高的工作负载。以 ChatGPT 为例,最近的一份报告预测,到 2028 年,训练和实施生成式 AI 模型的成本将达到 760 亿美元。这个数字是全球最大公共云提供商亚马逊网络服务 (AWS)年度成本的两倍多。
这对数据中心意味着什么?为了提供新技术和当前技术所需的电力、存储和连接,它们必须在许多领域变得更加高效。因此一些数据中心服务提供商已经开始行动了。
人工智能已经对我们的世界产生了重大影响,但重要的是它让创新持续前进。未来的数据中心必须随着技术的发展而发展,以提供高效且有效的服务。例如,我们可能会看到先进的人工智能、量子计算和其他新兴技术塑造下一代数据中心。这些尖端技术有望提供更高的效率和先进的功能。
但是,随着人工智能成为数据中心运营的基本组成部分,透明度和问责制问题将理所当然地发挥作用。可持续性也将在数据中心人工智能决策中发挥巨大作用。资源匮乏的工作负载使用先进的 CPU 和 GPU,需要先进的液体冷却系统来防止硬件损坏。因此,到 2030 年,数据中心能源消耗预计将增加 12%。
使用人工智能将确保数据中心提供商随着这些不断变化的需求而发展,就是以经过深思熟虑、合乎道德的方式提供未来的超大规模数字骨干网。
02先行一步
在一些数据中心市场,例如美国北弗吉尼亚州和凤凰城,对数据中心空间的需求极其强劲,数据中心服务商和超大规模云厂商在潜在需求爆发前已经购买了大量土地。
虽然我们不能将当前的数据中心热潮100%归因于人工智能,但可以合理地假设人工智能的增长是部分原因。在超大规模企业正展开竞赛以加快建设人工智能基础设施(投入在基础设施上的资金可支持这一观点)的情况下,今后建设团队可能会忙碌相当长的一段时间。人工智能会像公有云一样推动数据中心行业的需求吗?先来看看市场一线厂商的动作。
相关数据显示,全球目前约有8000多个数据中心,主要分布在美国、亚洲和欧洲。美国北弗吉尼亚州是全球最大的数据中心集散地,约有300个数据中心。从能耗角度看,2023年北弗吉尼亚州数据中心消耗电量2552MW,达拉斯耗电654MW,硅谷615MW,北京数据中心耗电1799MW,伦敦耗电1052MW,法兰克福864MW。
2025年Alphabet、亚马逊、Meta、微软总的资本支出预计将达2000亿美元,大大超越几大石油巨头的资本支出。
2023 年,亚马逊(AWS)一直在制定新的和改进的战略,以使其数据中心和超大规模设施更具可持续性。进入 2024 年,世界各地的企业将继续使用 AWS 来降低运营成本并变得更加数字化敏捷,从而加快创新速度。
亚马逊已经投资78亿美元在俄亥俄中部建设数据中心。而且,随着远程办公的流行,大量资金也流向数据中心、通信基础设施、光纤、信号塔及相关科技产业。
今年 1 月亚马逊宣布与凯捷合作,进一步关注企业生成式人工智能 (Gen AI) 的采用。有报道称,增加人工智能的采用将使公司更深入地了解其环境战略,从而更加关注更可持续的领域。
凭借其优化的大语言模型 (LLM),AWS 希望继续努力帮助企业充分发挥 Gen AI 的潜力,同时帮助客户应对成本和规模等数字挑战。在数据中心内,如果充分发挥其潜力,Gen AI 和云将继续彻底改变。
微软还计划扩大其在伦敦和卡迪夫的数据中心规模,并向英格兰北部地区进行扩张。这一基础设施投资将有助于满足对高效、可扩展和可持续的人工智能专用计算能力的持续增长需求,以及等待利用最新云计算和人工智能突破的私营部门和公共部门的需求。
除了基础设施投资外,微软还将拨款数百万英镑用于培训人员掌握构建和使用人工智能所需的技能。此外,微软还将引进超过2万台最先进的图形处理器到英国,这是机器学习和开发人工智能所需的关键技术。这项投资还包括一个培训计划,以帮助确保英国人具备构建和使用AI所需的技能。
1月25日,美国印第安纳州经济发展公司宣布,Meta公司计划在印第安纳州建立一个价值8亿美元以人工智能为核心的数据中心园区。Meta将在该州杰斐逊维尔建立一个近70万平方英尺的设施,将于本月开始建设,预计数据中心将于2026年投入运营。除了100个运营工作岗位外,该公司还预计在施工高峰期将支持1250多个工作岗位。
此项投资标志着Meta在印第安纳州建设的新数据中心将专注于人工智能技术的研发和应用。该举措旨在提升MetaPlatforms在人工智能领域的竞争力,进一步巩固其在全球科技市场的地位。这一举措也将为当地经济发展带来积极影响,提升当地科技人才培养和创新能力,为印第安纳州乃至全球的人工智能产业发展注入新的活力。
3 月 13 日消息,Meta 公司通过官方新闻稿公布了两座新的数据中心集群,该公司正希望通过英伟达的 GPU,在以 AI 为重点的开发中脱颖而出。
据悉,这两座数据中心的唯一目的,是在消费者特定应用领域中进行 AI 研究和大语言模型的开发,每个集群都包含了 24576 块英伟达 H100 AI GPU,将用于自家大语言模型 Llama 3 的训练。Meta 官方表示,这些集群的高性能网络结构的效率及关键存储决策、配合每个集群中的 H100 GPU,能够为更大、更复杂的模型提供支持,为通用人工智能产品开发、AI 研究的进步铺路。
Alphabet旗下谷歌将投资10亿美元,在英国赫特福德郡Waltham Cross新建一个数据中心。该公司在新闻发布会上表示,这片占地33英亩的土地将为当地社区创造建筑和技术工作岗位。
谷歌副总裁兼谷歌英国和爱尔兰董事总经理Debbie Weinstein表示:“一旦完成,这项投资将为英国各地的企业带来关键的计算能力,支持人工智能创新,并帮助确保为谷歌云客户和英国及海外的谷歌用户提供可靠的数字服务。”
他们补充说,这笔投资建立在三者的基础上:2022年以10亿美元收购的Central Saint Giles office、King's Cross一个100万平方英尺的开发项目以及推出无障碍探索中心。谷歌指出,它打算在2030年之前让所有数据中心和园区都使用无碳能源。2022年,谷歌宣布与Engie达成电力购买协议,购买苏格兰马里西风电场产生的海上风能。
谷歌表示,该协议将为电网增加100 MW的能源,并使谷歌在英国的业务有望在2025年达到或接近90%的无碳能源。此外,谷歌表示,它正在探索利用数据中心产生的热量的方法,新设施还将提供场外热回收的规定。
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。