生成式AI(AIGC)无疑是当今最具创新性和影响力的技术之一,它正在改变着各行各业的运作方式和商业模式。生成式 AI 的应用场景广泛,发展潜力巨大。根据《中国 AI 数字商业产业规模展望》报告预测,生成式 AI 的市场规模将从 2020 年的 40 亿增长到 2025 年的 495 亿,约有近12倍的增长空间。
生成式 AI 的发展离不开强大的算力支撑,海量数据和模型的训练需要高效的计算资源来处理,也需要高速的网络来进行传输和交互,才能保证高质量和高效率的内容生成。相比于传统应用,生成式AI对算力和数据中心提出了更高的要求。
在近日举行的第十八届中国 IDC 产业(大湾区)年度大典上,万国数据高级副总裁汪琪以《打造全球智算底座,云网连接数字未来》为题,分享了万国数据在AIGC需求爆发性,对数据中心产业发展的思考,以及在数算网一体融合等方面的实践与创新。
生成式 AI 的算力需求变革
汪琪指出,经过几年的发展,AIGC已经形成了自己的上下游的生态,其产业结构可划分为上中下三层:基础层、中间层和应用层。基础层是以大模型训练为主的层面,它需要超高的算力门槛、数据门槛和算法门槛。中间层是以垂直化场景二次开发为主的层面,它需要对大模型进行抽取、微调和适配。应用层是以满足终端用户实际应用为主的层面,它是在训练模型的基础上针对用户的文字,照片,视频等多模态多场景下的需求进行满足。
“在AIGC 场景下,数据中心需要具备更高密度的计算、网络连接及数据交互综合能力。”汪琪表示,不断迭代的算法,海量的训练数据以及多模态多场景下丰富的应用生态,都需要超高的算力加以支撑和应用。
算力的高度集中,是生成式AI对数据中心带来的最显著的影响。汪琪以8芯片的服务器举例:每台服务器耗电量在3kW左右,当前主流4-6kW的机柜只能容纳1-2台服务器,这样的密度显然难以支撑起一次高性能的智能训练需求。
因此,提升算力密度需要数据中心在服务器承载能力和电力供给上给予充足的保障。万国数据与主流芯片厂商合作,支持包括CPU、GPU、NPU 等在内的多元算力及仿真系统,并实现了最大单机柜支持功率可达30-50kW,完美解决了算力密度的问题。
生成式AI为数据中心带来的第二个挑战就是网络需求。一方面是AI大模型在训练的过程中需要多机、多卡互联互通,对网络吞吐能力要求极高。另一方面是AI大模型的迭代、升级要进行海量数据的更新,需要网络的支撑。
万国数据在传统网络的基础上,进一步对IB,ROCE等客户网络需求提供支持,满足AI大模型训练所需。通过与运营商、云商合作,实现数据中心之间、数据中心与互联网之间、数据中心与云之间的高速连接和传输。为数据源提供了高带宽、低延时的通路。
打造绿色生态底座
在满足生成式AI需求的同时,高密度、高算力也为数据中心带来了高能耗的挑战。作为最早在国内提出2030年达成碳中和及100%使用可再生能源目标的数据中心企业,万国数据采用了多种措施来实现生成式AI时代的绿色发展目标。
一方面,万国数据研发了更加高效的智慧能源管理系统,提高能源利用率,采用新技术如液冷、氟泵等,降低散热损耗,提高机柜密度,减少空间占用。另一方面是强运营,通过万国数据在各个数据中心的节点、子系统,以及大量的传感器,以人工智能的方式进行自动的运营和管理,实现运营能效的持续提升。
在高算力、绿色低碳的基础上,算力生态是生成式AI产业高质量发展的重要保障,这其中包括芯片厂商、服务器厂商、云服务商等。数据中心作为基础设施,需要为产业提供一个开放、共享、灵活、高效的平台,让各方可以互联互通,共享资源,协同创新。
“将来的AI数据中心,有三个角色要承担,”汪琪表示,面向AI芯片提供方,数据中心要提供研发、仿真环境的支撑;面向AI服务器提供商,数据中心要提供高算力、高带宽、低延时网络,并帮助客户做好部署及二次开发应用的生态通道;面向终端客户,数据中心应当提供满足各种场景需求的生态链接。
“万国数据希望给大家提供的不仅仅是机架,还要提供包括网络服务,以及数据中心之间的、数据中心到各朵云的生态连接的服务,”汪琪表示,万国数据拥有超过 100 座自建数据中心,覆盖全国主要区域和东南亚核心城市,服务830多家知名客户,“万国数据希望打造的是一个全球智算底座,一个云网连接数字未来的生态平台。”
本文采摘于网络,不代表本站立场,如有侵权,请联系删稿。转载联系作者并注明出处:http://www.china-datacenter.com/show-43.html