算力已经成为数字经济时代新的生产力。无论是大数据在追踪疫情传播中的应用,还是建设智慧城市、智慧社会,抑或是线上办公、学习、娱乐,千行百业数字化转型对算力的需求与日俱增,以数据中心、智能计算中心为代表的算力基础设施,为保障社会生产生活高质量运转提供了重要支撑,持续促进线上线下加速融合,正在为数字经济发展注入强劲动能。
随着“东数西算”工程全面启动,打造全国算力一张网按下“快进键”,针对算力布局中的机遇和挑战、算力网络发展需要关注的问题等,《人民邮电》报记者分别采访了北京邮电大学电子工程学院张杰教授和百度副总裁谢广军。
一体化布局带动数据中心有序发展
记者:“东数西算”工程全面启动,开启了“新基建”领域跨区域资源调配新篇章,算力整体布局将如何发展?
张杰:从全国一体化大数据中心、算力网络等概念的酝酿提出,到“东数西算”这一国家算力枢纽建设工程的正式启动,横跨我国东西部、与能源资源空间分布相得益彰的算力新基建战略格局正全面铺陈开来。一方面围绕8个枢纽节点和10个数据中心集群,强化算力统筹智能调度能力建设,点面结合、以点带面,锚定国家算力布局“坐标图”。另一方面通过新建高速传输线路、整合升级现有网络等方式,打造高品质的算力连接,构建“东数西算”大数据走廊,完善算力协同运行“线路图”。
和以往企业根据自身业务需要进行数据中心建设的模式相比,以“东数西算”为契机发展一体化大数据中心协同创新体系,围绕算力基建化趋势下好下活全国“一盘棋”,涉及西部可再生能源开发利用、东西部之间数据有序流通、大数据和产业数字化带动经济效益提升等,都需要政府发挥重要的牵引作用。同时,国家枢纽节点的建设将有效汇聚数据生产要素,发挥算力辐射效应和增值作用,为区域数字经济发展注入强大动能。
谢广军:百度方面会持续加大对数据中心的投入,持续发展以大数据中心为代表的新基建,来应对AI时代与日俱增的算力需求。这些年,百度的数据中心布局和“东数西算”工程有很强的相关性。总体来看,不管是做自有业务,还是云计算相关业务,我们会按照业务类型和业务特点进行分类,比如说大致分成在线响应和离线的大数据处理,包括AI训练模型相关的数据处理。从业务特点出发,因地制宜提供算力服务,映射到数据中心布局来看,我们的在线业务基本在我国东部,为用户提供更低的访问时延、更好的访问体验;离线计算业务基本布局在我国西部,主要是出于运营成本方面的考虑,从部署数据中心成本、西部能耗价格等来看,能够显著节约企业运营成本。
记者:企业目前在算力布局方面取得了什么效果,计划在哪些方面取得突破?
谢广军:百度一直在分布式计算与存储、数据中心绿色转型方面寻求突破。围绕数据中心集群布局中心节点,同时推进边缘数据中心建设,以及结合边缘的网络覆盖优势积极布局5G MEC(移动边缘计算)等形成覆盖全国的分布式计算架构。在存储方面,硬件上我们自研了高密度、低成本的冰山冷存储体系。在软件上,我们通过存储分级,能够自适应管理数据的整个生命周期,比如热数据存放到SSD上,冷数据可以存到磁盘上,更冷的数据可以存到基本不耗电的磁盘阵列上。存储架构的革新带来数据中心成本的降低,在分布式存储架构和编码技术上的创新,使我们最低只需 1.1个副本,即可保证数据拥有同样的可靠性,而传统上通常需要3个副本。
在绿色算力方面,我们积极承担企业对于生态环境保护的社会责任。公司去年提出在2030年实现集团运营层面的碳中和目标,去年我们整个数据中心的可再生能源使用已经达到26万千瓦时,对于绿电使用方面,有量化数据指标来考核数据中心能耗使用。百度云计算(阳泉)中心是国内首个应用太阳能光伏直接并网技术的数据中心,从IT、电气、动力系统等方面采用多项绿色节能创新技术,在数据中心内首次应用污水回收再利用技术,大幅减少日污水排放量。
记者:从整体来看,全国一体化算力网络体系具有什么优势,能够带来哪些发展机遇?
张杰:首先,全国一体化算力网络体系的建立,畅通了产业数字化要素集聚的骨干脉络,夯实了支撑数字经济发展的坚强底座。数据资源作为一类生产要素,其规模分布和经济社会运行状况息息相关,算力则是推动数据资源深加工与价值塑造的关键。从国情分析来看,我国东部地区经济发展活跃,数据消费潜力巨大,而西部的数据需求量和活跃度都要低一些。如果把东部待加工的数据按需、有序引导到西部去,同时低成本、灵活匹配到算力资源丰富的枢纽节点上,将海量的数据资源变成信息消费品,进一步有效挖掘数字化潜在应用价值,具有十分重要的意义。
其次,算力网络国家枢纽节点全面展开建设,有助于解决当前制约数据要素敏捷快速流通的算力梗阻问题,实现以骨干带边缘,并通过建设高速网络、扩大算力规模等措施带动数据效率和效益提升,促进国家层面整体资源的有序流动,提升整个经济的活跃度,为数字经济发展提供强劲动力。
最后,“东数西算”工程的全面实施,要求各级政府做好算力网络的顶层设计,统筹算力建设的资源投入,推动算力服务有序开展,不断深化数据安全保障体系建设,加快实现数据需求热驻冷移,为相关行业和企业的未来算力布局提供方向性指引。
直面挑战差异化细分算力需求
记者:算力网络布局基础架构已经确定,目前面临哪些挑战?
张杰:梳理算力差异化需求对有序引导数据流向至关重要。现阶段算力规模重点包括基础算力、智能算力和超算算力三部分,分别适用于解决基础通用计算问题、人工智能计算问题和科学工程计算问题。在不同场景下计算任务的侧重点存在差别,例如后台加工、离线分析等对数据实时性要求不高,而科学工程计算往往需要提供很高的并行处理能力。对各类算力服务进一步细分,按照计算规模、实时性要求等进行梳理,通过算网协同合理规划数据流量流向,为计算任务和算力资源的有效匹配提供重要基础。“东数西算”工程对国家算力枢纽的定位不同,需要充分分析算力服务需求、效率的差异化特点,把适合“西算”的数据有序引导到西部算力枢纽,灵活按需匹配合适的算力节点。
谢广军:从业务架构角度来看,哪些需要放在东部处理,哪些需要放在西部处理,相关的访问层、数据库层,需要离线处理的部分首先需要从业务部署上拆分出来,才能为“东数西算”做好准备。在业务架构逐步清晰,能够实现业务层面的拆分之后,跨域调用算力资源需要的网络带宽、低时延高质量传输以及背后的成本都是需要考虑的问题。如何把握好运营成本和网络质量的平衡,使数据中心之间能够高效互联,包括数据中心和国家算力枢纽节点之间的相互配合,从而满足大量数据传输的大带宽、低时延要求,将是算网发展需要重点关注的问题。
记者:社会数据总量爆发式增长,对算力基础设施的要求不断提高,数据中心建设和运营管理方面有哪些考虑?
谢广军:围绕全国一体化算力网络架构,我们也在持续推进新一期的数据中心建设和大规模网络布局。按服务器的容量来说,一个地方应该是十几万台服务器的规模,当然我们会分期建设。在选址考察方面,我们的数据中心评估标准也在不断迭代、改进,在数据中心绿色转型方面,我们最近和中广核签署了战略合作框架协议,包含10亿千瓦时的绿电交易合同,主要用于河北保定地区的数据中心,使保定的自建数据中心能够提前实现碳中和目标。
对于区域性、本地化性质很强的业务,比如满足业务数据不出本地、对网络时延要求高的业务,我们通过区域性运营数据中心,持续深化云服务创新,包括自研昆仑芯片、提供PaaS(平台即服务)、SaaS(软件即服务)等业务,推进区域性产业赋能,为工业互联网、教育、医疗领域的数字化升级提供有力支撑。同时,我们也在积极探索对数据中心的统一管理模式,从集中式云计算向分布式云计算转变。
记者:从目前确定的8个算力枢纽节点、10个数据中心集群结构出发,规划层面哪些分析必不可少?
张杰:“东数西算”工程勾画了我国算力基础设施发展的未来轮廓,奠定了以国家算力枢纽为中心的全国一体化算力网络战略格局,迫切需要在数据中心集群建设运营云、网、智融合模式,在算力协同与数据低时延传输可靠保障等方面开展系统性规划与分析研究。由于该工程覆盖地域广、涉及领域多,建议推动全国性算力统筹和智能调度仿真运行平台建设,构建“东数西算工程大脑”,实现国家算力资源跨域调配一站式管理,从而助力破解“东数西算”工程建设规划、管理、优化、评估等难题。
实现海量数据计算分析、分流,数智相关服务决策优化,从而满足一体化算力调度要求,不仅需要建设大型算力节点,对节点间的高速互联网络开展建模仿真、性能分析等基础研究同样至关重要。例如算力节点增减、算网拓扑调整、计算能力变化等复杂情况,会对全网数据流通效率带来何种程度的影响,会对与算力资源调配关系密切的能源供需结构、数字经济活跃水平造成什么样的后果?从算力整体布局出发建立全网仿真平台与数字孪生系统,能够为算力节点之间流量通道的建设、避免单点故障影响算网效能,以及呈现、预测算网发展等提供重要抓手。