摘要:“东数西算”工程是构建我国国土空间领域内算力资源东西平衡、按需调度的重大战略工程。自我国全面启动“东数西算”工程建设以来,供需端、能源端、技术端、机制端等暴露出诸多问题,迫切需要从理论层面对“东数西算”工程的内在逻辑进行重新分析与定义。从经济形态、技术趋势、科技竞争、成本收益等不同视角分析了“东数西算”的内在逻辑,即算力基础设施化,并提出打造全国算力一张网的新型基础设施,以及从政策布局、网络直连、技术支持、机制创新等方面构建国家算力网的对策建议。
关键词: 东数西算 ; 枢纽节点 ; 基础设施 ; 国家算力网
论文引用格式:
童楠楠, 陈东, 李慧颖, 等. “东数西算”工程建设的现状、问题与对策[J]. 大数据, 2023, 9(5): 9-19.
TONG N N, CHEN D, LI H Y, et al. Research on the internal logic and solution of the “Channel Computing Resources from the East to the West” project[J]. Big Data Research, 2023, 9(5): 9-19.
0 引言
“东数西算”是通过建立我国东西部地区算力疏解通道来缓解我国东中西部算力资源分布不均衡的局面,打破东部地区发展空间限制,助力西部地区打造新的数字经济增长极的有效手段,是数字经济时代比肩“南水北调”“西电东送”的国家战略。从“东数西算”工程的政策脉络看,“东数西算”是落实“建设全国一体化大数据中心”的重要举措和战略布局。为做好全国一体化大数据中心建设的政策研究工作,国家信息中心组织团队开展专题研究,在2019年出版的《迈向万物智联新世界:5G时代·大数据·智能化》一书中,首次提出了“东数西算”概念。2020年12月,国家发展和改革委员会联合四部门发布《关于加快构建全国一体化大数据中心协同创新体系的指导意见》(发改高技〔2020〕1922号),指出“加强全国一体化大数据中心顶层设计”,并提出了包含数网、数纽、数链、数脑、数盾在内的全国一体化大数据中心体系总体框架。2021年5月《全国一体化大数据中心协同创新体系算力枢纽实施方案》(发改高技〔2021〕709号)发布,在京津冀、长三角、粤港澳大湾区、成渝、贵州、内蒙古、甘肃、宁夏8个地区布局全国算力网络国家枢纽节点。随后,八大国家枢纽节点的建设方案相继获得批复,“东数西算”工程建设全面启动。从国家枢纽节点的重点建设任务看,“东数西算”工程更加聚焦全国一体化大数据中心体系中的“数网”“数纽”以及“数盾”(安全)方面的建设任务,旨在构建数据中心、云计算、大数据一体化的新型算力网络体系。随着“东数西算”工程的立体化实施和纵深推进,我国算力资源格局进一步扩展和深化,打造全国算力一张网正当其时。“东数西算”作为推进算力基础设施建设的关键工程,也是构建国家算力网的先导工程。在此背景下,本文将在梳理国内外算力网研究现状的基础上,结合“东数西算”工程的实施现状与面临的问题,从经济、技术、科技、成本视角分析“东数西算”工程的内在逻辑,针对进一步深化“东数西算”战略、构建国家算力网提出建议。
1 研究综述
1.1 国外研究现状
算力是对计算性能和数据处理能力的通俗表达,受益于网络的出现,各类计算资源得以相连,承载算力资源与网络资源融合演进、协同调度的算力网络构想由此产生。超算领域中一些应用问题的规模超出了单台高性能计算机的处理能力,在互联网普及的背景下,1998年美国芝加哥大学Ian Foster教授等人基于电力网提出了网格计算(grid computing)的概念,希望推动建立与电力网类似的算力网,至今其在科研、军事等领域仍有广泛应用。2006年谷歌首席执行官Eric Schmidt在搜索引擎战略大会上首次提出云计算(cloud computing)的概念,掀起一场新的互联网革命。云计算开启了算力资源在商业领域的应用,使算力跃升为一种较为普及的生产力,为人们的生产生活方式带来了深刻的改变。到目前为止,云计算仍然是算力服务市场的主流商业模式。
2021年,加州大学伯克利分校的SkyLab在云计算的基础上进一步提出Sky Computing架构,通过在异构云之上搭建兼容层、云间层,并在云厂商间达成互惠数据对等协议,将异构云资源整合包装为一站式服务,为开发者提供一致性屏蔽云体验,使用户不需要具备任何云基础设施专业知识即可使用云服务。该团队研发的开源框架SkyPilot能够在任何云环境上无缝且经济高效地运行机器学习与数据科学批量作业,现已被10多家组织用于多种不同的任务场景,将用云成本降低至三分之一左右。基于相似的理念,Snowflake公司于2014年推出的云原生数据仓库产品采用存储与计算分离的创新技术架构,省去相关软硬件的设置需要,将技术复杂性进行抽象,从而打造出简单的用户界面,降低了服务使用门槛。Snowflake凭借简便的用户操作和按需收费模式受到用户的广泛青睐,该公司一跃成为云计算行业的“独角兽”,截至2022年10月已拥有7 292名客户,在全球数据库市场的份额占有率持续攀升。
目前,国外云计算市场仍处于被AWS、微软、谷歌等巨头占据大部分市场份额的局面。尽管异构云资源的兼容在技术上很容易实现,但不符合专有云厂商的利益,短期内可能难以推广,算力网的形成存在市场阻力。
1.2 国内研究现状
理论研究方面,国内研究机构和专家学者密切关注我国算力网的发展。中国工程院院士孙凝晖认为,算力是智能时代的普及性需求,正如人们需要多种多样的交通,于是有了飞机、汽车,还有高铁。对于信息基础设施,人们也需要它们提供不同特性的算力,有的算得快,有的算得多。李国杰院士认为,未来“算力指数”可能是比“电力指数”更重要的经济指标,算力网络前景光明、挑战巨大,未来信息基础设施必须做好算力、通信、电力网“全国一盘棋”的顶层设计,统筹兼顾,力争全局优化。国家信息中心大数据发展部主任于施洋认为,当前应将建设重点转向城市算力网,把算力网打造为像水网、电网一样的数字城市“新市政”。技术路径方面,李少鹤、崔占伟、贾庆民等人对算力网络架构设计进行了探讨。高文院士认为,算力网络发展需要经过4个技术步骤:一是应用在单个数据中心提交并运行;二是应用在同构的环境但不同的数据中心进行提交,并在单个数据中心运行;三是应用跨多个同构数据中心运行,或者跨异构数据中心提交但在单个数据中心运行;四是一个应用可以跨多个异构的数据中心同时运行得到结果,最终实现与电网类似的模式,用户只需要提交应用需求,算力网络通过兼容层把异构的算力整合起来统一调度使用。郑纬民院士认为,算力网建设需要重点解决两个问题,一是要吸取当年网格计算发展的经验教训,解决带宽和延迟的问题;二是要突破软硬件适配障碍,解决调度的困难。紫金山实验室认为,下一步算力网络关键技术研究应聚焦软件定义网络技术、信息中心网络技术、确定性网络技术等。
行业实践方面,各企业积极开展算力调度研发和实践探索。2019年,中国联通发布了业界首部《算力网络架构与技术体系白皮书》,提出构建计算与网络深度融合的基础设施,并基于“联接+计算”的算网一体理念,探索以云网为基、数智为核,实现算网联动。2021年,中国移动发布《算力网络白皮书》,向业界发出共同构建算力网络的倡议,并提出“算力泛在、算网共生、智能编排、一体服务”的发展愿景,并已启动在算力网络试验网的部署和试验。中国科学院计算技术研究所提出建设“信息高铁算力网络”的构想,目标是原生支持“人机物”三元融合和低熵有序,降低系统无序的负面影响,提升系统通量与应用品质。中科曙光推出了全国首个一体化算力服务平台,该平台基于原生算力底座,实现对全国范围内算力、存储、网络以及数据等分布资源的整合。在智算领域,鹏城实验室研发了兼容多种异构AI芯片的核心软件栈与分布式调度平台,并联合多家单位提出了《人工智能算力网络》系列标准规划,将异构的智能算力分为不同层次进行标准化,方便封装、数据定义和资源的统一调配。寒武纪公司为提高算力平台的资源利用效率,通过综合评估集群、资源、项目、任务的优先级,实施单集群和跨集群相结合的算力调度策略。云网融合方面,亚信科技倡导构建算力内生网络,在不改变网络的基础功能与架构的前提下,通过对5GBBU和5GMEC进行功能增强,实现网络中的算力内生。北京思特奇信息技术股份有限公司推出思特奇融合算力网平台,以云网深度融合、资源统一管理调度为核心,通过云、边、端梯度层次化分流管理,在不同业务场景下提供不同层次服务质量的算力服务。
目前,我国算力网建设已具备一定理论和实践基础,需要政企通力合作,发挥体制优势,加快突破算力并网调度的技术与机制难点,力争在国际范围内率先完成算力网建设。
2 “东数西算”工程推进现状与问题
2.1 推进现状
自2022年起,“东数西算”工程迈入加快推进期,各大枢纽节点建设进入提速升级新阶段,围绕土地规划、网络配套、用能指标、产业引进等方面不断加大政策支持力度,一批重大示范项目开工建设,以绿色低碳、集约高效、自主可控为特点的数据中心建设运营新模式不断涌现,行业生态不断完善。
(1)建机制,强化顶层设计与统筹,推动配套政策“四梁八柱”加速完善
自8个算力枢纽节点批复以来,各节点地区相继成立建设工作领导小组和专班,制定出台实施方案、专项规划、相关支持政策等。工作机制层面,长三角、贵州、甘肃、宁夏等地领导小组均由省级负责同志牵头挂帅;内蒙古节点建立厅际联席会议制度,从强化媒体宣传、举办高峰论坛、建立产业联盟、强化基础设施建设、推进绿色发展、强化产业集聚等方面重点开展工作。规划和政策方面,成渝节点印发《全国一体化算力网络成渝国家枢纽节点(四川)实施方案》,强化统筹布局和要素保障,加快算力设施建设。宁夏节点印发《全国一体化算力网络国家枢纽节点宁夏枢纽建设方案》,明确2022年宁夏枢纽建设40项工作要点任务,确保一批“东数西算”典型示范场景和应用加速落地。贵州节点发布《关于加快推进“东数西算”工程建设全国一体化算力网络国家(贵州)枢纽节点的实施意见》,实施算力集群攻坚、算力输送通道提速等七大专项行动。甘肃节点印发《关于支持全国一体化算力网络国家枢纽节点(甘肃)建设运营的若干措施》,从人才、资金、监管等方面加快推进节点建设。
(2)强保障,多措并举加大资金和要素保障,扎实推动一批重大项目开工建设
节点地区积极谋划“东数西算”项目,从资金、网络、电力、用地用能等方面加强要素保障,一批重大项目相继开工建设。资金支持方面,国家发展改革委已连续两年开展“东数西算”示范项目补贴申报。网络互联互通方面,长三角节点启动建设长三角生态绿色一体化发展示范区集群到安徽芜湖集群间的电信网络主干光缆。贵州节点启动建设贵阳至广州光缆传输直连电路项目,贵州广电联合钜成公司建设贵州至全国重点城市的直连网项目。内蒙古节点启动建设集宁集群直通北京的144芯点对点专用双回路大容量光缆。电力保障方面,河北张家口集群、甘肃庆阳集群、宁夏中卫集群等地充分依托本地的风、光资源优势,重点推进数据中心源网荷储一体化项目建设。河北怀来县合盈数据产业园5吉瓦“源网荷储”一体化一期项目已建成投用,实现园区100%绿电供应。甘肃节点依托中国能建在能源领域的龙头企业优势,围绕零碳理念打造“投建运一体化”的数据中心产业园区,由中国能建投资55亿元建设源网荷储一体化数据中心,确保园区数据中心绿能供应。
(3)聚生态,搭建多层次立体化交流平台,推动各大节点加快补链完善产业布局
社会各界关注热度持续不减,自发地涌现出优秀应用实践。浙江移动和中国移动云能力中心联合打造“移动云影视渲染平台”,通过自动配置网络带宽和算法模型,远程高效调用西部算力完成视频渲染,极大地缩短渲染周期,降低渲染成本。行业生态逐步建立,行业性研究报告陆续发布,包括《中国综合算力指数》、《中国算力白皮书》、《中国存力白皮书》、《东数西算战略下绿色智算中心产业发展研究报告》等。除数据中心机房建设外,各节点也在着力布局数据中心产业链上下游。长三角节点加快推进嘉善县阿里巴巴数据产业园建设,招引闻泰通讯、立讯智造、日善电脑等“链主型”企业落地;内蒙古节点初步建成以服务器生产、存储、计算为主线的产业链框架,清华同方、百信等公司落地;甘肃节点印发《国家数据中心集群(甘肃·庆阳)“东数西算”产业园区产业规划》,打造“智算”“智能”“智产”三大重点产业。
2.2 面临问题
“东数西算”工程在实施过程中取得了丰硕成果,同时也暴露出一些问题。
在供需端,算力能力建设与算力需求对接的矛盾依然突出。东西部节点间联系薄弱,算力跨域流动的条件尚不成熟。一方面,东西部高速直连网络尚未搭建,节点之间的网络传输能力差、时延高、带宽小、资费高,难以支撑大量数据的低时延传输需求,从市场成本考虑,企业需求不敢轻易向西迁移。另一方面,算力网建设需要更多地区加入。目前分布在东西部的8个节点之间缺少过渡性的合作桥梁,无论是基础设施条件还是数字化素养等方面都差距过大,短期内难以统一步调。同时,东部算力需求中只有部分中高时延任务可以转移到西部节点,中低时延任务仍无法外迁。
在能源端,数据中心清洁能源供电难以落地。建设“源网荷储一体化”供电系统是实现数据中心低碳发展的重要举措,目前已有多地开展相关探索,但在建设过程中受到电网运行机制的限制,源荷难以对接,需要国家、地方政府给予绿电直供、降低综合供电成本等政策支持。而对于接入电网的数据中心来说,既不能选择也无法鉴别电网输送来的电力是煤电还是风电,导致清洁能源使用率难以评估。
在技术端,一些瓶颈亟待突破。一方面,算力基础设施距全面实现自主可控仍有较大差距。作为数字时代的重要基础设施,数据中心安全关系到国家安全,软硬件和操作系统必须全部推行国产化。尽管我国服务器自主可控已基本实现,但在关键的芯片、算法、应用系统等环节对国外产品依赖度较高,需要加大研发力度。另一方面,算力调度是实现“东数西算”的关键一环,而目前国内跨域算力调度、异构算力调度、算网联合调度等技术尚不成熟,算力调度应用试验进展缓慢。
在机制端,一些空白亟待填补。一方面,东部节点缺乏统筹机制。一些选址区域跨省级行政区划的节点内部尚未就“东数西算”建立实质性的跨域沟通机制,算力网的建设运营主体不明确。另一方面,东西部之间缺乏利益协调机制。对于西部节点来说,租赁机房的云服务商和需要算力资源的互联网头部企业几乎都注册在东部地区,消耗算力资源产生的利润随之流向东部,西部节点城市只能从数据中心企业的收益中直接或者间接受益。为保障西部节点利益,需要国家在税收共享等方面进行机制创新。
3 “东数西算”的内在逻辑:算力基础设施化
所谓基础设施,是指用于保证国家或地区社会经济活动正常进行的公共服务系统。在数字经济时代,算力正在像水、电一样成为基础设施。中国信息通信研究院李洁、韩淑君等人对算力基础设施的现状、趋势进行了讨论。算力基础设施化是指算力成为基础设施的程度、状态。孙凝晖院士认为“东数西算”工程建设应以实现算力基础设施化为目标,处理好算力标准化、算力使用抽象化等问题是实现算力基础设施化的关键。结合“东数西算”的战略部署,本文认为可从以下4个视角来分析其内在逻辑。
3.1 经济形态视角:算力是数字经济高质量发展的重要支撑
算力是数字经济的三要素之一,据《2021—2022全球计算力指数评估报告》显示,计算力与经济增长紧密相关。计算力指数平均每提高1个点,数字经济和GDP将分别增长3.3‰和1.8‰。2016—2020年,我国每年算力规模平均增长42%,数字经济规模增长16%。到2025年,我国数字经济规模有望突破80万亿元,2030年突破百万亿元。着眼全球算力指数排名,美国以77分位列国家计算力指数排名第一,中国获得70分位列第二,计算力已成为衡量经济和社会发展水平的重要指标。基于此,以“东数西算”工程推动国家东西部算力资源均衡化发展则是中国特色的算力经济发展必由之路,是社会主义体制下实现共同富裕的重要前提。2020年我国已全面消除绝对贫困,而从工业社会进入信息社会,数字经济在国民经济中的占比将会超过60%,我国东西部信息技术发展的差异还有可能进一步拉大。相比于显式的经济贫困,我国还将面临严峻的隐形贫困——信息贫困问题,特别是由算力东西部分布不均衡等带来的数字鸿沟问题日益显著。因此,我国脱贫攻坚任务还应从物理空间延伸到信息空间,通过算力基础设施化,全局统筹,最大化解决东西部、城乡间在数字化转型中出现的信息发展不均衡的问题。正如“要想富先修路”一样,发展数字经济首先要推动实现算力基础设施化,打造“数字致富路”。
3.2 技术趋势视角:算力基础设施化将催生新的技术体系
自1882年世界第一座商业用蒸汽发电站在美国纽约市投入运行以来,美国电力系统日渐成熟,电力费用的稳定低价也极大地带动着美国电器产业飞速发展,生产要素的基础设施化为技术和产业发展提供了原动力。20世纪60年代,美国学者提出,算力要像水、电一样随用随取,即算力基础设施化。20世纪90年代初,美国启动实施“信息高速公路”计划,用2 0多年时间、耗资近4 000亿美元建设“信息高速公路”,实现企业劳动生产率提高20%~40%,促进了互联网产业腾飞。算力的价值在于“用”,当前正处于人、机、物三元计算时代,海量的物端带来了高通量的需求,算力成为支撑各类应用场景的关键基座之一。然而,在用电成本、网络传输成本等多重环节的叠加下,算力资源的使用成本尚未达到普惠水平,这在一定程度上制约着小微企业和科研机构等主体的使用积极性,算力需求端的潜力远远没有释放。而破解这一困局的关键就在于推动算力基础设施化,当算力成为人人易获取又低价的生产资料时,市场使用活力自然将被激发,算力也会反向催生新的技术体系。当前,我国正大规模开展新基建,以算力网为核心的数字新基建的终极目标就是实现算力基础设施化,带动我国数字经济实现全面起飞。
3.3 科技竞争视角:算力成为全球科技竞争新型战略资源
在当前形势下,数字新基建被赋予新的使命。虽然我国算力总量目前位居世界第二,仅次于美国,但人均算力水平排名中后位,远落后于美欧等发达国家和地区。据统计,2020年年末,我国在用数据中心机架达500万架,年均增速达全球平均水平的2.3倍。加之未来各种智能化应用兴起带动的算力需求爆炸式增长,我国未来算力资源将会严重不足。据预测,我国2025年数据中心算力缺口将达到24%~50%。算力差距直接体现在数字经济规模上。美国2020年数字经济规模总量为13.6万亿美元,我国仅有5.4万亿美元,美国、德国、英国数字经济占GDP比重均超过60%,我国仅为38.6%。此外,我国信息领域关键技术受制于人的局面仍未彻底打破。近年来,我国加快推动以安全可控为目标的国产化替代,部分重要环节实现原位替换和局部强化,力求尽快掌握科技创新主动权,构建自主可控的算力产业生态体系。
3.4 成本收益视角:算力优化布局带来经济社会效益显著
“东数西算”具有新基建的典型特征,是一个通过短时投入就可持续获得高效产出的工程。相较于东部,西部建设运营数据中心涉及的成本除了土地租赁费、机电和园区建设费、电费、人员薪酬等,还包括跨域网络租赁费。以我国东西部实际建设运行的大型数据中心为例,分析实施“东数西算”的数据规模与经济效益,测算结果显示:在现有网络运营商的网络条件下,“十四五”期末,东部约有585.67 EB的数据可向西流动,“东数西算”将为市场节省成本约3.5%,带动西部就业1.3万人起。在当前网络传输条件下,若将东部可迁移数据全部西迁,“十四五”期末将节省约185.49亿元的数据中心建设运营成本(如图1所示),包括49.63亿元的数据中心一次性建设成本和135.86亿元的运维成本。在一次性建设成本中,机电建设成本约占80%,机房园区配套建设成本约占20%,土地成本仅占0.3%。在运维成本中,用电成本约占64%,网络租赁成本约占32%,人工成本占比较小。总体来看,在东西部建设数据中心,一次性建设成本差异较小,但随着逐年累积,运维成本制造的差距越来越大,“东数西算”效益将日益凸显,升级节点间直连网络条件对“东数西算”成本节约将有进一步的放大作用。可以说,“东数西算”是功在当代、利在千秋的战略工程。
4 推进对策:打造全国算力一张网体系
4.1 强化国家“东数西算”战略顶层布局
面向万物互联的新时代,打造全国一体化国家算力网正当其时,应按照“先局部再全局,先试点再推广”的总体思路,重点围绕8个枢纽节点、10个数据中心集群开展试点示范,着重强化东西部算力枢纽集群内部和集群之间的统筹联动,构建“国家-区域-城市”多级互联的算力资源协同调度网,分阶段、分步骤推进算力网协同布局,让算力资源在高效有序的调度之下成为人人可取、会用的生产资料。探索布局全国算力资源的统一管理体系,具体可参照国家电网总公司的建设模式,发挥新型举国体制优势,探索组建国家算网总公司,打造万亿级算力市场,形成全新产业集群。
4.2 打造纵横联动的跨域网络传输通道
鼓励网络运营商尽快升级东西部节点地区重点城市之间的网络带宽,满足即将爆发的算力跨域调度需求。长远来看,应合理规划设计国家算力网架构体系,将庆阳、和林格尔等地升级为网络骨干直联点,降低东西部节点之间的数据传输时延,以满足更多业务场景西迁的需求。加快确定性网络建设与推广应用,鼓励云网边端、多云之间的联通调度相关技术突破,支持东西部节点开展试点示范,促进算力供给侧和需求侧有效对接,推动云网边端高效协同的算力部署。
4.3 构建自主完备的算力调度技术体系
美国建设“信息高速公路”,采取“追求高性能、弱化全局控制能力、外挂式安全”的模式,对于全球技术与生态的顶层掌控者,此种模式能够实现利益最大化。而我国作为后发国家,应从自身人口多、能源少的实际出发,增强数字基础设施的安全防护能力,构建数字技术自主可控的算力调度技术体系。通过成立算力网络技术攻关专项,加大科技力量投入,试点建设全国算力网。组织国内超级计算机探索者、先进云服务商、网络服务商、研究机构、国家标准组织等成立攻关组,研究国家算力网的架构、核心技术和应用场景,并选择代表性节点城市、典型场景(如人工智能领域的“东数西训”)开展试点,从网络传输、能源供给、芯片、服务器、操作系统、中间件、数据库、平台系统等各个环节,探索算力基础设施化的最优路径,形成东数西算的技术基石和国家算力产业发展的中国道路。
4.4 创新算力基础设施产业发展运营机制
创新运营机制,激活西部算力产业活力。从西部自身看,为解决当前“用能散”“用地散”“运营散”等带来的产业链条短、营利模式少等问题,数据中心集群必须尽快转变建设运营模式,以补链、延链、强链为目标,构建“投、建、运”一体化、集约化、园区化的算力生态体系,从而在算力流动的各个产业环节降低成本、提高收益。从东部协同看,多数节点希望国家出面指导东西部地区节点间开展“结对子”合作,探索跨域利益分配机制,建立更加科学合理的数据中心单位GDP能耗评价体系,明确当前各自发展的侧重方向,避免东部与东部、西部与西部间无序竞争、恶意竞争,避免低层次的重复建设和资源浪费。鼓励探索完善跨区域算力结算交易机制,避免出现“核心利润留在东部、低端运维放在西部”的局面,保障“东数西算”工程实施的可持续性。
5 结束语
“东数西算”工程的实施推开了我国算力经济加速发展的大门,经过一年时间的试点建设,虽然暴露出一些问题,但是循着问题的轨迹和形势的演进,“东数西算”迈入了“2.0时代”,即国家算力网建设阶段。为此,本文分别从经济形态、技术趋势、科技竞争和成本收益4个视角,阐述了“东数西算”的内在逻辑,解释了算力基础设施化的必要性,并提出打造全国算力一张网体系的构想。期望随着国家相关政策文件的出台和算力网络体系建设向深层次推进,本文研究能为“东数西算”工程的落地落实以及相关研究提供有益借鉴。