作为数字经济发展的核心生产力,算力已经成为国民经济发展中最重要的基础设施之一。“东数西算”工程自2022年2月全面启动,旨在优化区域资源配置,通过算力枢纽和数据中心集群建设,利用西部地理资源优势,解决东部计算所遇到的问题,从而带动整个产业上下游发展,推动数字经济高质量发展。
未来,随着万物互联、数字化转型深入发展,数据信息的生态体系建设将会无处不在。为了更好地统筹算力需求与算力设施,实现东西部数据流通、价值传递,“东数西算”工程应运而生。国家之前的几个大型工程如“西气东输”、“西电东送”,皆为项目周期跨度达多年的长期大工程,且能够持续拉动相关产业。比如,“南水北调”的整个建设周期,前后持续几十年,直接带动了我国水利工程的发展。“东数西算”工程也不会例外,整个产业链条很长、投资规模大、覆盖门类广、带动效应强,需要产业链上下游协同创新。绿色节能数据中心、算力调度、海量数据存储和流通、数据智能分析、数据安全等方面,都将伴随着“东数西算”工程建设得到更多研发投入和产业升级。
算力中心建设四要素
“东数西算”作为一项国家级战略性工程,聚合了众多科技企业共同参与推进。北京青云科技股份有限公司(以下简称“青云科技(qingcloud.com,股票代码:688316)”)作为中国核心云厂商也积极参与其中,输出自身平台优势以及丰富的数字化转型经验,建设这项具有时代意义的伟大工程。在青云科技副总裁、数字价值研究院院长沈鸥看来,在“东数西算”建设中,一方面,会新建一批绿色、低PUE(Power Usage Effectiveness,评价数据中心能源效率的指标)的数据中心,整合之前高能耗的数据中心,减少其在国家能源消耗中的占比;另一方面,提供算力服务满足政府和企业在数据计算、数据分析等方面的需求。算力中心建设主要由以下四个要素组成:
一是机房设施建设。新的数据中心主要集中在资源较充沛的中西部地区,充分利用清洁能源和低成本电价,以及凉爽的气侯,结合模块化数据中心设施、一体化电力模块、智能锂电等先进节能技术,建设高等级、低能耗的数据中心。这是“东数西算”中非常重要的基础工作。
二是新型数据中心基础架构管理及能耗管理。数据中心建设完成后,以物联网、边缘计算为技术核心的新型数据中心基础架构管理,将为数据中心的整个管理带来统一的数据采集、集成和分析,从而更有效地综合管控数据中心的运行。比如,以更精准的方式进行能耗监控,基于这个策略进行算力调度,服务其能耗优化,最大程度节省数据中心能源消耗,提升其自动化能力。
三是多元算力操作系统。这是算力中心的重点和关键,架构在数据中心之上,提供计算、存储、网络、安全的资源管理和调度,交付多元算力,支持和支撑数据计算与分析、应用运行和业务处理,从而赋予数据中心真正的动力。
四是多算力集群的运营运维服务。国家将算力作为数字化基础设施,服务于不同行业客户。算力集群的运营需要为这些行业客户提供多样性业务服务,通过创新业务模式,引入更多企业,让企业在数字化转型中更高效地获取数据分析处理带来的价值。
在算力中心建设的四要素中,青云科技主要提供数据中心的智能化管理和能耗管理、多元算力操作系统,还有多集群的运营和运维服务平台。通过研究相关政策和行业需求,投入相应的研发力量做产品迭代和解决方案完善。如今,智能算力平台、高性能计算平台、AI计算平台、海量存储平台、智能数据中心管理平台等,能够提供全面的技术支撑能力,已在多个政府项目中落地实践,为算力中心建设添砖加瓦。
多元算力操作系统
多元算力操作系统的目标是通过对多样性算力的管理和调度来支撑行业应用计算以及行业数据智能分析。在具体能力上,多元算力操作系统主要提供四方面平台能力:
一是算力生产供应平台。包括多样性算力、标准云平台算力服务、高性能计算能力、物联网和边缘计算能力,以及GPU、AI为主的算力能力。
二是数据开放共享平台。依托青云科技多年在数据库、大数据、PaaS平台上的经验,利用大数据工作台的产品支撑企业数据在生产、采集、计算上的服务要求。
三是智能生态建设平台。主要提供开放的应用框架,无论是传统应用,还是现在流行的云原生应用、AI应用,或是各种行业专属应用,都可以通过应用中心的框架进行云化,成为可被访问的PaaS服务或者SaaS服务,从而创建丰富的计算服务生态和行业应用生态。对一些行业算力中心和算力平台而言价值很高。
四是产业创新开发平台。聚焦行业应用开发和迭代,引入低代码开发平台、DevOps(Development、Operations,开发和运营维护)流程开发平台,以及API(Application Programming Interface,应用程序接口)聚合、Serverless(软件应用与服务器解耦)等技术能力,从而为业务流程重建和业务场景迭代提供有力工具。
以上四个平台相互依存,共同为企业的数字化进程提供完善的整体服务能力。在整个能力搭建上,通过技术开源、支持开放标准,能够将相关技术能力更为广泛地应用到多个领域和行业,如智能制造、医药分析、地理海洋、气候预测等。
这些能力的落地产品就是超级智算平台,向下接驳多样性算力,向上支撑行业应用。底层算力服务包括网络互联能力、海量存储能力,这些都是青云科技完全自主研发的产品,全部采用分布式架构满足海量扩展需求。
如何将算力转化为便捷易用、真正的基础设施,各种应用、算法或者模型都能更方便地运用这个算力,仍是一个不小的难题。算力并不是孤立存在的,算力价值体现在以更快、更短的时间完成数据分析、业务计算任务,推动业务进程和管理活动。青云科技早在2014年、2017年分别发布了云平台应用中心(App Center)1.0、2.0,提出了基于统一框架加速应用上云,提升云服务能力。2020年发布了超算应用中心,支持EDA(Electronic Design Automation,电子设计自动化)、CFD(Computational Fluid Dynamics,计算流体动力学)等行业应用在超级智算平台上的发布和部署。这是近两年企业数字化转型,特别是工业领域企业中所产生的需求,让行业能力和算力进行有效连接,这也是超级智算平台支撑众多行业场景的技术基础。
除了超级智算平台外,智能化管理、能耗管理也是数据中心建设的重点。新建数据中心PUE被要求限制在1.3以下,改造的存量数据中心PUE通常要求在1.4附近,这存在一定的挑战。对于大型数据中心而言,系统的IT负载率取值如果是0.9与1的差别,就可以使服务器总体能耗相差10%。所以,能耗的管控与调度对数据中心的整体能耗而言可带来很大影响。青云科技结合物联网、边缘计算等技术,跟数据中心的基础架构管理厂商合作,打造了智算数据中心管理平台,构建整个数据中心统一的运维数据中台,包括统一的设备数据采集平台、设备配置数据库、监控告警平台、运维管理流程、管理调度服务,相当于为整个数据中心提供一个技术和业务的数据中台。
通过新型采集网关和分布式物联平台,实现对数据中心楼宇自控、数据中心设备运行数据的毫秒级采样。每秒可以采集1万个采样点数据,存储12万条采样数据,每天可以分析和处理100G以上的各类运行指标数据。更加精准计算各类设备能耗,对高能耗设备进行调度和控制,从而更加有效地减少数据中心的PUE,通过管理提升效能。
超级智算平台应用与发展
超级智算平台已经在国家级超算中心落地,承建了超算公共服务云、政务行政服务云和公共云,提供HPC(High Performance Computing,高性能计算)、EHPC(Elastic High Performance Computing,弹性高性能计算)、标准云服务(IaaS/PaaS/GPU/AI),基于分布式云以及分布式云架构的区域云服务都提供给客户,为整个超算业务提供了统一的应用服务能力。使用超算服务的用户,比如大学、科研单位,既可以选择传统的“超算队列+计算应用”,排队进行计算处理,也可以根据业务紧急程度,申请弹性高性能计算进行数据分析和计算。多种模式合而为一,通过一个统一平台交付给客户。
无论是算力服务访问,还是应用调度发布,使用者都是通过统一的算力平台门户更方便地实现。既加速了算力应用推广,同时,不断与行业应用厂商合作,将更多应用搬上应用中心,让客户能一键实现相应业务分析。比如,医药行业做基因测序,可能有很多算力因子及应用,可以一键交付,而且底层的算力调度已经做了很好的衔接,客户很容易获得应用算力服务和数据分析服务。
青云科技自主研发的超级智算平台凝聚了多项核心技术能力。首先,是在一个平台上提供多样性算力,每种算力都支持海量扩展、按需扩容、按需增加节点。其次,基于分布式云架构和软件定义广域网技术,该平台能够跨地域分布式部署,在统一的运营框架下,算力服务可以跨域申请和使用,服务和应用的访问也可以跨域,而且是在统一的用户管理与运营体系下。
不仅如此,其还对信创平台有完整的支持,与业界主流的国产芯片、国产操作系统厂商有深度合作,已经实现在国产平台上部署的能力,随着“东数西算”工程进一步深化,必然会延展出更多技术和应用场景。比如,在智能分析和算力调度上有机结合、省级云网融合、多网融合的算力网络等方面,提供更具技术能力的相关产品,支持数字经济高质量发展。
“东数西算”作为国家重要的规划和策略,最终成果一定会惠及更多行业和社会民生。在国家层面,规划中的八大算力网络国家枢纽节点已全部“集结”完毕。在行业层面,国家的多个行业部门也在评估算力平台的行业价值。一方面,加快自身算力体系智能化升级,包括推动智能分析和应用计算在行业的应用与落地;另一方面,探索和建立行业公共算力基础设施,因为并非所有企业和单位都有资金及技术实力来建设一个大规模算力中心。
行业主管部门探索建立该行业的公共算力基础设施,以行业云的方式提供算力资源,推动行业内大型单位向中小单位输出更加先进、灵活的计算能力。同时,研究安全可信的算力产品,提高自主研发的算力在行业当中的应用,包括提升供应链安全水平,解耦云计算算力服务和硬件基础设施之间的绑定关系。
随着云计算不断发展,“东数西算”工程持续推进,未来几年,与云计算相关的技术和能力会继续更新迭代,在整个以算力为主导的行业数字化发展过程中,支撑更多企业、政府单位在整个数字化转型中走得更快、更远。
(来源:新视线)