20世纪60年代开始,数据中心成为企业IT基础设施最重要的组成部分。到90年代,伴随云计算发展起来,企业开始尝试通过分布式计算来处理计算任务,实现计算存储的即时共享。到近几年,物联网用户持续增长,人工智能等技术的不断发展,分散式边缘计算成为企业赢得数字化时代的关键支撑。
扩展至云提供商、托管设施、边缘设备和边缘计算,广义数据中心的边界逐渐模糊,相伴而生的是越来越多的复杂性——性能、可靠性、合规性、安全性等各种因素,使混合计算环境更加难以管理。这其中,如何应对边缘计算的运维管理难题已成为企业面临的重要挑战。
日前,中国电子学会节能减排工作推进委员会副秘书长、正高级工程师郭丰、星展银行(中国)有限公司科技及营运部首席运营官杨维凯、施耐德电气关键电源业务部数字化产品经理孙博雅做客数据中心《Future Talk》栏目,围绕“边缘计算数据中心的高效运维管理”话题展开分析和探讨。
从云到边缘的协同演进
现在云到边已经逐渐成为企业部署的新趋势,“章鱼式”是在业界对云到边模式非常形象的比喻,章鱼全身都分布有神经元,脑部占40%,其余60%分散在腿上,这种1个大脑总控协调+N个小脑分散执行的结构,与中心云+边缘的架构非常相似。
在这一架构中,云和边各司其职互相作用。云计算凭借强大的数据中心,为业务应用提供弹性扩展的计算、存储、网络等能力,适用于非实时、长周期等业务场景。边缘计算则聚焦实时性、短周期、本地决策等业务场景,比如音视频直播、物联网、元宇宙等,将工作负载下沉至离终端设备或者靠近最终用户的地方,实现更低的网络延迟,提升用户的使用体验。
5G、物联网技术带动了视觉识别、自动驾驶等一系列对数据处理时延要求较高的需求,传统数据中心在处理这些业务在时间上不能及时响应。郭丰认为,边缘数据中心可以很好地帮助时延要求较高的数据处理业务。
作为数据中心基础设施建设和数字化服务的全球领导者,施耐德电气根据基础设施环境特点将边缘计算分为三类:第一类,IT环境,即专门的IT或计算设备空间,比如服务器机房,企业网络的配电间,小型数据中心等,这些空间基本是按照标准机房进行建造,环境、洁净度都较好;第二类,商业办公环境,比如办公区域、仓储物流中心等,可能会有温湿度、噪音、粉尘等方面问题;第三类,工业及恶劣环境,比如生产线、仪器仪表间等,这种场景设备大多暴露在工厂里,环境物理威胁压力较大。
“这些都是典型的边缘计算场景,会因其分散的分布、不够友好的环境和无人值守等都为运维带来挑战。”孙博雅进一步补充道。
作为边缘计算部署的代表企业,星展银行是在中国第一家拥有自主运维的IT机房全面采用物联网传感器的外资银行。星展银行是亚洲领先的金融服务集团,业务遍及19个市场,于1993年在北京设立驻华办事处,并于2007年5月成为外资银行中首批在中国本土注册的外资法人银行之一。星展中国分支行网络和业务迅速发展,在中国目前有12家分行,22家支行。
秉承“所有管理决策用数据说话”的原则,星展银行在数字化升级方面进行了多方面的探索实践。杨维凯介绍,近年来,星展银行持续探索利用创新技术和数字驱动来提高生产力,并注重在日常运营中降低能耗、保护环境。在2023年,星展银行为所有机房都通过安装传感器将机房管理数据化,并通过边缘计算在风险管控、环保可持续和采购优化等层面获益。
技术应对边缘计算运维挑战
虽然大多数企业已经看到边缘计算的优势,但是韧性、安全、可持续仍然是混合环境面临的重要挑战。
“边缘计算一般靠近业务,首先环境是比较大的挑战,其次是运维规模的增大对操作人员的专业要求更加严格,最后是边缘计算的负荷变化较大,这对基础设施的调控能力也提出更高要求。”郭丰表示。
具体到运维层面,最常见的问题聚焦于基础设施复杂度增加、100%可用性要求、资源有限、监控工具多、多场地分布等。
对此,星展银行遇到最直接的运维挑战,也是来自人力、风控,以及可持续。杨维凯表示,分布的网点靠人力检查不仅效率低,一旦风险发生,反应也会不及时,通过边缘计算节点可以更好更科学管理。
针对人力、专业知识、供应商繁多这些典型问题,孙博雅认为,包括最终用户、设备供应商、运维服务商等在内的各种角色需要利用数字化管理工具,形成生态协同才是破解问题的关键。
此前,星展银行就通过与施耐德电气合作,在2023年初,分行和支行完成了477个物联网传感器的部署,实现了三个方面的提升:
第一,降低风险和提高生产力。对于银行来说,安全性与风险管理至关重要,借助施耐德电气EcoStruxure IT基础设施专家(ITE),星展银行有效避免了因误报警造成的大量现场检查工作。过去传统的环境监测系统(EMS)只能告知是否触发了阈值警报。现在借助物联网传感器,员工可以实时监控这些指标及其历史记录和发展趋势,以确定这些是否确实是真正的警报。在使用新系统运行后的前三个月,星展银行成功识别并过滤出超过70%的误报警。
第二,提高可持续性。过去,为了确保温度条件不超过报警阈值,一些现场用户可能会在温度设定点上过度补偿,设置温度远低于实际所需温度,导致服务器机房被不必要地保持低温,用户只有在定期预防性维护计划期间前往现场时才能纠正这些情况。得益于施耐德电气IT基础设施专家(ITE)的加持,用户可以实时监控现场温度,并及时纠正任何过度补偿,以避免能源浪费。
第三,采购与成本优化。传感器在延长设备使用寿命方面也发挥着重要作用,例如,通过收集每个站点的UPS实际负载数据,星展银行能够基于采集的数据来确定适宜的UPS功率,以达到运营目的,而不会造成过度补偿。同时,这也有助于银行更好地规划 IT服务器机房规模的不动产要求。
数字化赋能的边缘进化
数字化已经渗透到各行各业,数据中心也不例外。数据中心本身是提供数字化赋能的基础,同时数据中心本身也是数字化的用户。郭丰认为,数字化可以提高管理的效率、给边缘数据中心提供了互相协同的方法、降低成本。
以数字化升级为导向,在所有IT服务器机房中采用物联网传感器让星展银行看到了切实的效率提升及环境效益,这也是星展银行数字化转型战略的重要一步。星展银行将继续在运营中探索和利用技术、推动绿色运营,特别是在数字化驱动的管理。
“结合EcoStruxure EAA(远程专家服务)与EcoStruxure ITE(基础设施专家)的数字化服务可以为客户提供专业团队、设备专家、云平台等多重支持,让运维高效的同时更可降低服务成本。”孙博雅说,ITE支持设备数据可视化展示、及时报警,用户也可以通过APP及网页端随时随地访问。同时还有多款接入网关,Dera和Kit系列适用于任何场景的集中式接入网关,从边缘设备、单个机柜到大型数据中心;ITE Card 4G网关,可连接单个设备,适用于设备分散且无组网条件的边缘站点。EAA可提供全天候在线资源及专业知识,通过远程专家的主动监测以及前瞻资产洞察,进而提供问题诊断和解决方案。
边缘计算作为新型基础设施之一,一直在持续进化,为不断涌现的新业务、新模式提供着算力支撑。谈及未来趋势,郭丰指出自动化、无人化、智能化将是其未来发展的重要方向。
孙博雅表示,只有将边缘设备上的数据和AI等数字化技术结合起来,才能真正释放数据的价值。施耐德电气正在积极布局,将大数据、人工智能等技术融入到自身的数字化工具中,持续提升运维效率,降低成本,并不断完善信息安全网络体系,运用创新的数字化服务为客户提供坚实保障。
(来源:News快报)