2023年1月17日,Franz Edelman Award全球总决赛名单公布,华为云凭借领先的云资源调度技术和优异的市场表现入围决赛六强。Franz Edelman Award是美国运筹学与管理科学学会(INFORMS)设立的管理科学应用方面的最高奖项,被誉为运筹学的“奥斯卡”。这是该奖项设立50年来,全球首次有云计算公司凭借调度技术入围。
云资源利用率最优且保证服务质量是业界公认的云资源调度难题,华为云在云资源调度技术上业界领先,针对媒体网络资源调度难题,通过一系列创新算法应对挑战,实现媒体网络利用率优化超过30%,同时,提高了QoS服务质量,两年内业务规模增长10倍,位居业界第一。
领域科学家助阵,通过创新算法,求解业界难题
华为云在云资源调度研究方面,重点投入了16个海内外研究所、39位科学家。针对”95峰值带宽计费模式下,资源利用率最优且保证服务质量” 的媒体网络调度课题,华为云集结了算法创新Lab首席科学家袁晓明教授等诸多顶尖学者与直播业务的专家一起深入该课题的研究。分别针对离线和在线问题设计算法,在问题求解过程中,发现两大难点:
首先,此类优化问题的目标函数数学性质很差,这是一个NP难问题(NP-hard problem)。其次,华为云的直播业务规模很大,涉及到2800多个边缘节点,导致相应的数学模型的整数和连续决策变量多达1200亿个。因此,现有的通用算法求解器无法求解。
此外,在媒体网络调度的实际应用场景中,要求调度算法能够在毫秒级的求解时间内给出精确的调度方案,这使得算法设计十分困难。
针对以上难点,专家团队首先建立了一系列数学规划模型准确刻画了此类问题,为学界的进一步研究提供了基本范式。其次,以“量身定制算法”为基本指导思想,以“算子分裂技术”为基本框架,深入解剖并分析模型的结构和数学特性,“分而治之“地将原问题进行巧妙的拆解,从而设计出子问题易求解、易实现、高效率、稳定性好的原创算法。数值实验结果显示,通过这一系列的算法实现了媒体网络利用率优化超过30%,同时改善了拉流成功率、百秒卡顿时长、首帧时长等QoS用户体验,处于业界领先地位。
除了95计费课题,在调度方面,华为云还有一系列的技术创新,如业界领先的最短路径Mksp算法、业界首创的大云协同调度、高阶服务协同调度等算法,共计产出专利30多篇。
华为云媒体网络调度系统,助力直播业务增长
攻破了业界难题后,华为云自研了媒体网络调度系统,应用于斗鱼、虎牙等中国头部互联网直播平台。综合考虑体验、质量和成本,设计了网络流量模型和重保直播活动调度方案,有效应对突发流量涨落,稳定可靠地保障了世界重大体育赛事直播60余场。实现直播业务QoS服务质量业界领先,拉流成功率100%,端到端时延2-3秒,超低时延直播时延小于800毫秒,直播秒开,无卡顿,助力直播平台带宽使用量两年内增长10倍。
华为云调度能力赋能千行百业
媒体网络调度系统不仅应用于直播,还应用于如点播、SparkRTC、云会议、云桌面等媒体分发场景。面向3D互联网场景,调度系统在算网融合的媒体算力网络上将发挥更大能力,应用于数字人直播、企业3D空间等华为云MetaStudio业务,全面提升华为云媒体服务能力。
同样,华为云在能源、交通、物流、零售等行业场景中也应用了调度能力。如助力深圳机场靠桥率提升10%,每个廊桥一年内为260万旅客省去了坐摆渡车的麻烦。同时,机位分配的时间缩短为1分钟;助力天津港实现整个港口计划效率提升144倍,设备利用率提高15%,堆场翻倒率减低20%,大幅度地提升了港口运转效率和作业效率。
在“一切皆服务”的战略下,华为云将运用调度能力为千行百业创造更多价值。
(来源:新视线)