1.应用交付的困境
“运维资源有限,
很难实现对设备的细致管理,
平时也就看看资源消耗情况,
出了问题只能找厂商!”
应用交付设备承载着企业的关键业务,实现多中心调度、业务发布、应用和链路负载等功能,是衔接网络和应用的纽带。实际部署中,应用交付设备会分布在互联网区、内网核心区、外联区、办公区等区域,为不同类型的业务提供业务分发和负载均衡。应用交付设备在日常运维中面临着一些痛点,近日,在一次内部交流活动中,来自各大机构的网络负责人纷纷描述了自己工作中的困境:
一位负责人表示:“我们的数据中心部署了很多的应用交付设备,但是由于运维人员数量有限,对于应用交付设备的监控还停留在设备资源消耗层面。排错往往需要依赖于厂商的帮助,排错效率较低。对于设备的运行状态和配置的检查,厂商会按季度或者在重大事件节点前进行巡检,有问题只能等着厂商来解决,太被动了,希望能有一套智能化的系统让我们自己也能进行常规检查。”
2.应用交付的困境
“花了一年时间
才把之前的应用交互关系搞清楚,
新应用一上,
访问关系又要重新梳理。
排错时业务流量的对应关系
也是很大的挑战!”
还有一位领导表示,“我们对于设备监控和关键指标监控做的还不错,但是对于应用交互关系完全是盲区,业务端经常投诉应用慢让我们查问题,但应用端中间节点太多,我们只能凭经验进行排查。今年我们专门安排一个同事来做业务画像,想把应用调用关系搞清楚,以后排障至少能知道往哪个路径去查,结果现在都四季度了还没搞完整,这又碰到一批新业务上线,更混乱了。”
“还有排错问题,涉及多中心、多网络区域应用交付设备联合故障排查排错难度较高。而且流量经过应用交付设备后通常会进行地址转换,即使我们获取了网络端的数据包也无法将前后端流量实现对应,只能再回到登录设备进行人工抓包分析的老路上。”
“有没有一个工具既支持自动导出应用交互关系,出了故障又可以先让业务部门自助查询的呢?”
以上都是许多客户迫切需要解决的问题。
3.灵珑应用交付管理平台全新发布
如何高效解决以上难题?智维数据的技术团队认为:我们通过应用交付设备的API接口、高速日志、遥测等多维数据获取设备的配置、状态、以及所承载的业务信息。智维数据应用交付管理平台“灵珑”通过网络视图、自动化监控、日志检索等大量实用功能帮助用户实现基本的配置管理,告警管理和统计管理功能,同时还创新性的实现了基于多台设备配置和流量的业务关联关系画像,使访问关系和每一条业务流真正“活”起来。设备自主巡检以及结合智能分析平台的根因定位功能,则能够实现配置优化,提升故障的感知和排查效率。
以下我们通过几个场景来详解“灵珑”的强大能力:
场景1访问路径与业务画像
针对互联网业务,用户访问过程分为DNS解析和业务访问过程。运维人员可以通过输入业务域名,即可清晰的列出域名对应的业务地址,以及业务从互联网接入区到DMZ区访问关系的关键路径,实现了以业务为单位的互联网路径梳理。业务访问关系可以根据固定格式将每层配置详情一键导出,方便用户查询。
针对内网业务,“灵珑”可以通过收取高速日志信息,同时结合用户的CMDB信息,描绘出内网业务模块之间的访问关系。帮助运维人员理解调用关系和某个服务故障的影响范围。
场景2应用交付配置优化
应用交付设备承载着企业的关键业务,应用交付设备上的配置对业务的平滑交付起着至关重要的作用。在实际使用过程中,应用交付设备上会存在配置不优、下线业务没有及时回收资源、未引用配置、健康检查颗粒度较粗、安全基线没有严格执行等问题。
通过“灵珑”的配置优化功能,可以及时发现以下线待回收业务和闲置配置。针对业务和健康检查层面的配置以及设备自身的安全基线,给出优化建议,保障业务高效运行。
场景3自助巡检
在实际运维过程中,用户对应用交付设备会进行周期性巡检或在重大事件节点前进行巡检,以保证设备处于健康状态。巡检动作需要工程师手动完成,基于历史经验输出巡检结果。灵珑应用交付管理平台集成了智能巡检功能,用户可根据需求在任意时间进行部分或全量设备的巡检,降低了人工巡检的时间成本,解决了巡检过程中工程师经验的影响,实现标准化巡检。
场景4主动拨测分析展示
当客户收到来自业务端的报障和投诉,但从数据中心内部的监控体系看业务状态却显示正常,这种现象与单纯的从服务端视角进行监控有关。为了实现更加完善的监控体系,需要同时从客户端视角和服务端视角来对业务的可用性和响应的灵敏度来进行监测。
“灵珑”通过拔测节点模拟客户端访问,及时发现域名解析、网络建连和业务访问故障,针对内网应用,通过逐段探测与业务画像的结合,能够确定影响了业务整体可用性的环节。灵珑平台可以实现不同拨测场景的可视化展示,直观展示故障状态和访问延迟情况。
主动拨测主要应用的范围包括故障自动定位、服务质量优化、自动化验证、多协议栈监控、竞品分析和智能运维。
故障快速定位: 用于判断业务的可用性状态。能够对业务故障、业务恢复和业务闪断等显现做出明确的提示,更加准确的定位故障的影响范围。
服务质量优化: 关注应用的通断状态,以及业务的响应时间。客观展示应用的响应情况,可以实现针对性的应用优化。
多协议栈监测: 主动拨测节点可以针对IPv4/IPv6等不同协议栈进行探测,并针对服务质量进行可视化对比分析。
竞品分析: 用户可以通过添加对标企业的应用地址,通过对别业务延迟来实现用户体验的对比,达到竞品分析的目的。
场景5故障智能分析
应用交付设备与网络和应用均有着紧密的联系,故障发生时需要从设备自身、网络和应用等多个维度进行思考和排错。排错过程对运维人员要求较高,排错周期较长,因此会对业务的连续性造成较大的影响。灵珑应用交付管理平台与nCompass流量分析平台联动,通过配置、日志、流量等多维度数据的联合分析,针对常见故障实现快速的定位,并根据智能分析引擎给出问题的根因,极大的缩短了故障恢复时间,提升了排障效率。
4.灵珑应用交付管理平台
应用端到端全流量可视化,分钟级故障定位,
应用交付排错不再困扰!
从以上场景我们可以看到“灵珑”的能力,平台结合配置、日志、遥测、网络等多维度指标,帮助用户实现配置的有效管理和优化,针对业务故障能够快速定责,助您轻松实现应用交付设备的高效管控。
试用过该产品的用户这样评价:
“灵珑应用交付管理平台能快速有效的将多台设备管理起来,提供的功能也全是实实在在能帮助到我们的功能。通过每天和每周的巡检,能够让我们快速了解设备的健康度。出了故障,通过可视化的路径分析能够快速跟踪出故障节点。在运维人员少管理设备多的情况下,大大提升了我们的运维效率。”
“以前人工花一年都摸不透的业务画像,现在通过‘灵珑’五分钟就能生成互联网业务发布统计表,业务访问关系清晰明确,为我们运维排障厘清了验证方向。而且现在有了问题业务部门可以第一时间通过自查询应用访问路径,我们的工作量也大大减轻了。”
灵珑应用交付管理平台上手简单,能大幅提升工作效率,欢迎联系智维数据,了解产品详情。
(来源:新视线)