对大多数职场打工人来说,看数据、用数据一直是项有“门槛”的工作。
特别是在企业业务快速发展的背景下,为了让参与项目决策的员工、管理层尽快看到业务相关数据(通常包括核心业务汇总数据、业务一线明细数据等),数据团队往往需要竭尽全力应对数据需求,从而导致数据岗位人员、数据开发设备等在内的多项资源成本压力。
另一方面,企业业务系统自带的数据看板一般无法满足直接看数据的需求,因此数据岗位员工会选择手动下载明细数据,并在Excel等本地文件中进行汇总分析操作;当面对繁重的需求量时,往往只能做一些简单自动化数据处理,再加载到关系数据库(例如MySQL、SQL Server、Oracle等)中,通过SQL代码方式实现基础加工处理和呈现。
但无论是Excel处理还是SQL代码处理,都无法避免因为涉及多层级/多部门跨越,而造成的角色使用数据范围差异、数据实时性差、数据分析看板不易读、美观度差等系列问题。
为了更好地提升企业员工在取数、看数、用数环节的体验,火山引擎数智平台VeDI目前已经面向企业级用户推出智能数据洞察DataWind。
从产品架构上来看,DataWind可以分为数据源、存储计算引擎、数据建模、数据分析和数据应用五大版块。
值得注意的是,数据在应用端做数据分析时需要分析引擎加持,DataWind可依据企业特征支持两种不同模式:一种是产品内置存储的计算引擎ByteHouse,可以支持千亿级别大数据量的自助分析,数据显示,在大多数分析计算场景(分组、占比、对比、排序等)下,ByteHouse查询引擎计算速度相较普通分析引擎至少能够提升百倍以上;而另一种则是直连引擎,它可以直接与数据库交互,当企业的数据库性能足够的情况下,可以选择使用。
从数据连接上来看,DataWind可支持从业务数据库、Excel/CSV、飞书上业务数据填报、外部平台数据(比如广告域、内容域、微信生态等),以及实时/离线数仓等40多种途径完成数据链接。
在数据处理方面,DataWind着力于尽可能降低操作门槛,比如提供「AI+BI」的可视化建模服务,在此基础上,企业员工可以在数据分析环节实现可视化拖拽式操作,同时DataWind还能够自动将数据代码解析为可视化图表。
此外,在面向应用端方面,DataWind早已可实现多端应用,与目前市场流行的多种IM办公产品深度集成,比如飞书、钉钉、企业微信等,保障用户在移动办公场景下,依旧畅享实时数据在线上传、查看、分析、处理、应用等多种服务。
从一定程度上来说,火山引擎数智平台DataWind集合了当前字节跳动在内部多业务多场景上的智能数据洞察实践能力,并完成了产品式输出,截至2022年12月,该能力已经在互联网、汽车、零售、金融等多个行业在内的多家标杆企业获得应用实效。
(来源:新视线)