随着技术的升级迭代,人工智能技术研发也正在逐渐从已有的瀑布式开发转变为敏捷开发,MLOps(Machine Learning Operations)等模式应运而生。AI工程化能力的高低很大程度上取决于AI生产运维管理水平,而MLOps为AI工程化落地的团队协作难、过程管理乱、业务交付差等3大难题提供了最佳实践和解决方案。近日中国信息通信研究院发布的《人工智能研发运营一体化(Model/MLOps)能力成熟度模型 第二部分:模型交付》更是标志着行业在MLOps模型交付阶段已取得阶段性进展。
目前,各行各业都将AI工程化能力作为智能化转型比拼的基础,智能时代下的数据迭代进程也随着技术的发展各有侧重。在云测数据总经理看来,智能时代下的数据迭代进程一般要经历算法预研期、算法研发期再到算法持续优化期三个阶段,对数据的要求也在不断深入。
阶段一:算法预研期(数据产品),阶段特点:1、基于成品数据集快速得到验证;2、对传感器及场景要求较低;在此阶段,需要需要行业基础数据集。
阶段二:算法研发期(定制数据服务),阶段特点:1、应用场景及传感器明确;2、需要大规模的场景化优质数据进行算法迭代;
阶段三:算法持续优化期(数据产品+持续数据服务),阶段特点:1、模型及迭代方法论已趋于成熟;2、算法处理生产环境数据;3、持续通过生产环境数据迭代算法;
在数据迭代升级过程当中,每一个阶段的算法皆有其特点,都是迭代过程中的重要一步,通过数据的升级迭代,可以帮助企业完成AI工程化,让人工智能实现更快的产业落地。
数据推动AI的工程化实践进程
中国人工智能产业正进入快速增长阶段,AI领域专业化和细分化程度将进一步提升。在人工智能概念热度和巨大的市场前景背后,一个成功的AI应用势必更多的来自于精准大量的训练数据,诸如自动驾驶、工业制造等智能应用场景越来越复杂,因而,高质量、精细化的数据将直接影响未来AI的工程化实践。
作为人工智能数据服务领域头部代表厂商,云测数据也在积极推动相关行业标准化工作的建设,积极参与《人工智能研发运营一体化(Model/MLOps)能力成熟度模型 第二部分:模型交付》的标准编写。
云测数据在早期就已关注到AI数据服务的需求缺口和潜在的应用市场,立足高质量、场景化的AI训练数据服务,率先形成AI训练数据的“采、标、管、存”一站式服务,实现了从“数据原料”到最后的“数据成品”全链条打通并通过数据产品、数据处理工具与数据服务的“三螺旋”,为智能驾驶、智慧城市、智能IOT、智慧金融等行业提供高效率、高质量、多维度、场景化的数据服务与策略,最大化发挥训练数据的价值,为人工智能场景化落地输送更多数据支撑。
云测数据认为,AI最终是为了落地、为了被使用,所以对于AI所需的数据质量要求会更高更精准。其面向AI工程化率先推出的新一代数据解决方案,硬核实力在于——可在保障数据安全的基础上,加速AI企业算法模型开发周期,在AI数据训练过程中综合效能可提升200%以上、数据交付质量最高可达99.99%标注精度、助力企业降本增效。同时提升数据管理、场景库管理能力,帮助运用人工智能的企业对数据资产加以沉淀、安全管控和风险治理,提升企业AI治理能力,推动挖掘更加多元化的AI价值。
以自动驾驶领域为例,通过采用云测数据标注平台,可实现车企DataOps数据闭环中数据清洗、标注工作,与原流程相比提升2倍流转效率。
总结:
作为人工智能产业的内部驱动力,数据、算法和算力三大要素对人工智能技术的升级发展一直至关重要。以数据为例,由于人工智能技术以有监督学习的模型训练方式为主,在产业蓬勃发展的背后,数据作为技术发展的基石,不断发挥着越来越重要的作用。在这场面向AI行业未来发展的浪潮中,会有更多如云测数据的厂商,以硬核实力叩开人工智能落地的未来之门。
(来源:新视线)