新浪新闻客户端

智能数据时代的大变迁,大模型数据平台重铸万亿蓝海市场

智能数据时代的大变迁,大模型数据平台重铸万亿蓝海市场
2024年01月18日 16:15

  大模型时代到来,以数据为中心的AI开发模式加速走向台前,数据的价值将得到更加充分的深度挖掘。

  大模型从训练到部署应用迭代,AIGC众多垂直场景落地,通用智能、具身智能等前沿领域探索,都与高质量、专业化的场景数据密不可分。

  作为底层基础服务,数据标注也从未像今天这样受到关注,但与此同时机遇与挑战随之而来。

  最典型的挑战以及发展将紧密围绕着以下几点:

  1、数据标注服务贯穿大模型全生命周期,上下游合作关系更为紧密耦合;

  2、大模型范式涌入数据标注,自动化标注效率进一步提升;

  3、标注人才高学历多领域成硬指标,缺口或达百万;

  4、产业链重构,专业数据服务商更多机会将在垂直领域,帮助企业私有化部署;

  5、传统依靠渠道人力等因素聚合飞轮效应已失效,数据标注朝着知识密集型转移;

  而围绕着大模型数据解决方案多处开花,以一站式、定制化服务以及降低自动化标注⻔槛这一关键核心商业应用问题上,在以Snorkel AI等全球头部智能企业的加速下,都在纷纷抢滩占领整个行业的研发进度或者大规模商业应用。

  大模型时代的到来,正加速推动人工智能开发从以模型为中心朝着以数据为中心的方向转变。

  从目前行业的数据流程上来看,传统数据标注是以目标任务为导向,通过拉框、描点、转写等方式进行人工或自动化标注,评价标准主要以准确率和效率为指标。而大模型数据标注,则是按照阶段来划分,通常对自然语言要求很高,这就促成了合成数据作为新衍生赛道,正受到广泛关注。

  国际相关机构的普遍分析都指出——合成数据将成为未来增速最快赛道,年增⻓率可达45%。大模型公司/AI企业自建数据处理管线,并对外输出大模型数据解决方案,产业链重新洗牌。部分厂商还具备云服务能力,可与数据服务打包输出,能有效建立起客户之间的口碑和信任。

  这或许就是未来大模型数据平台的发展的一条重要方向,而根据国际量子机构的预测——大模型数据平台将主导数据标注产业的洗牌主导权,更高质量、专业化的数据标注成为刚需。未来五年,国际AI基础数据服务将达到万亿规模,年复合增长率在47%左右。

  (来源:News快报)

责任编辑:何奎良

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2024 SINA Corporation

All Rights Reserved 新浪公司 版权所有