数据标注,正迎来关键洗牌时刻。近日,量子位发布《中国AIGC数据标注全景报告》,报告提到大模型从训练到部署应用迭代,AIGC众多垂直场景落地,通用智能、具身智能等前沿领域探索,都与高质量、专业化的场景数据密不可分。
作为基础服务,数据标注也从未像今天这样受到关注。尤其是作为新兴赛道地合成数据服务,潜在市场空间巨大。据量子位智库预计,国内AI基础数据服务市场规模将达百亿规模,约占全球市场10%份额。其中合成数据作为衍生出来的新赛道,存在巨大市场空间,增速超40%,成为增速最快的细分赛道。
所谓合成数据,即是用计算机视觉以及图形学等技术生成数据而非通过原始数据的采集而产生,能够用来训练、测试和验证大模型以及各类智能体所需的算法等应用。OpenAI CEO Sam Altman曾放言:未来所有数据都将变成合成数据。
作为仿真数据,合成数据服务具有几大显著优势,首要的自然是能降本增效外。根据《中国AIGC数据标注全景报告》显示,合成数据典型服务商代表是群核科技旗下的Coohom Cloud(群核云)平台。作为合成数据服务平台,Coohom Cloud(群核云)可以将效率提升10倍,基于GPU集群并发渲染优势,每日可合成20万组数据,而且基于庞大的数据集优势,训练成本大大降低。
此外,合成数据可以补充更多边缘、长尾场景数据,能有效解决大模型时代下的“数据鸿沟”,并自然规避掉数据隐私安全、合规等方面问题。像在数据增强、模型验证、可解释AI等领域,以及自动驾驶、机器人、生物医药等领域都有相关应用。量子位智库预计,合成数据将成为未来增速最快赛道,年增⻓率可达45%。
目前,作为目前为数不多提供室内场景数据服务的代表厂商,Coohom Cloud(群核云)能针对智能机器人、人工智能、元宇宙、智能房产、自动驾驶等不同应用场景合成2D、3D数据集,客户覆盖全球,服务科沃斯、追觅、美的多家海内外科技巨头公司,并与英特尔在产研等开源性项目上进行深度合作。
Coohom Cloud(群核云)的一大优势是拥有全球最大的室内场景认知深度学习数据集,以及Structured3D室内环境认知数据集、RPLAN户型结构数据集等。在底层技术创新上,群核科技的相关技术研究多次入选SIGGRAPH、CVPR、ECCV等国际学术顶会。在产业垂直场景中,Coohom Cloud(群核云)已具备领先优势。
Coohom Cloud(群核云)已有两大成熟解决方案。KoolAI便是依托群核科技海量室内3D虚拟场景的AI训练合成数据平台,依托背靠群核科技前沿实验室,为企业提供空间场景的多样性合成数据。SE是针对机器人尤其是室内智能机器人行业推出的云3D室内环境重建平台。基于云计算及云服务能力,通过真实感绘制、大规模云端计算集群及云端机器人应用程序部署及管理模块,帮助重定义云端机器人开发和仿真流程。此外,Coohom Cloud(群核云)团队也位企业提供数据定制和专属服务,最大化满足各行业对于数据多样性的需求。
今年年初,群核科技联合英特尔实验室、西班牙计算机视觉中心、慕尼黑工业大学开发的SPEAR智能仿真平台正式面向开发者开放。这个真实感绘制的智能体仿真平台可帮助开发人员加快对不同智能机器人的训练和验证,并推动机器人在人机交互、数字孪生等方面的研究和应用。
随着人工智能产品应用更加多元和复杂,行业对AI服务的灵活性和智能化的期待也更强烈。如何为更多行业和新场景的AI应用提供高质量数据,这是Coohom Cloud(群核云)接下来深挖和探索的方向。
(来源:News快报)