由亚马逊云科技主办的 AIGC Day 于 2023 年 3 月 24 日在上海成功举办。此次会议旨在探讨生成式 AI 的最新技术动态和行业实践,来自 Nanolabs、Deloitte、Adobe 和 Translai 等企业的演讲嘉宾出席并分享了各自的经验和观点。Translai 创始人兼 CEO 白双在会上发表了题为《从 AIGC 探讨语言科技的无限可能》的演讲。
白双毕业于巴黎索邦语言科学和巴黎高翻(ISIT)翻译应用学专业。她在演讲中从语言科学的角度分析了 GPT 大语言模型的发展趋势,以及 AIGC 对语言服务市场带来的变革。此外,她还分享了 Translai 创业历程中的经验和故事。
大语言模型,正在往模拟人类语言中枢的方向走去
人类语言处理的过程分为输入、理解、输出三个阶段。
过去的弱人工智能已在输入(听、看)、输出(说)这两个环节实现了单点能力的突破,例如语音识别(ASR)、图像识别(OCR)和语音合成(TTS)等技术。
然而,AI 在理解这一环节表现出的能力相当有限,只有基于 RNN 的机器翻译在过去几年中获得了一定程度上的进展,并引申出了译后编辑 PEMT(Post-editingmachine translation)的翻译模式。但总体来说,在 GPT 大语言模型出现之前,AI 在「理解」这一环节的能力非常弱。
GPT 大语言模型本质上实现了「处理」这一环节由量变到质变的提升,它可以在自然语言处理的层面上生成、分析提取和润色内容,并由此衍生出了许多智能写作工具,让人机协同也可以应用到单语言场景中。
与此同时,输出端也呈现出多模态(multimodal)的趋势。文转图(Text-to-Image)和文转视频(Text-to-Video)技术正在逐步走向商业化场景,这进一步加强了「输出」这一环节的能力。
“ GPT 大语言模型从 GPT-3.5 到 GPT-4 的升级,本质上是从「文字输入-文字处理-文字输出」的演变到「多模态输入-文字处理-文字输出」我们似乎可以预见 GPT 未来的发展方向,大概率是朝着「多模态输入-文字处理-多模态输出」走的,因为这正是人类语言中枢的运作方式。”白双说。
三年前,我们进入了「人机协同」语言服务赛道
“生成式 AI 对我们最大的助力是:市场被加速教育。这对 Translai 而言,是一个不可复制的机遇。过去,我们需要向市场解释为什么需要「人机协同」,而如今,没有人会再质疑「人机协同」的必要性。利用认知差,我们为 Translai 争取了三年时间,用于产品打磨和寻找 PMF。现在是全面进入市场的完美时机。” 白双说。
Translai 成立于 2020 年初,也是疫情刚开始的时候。在过去的三年里,Translai 经历了两次商业模式迭代和一次大的产品架构重组。
从最初的视频翻译软件工具(Transflow)到视频翻译服务云平台,再到如今能够实现覆盖文本、图文、音频、视频多种媒介形式,可灵活构建 40 多种服务场景的 PaaS,并搭建了一套自研无代码业务中台和全球语言人才库。
如今,随着 AIGC 技术的到来,Translai 无代码业务中台能力得到了进一步增强。在保留原有架构的基础上,Translai 借助 AIGC 的能力得以构建出一个完整的人机协同语言中枢。除了翻译场景,Translai 已将业务边界拓展至各种单语言处理场景,如配音、文案写作、虚拟人呈现等,并面向已服务的客户群体开放,客单价由此呈现了倍数级增长。公司也将在近期进行新一轮的品牌升级并完成新一轮融资。
语言服务行业即将发生的三个变革
1.「人机协同」生产力模式
在语言服务行业,纯人工模式,或者机器翻译+人(也称为译后编辑,英文是 Post-editing machine translation, PEMT )将逐步过渡到真正意义上的「人机协同」。
“语言服务本身就是天然的 B2B 市场需求,企业客户要的是精准的、结果导向的服务,目前 AI 的能力还完全达不到企业客户对质量的要求,人机协同是必然。”白双说道。
「机」绝不只包含机器翻译,也不只包含飞速发展的 GPT 大语言模型,还将包括其他的生成式 AI,如虚拟人,文字转图片(可以应用到图片类的创译翻译,英文叫做 Transcreation)以及其他常见的 AI 能力,如语音识别,TTS 等等。从而覆盖文本、图文、音频、视频多种媒介形式。「人」也不仅包含翻译这一个工种,而是拓展至文案编辑、美工、配音、数据标注等多样化技能工种。由这些语言专家与 AI 协同完成各类单语言及跨语言处理,面向企业提供精准的、以结果导向的多样化语言服务。
2. 服务模式全面数字化升级
全球有近 20 万家语言服务商(LSP)为企业提供语言服务,但绝大部分缺乏数字化能力,仍以纯人工、CAT+人、PEMT 为生产力, 并借助外部协同工具实现项目管理,这种方式需要在多个软件间跳转,大量项目经理参与,人力成本高昂,从传输到生产再到交付无法实现数据的有效流转,导致大量优质语言资产被浪费。与此同时,服务同质化导致许多服务商被迫卷入价格战和恶性竞争。
为保持竞争力,语言服务商必须进行数字化升级,积极拥抱 AI 和数字化技术。在这次活动中,白双透露,出于公司对语言资产的战略性布局考虑,Translai 近期将推出「语言服务商数字化升级引擎」这款产品,帮助缺乏技术能力的小型语言服务商实现一键数字化升级,提高他们在长尾市场中的竞争力。
3. 劳动力结构升级
AIGC 的到来将会淘汰仅具备基础语言能力的从业者,但对那些具备语言和专业背景知识的人才的需求会增加。
语言处理是一个理解再输出的过程,所以理解是首位的。一个人的语言能力再好,不具备相关专业领域知识也无法为企业提供优质服务。过去这类语言人才的薪资较高,但传统语言服务市场价格战导致他们没有动力做兼职。
随着 AI 的加入,相同时间内会有更多的产出,同时时薪也会增加,这将吸引更多专业化语言人才加入。
“当更优质的劳动力被释放,语言服务趋于数字化,这意味着客户可以以同样的价格享受到更高质量的服务,甚至以更低的价格享受到更高质量的服务” 白双说。
中国原生,走向世界
自 2022 年 7 月上线以来,Translai 已直接为近百家全球客户提供数字化语言服务,其中包括多家世界 500 强企业。客户使用 Translai 的服务后,相继将其推荐至其亚太区及总部,并达成长期合作。
“由此我们看到了Translai巨大的国际化潜力,这也成为 Translai 今年落地日本的主要推动力。回想一路走来,每一次大的升级都是因为我们听到了来自市场的声音。” 白双说。
如今,Translai 海外版已于 3 月底正式上线,日本将作为首个海外试点打造样板市场。
Translai 的天然人机协同模式将在为客户提供服务的过程中积累大量高质量的行业化语料,并将基于 GPT 大语言模型进行 Fine-tuning,构建小模型。在循环赋能全球中小型语言服务商和行业头部企业客户的同时,构建起有效的语言数据资产护城河。
“三年创业之路,我们不断见证原生创新越发强大的生命力,诚邀各位与我们一起,继续见证在 AI 迅速发展的大时代下,属于语言科技产品的无限可能。” 白双在演讲的最后说道。
(来源:新视线)