[环球时报综合报道]“尽管美国占据主导地位,但亚洲制造的人工智能竞赛正在升温。”日本《日经亚洲评论》24日以此为题报道称,中国、越南、日本等国家正加入亚洲人工智能(AI)竞赛,根据各国的本土语言和文化开发生成式人工智能大模型,以摆脱对美国科技公司研发的人工智能的依赖。
越南加入人工智能竞赛
因为拥有丰富的资金和人才,OpenAI、谷歌和亚马逊等美国科技公司在全球生成式人工智能市场中目前处于领先地位。《日经亚洲评论》报道称,这致使全球许多公司都在使用美国开发的人工智能产品。许多正在研发的生成式人工智能大模型都是在英语语料上进行训练的,因为其他语言的数据相对较少,导致在回答涉及其他国家文化、历史和法律的问题时,美国的人工智能模型回答得没有那么准确。
越南通信传媒部近日发布了一项计划——到2025年,越南至少拥有一个越南语大语言模型。越通社报道称,OpenAI推出的ChatGPT开启了各国科技公司之间征服生成式人工智能的竞赛。在此背景下,越南也推出了多款生成式人工智能产品。
其中,第一个向公众开放的越南生成式人工智能大模型ViGPT,在纠正了那些故意设置的虚假陈述后,引起了不小的轰动。ViGPT由越南企业Vingroup旗下子公司VinBigData开发,通过越南语与用户互动。一位美国耶鲁大学教授评价这款人工智能产品称,ViGPT使用越南数据来训练,在对该国问题的回答上,精确度要高于外国竞争对手。
VinBigdata科学总监武河文表示,越南版ChatGPT的上线体现出越南优秀的人工智能技术。这也将助力越南减少对外国产品的依赖,避免提供关于越南历史、文化和政治的虚假信息,同时最大限度地减少数据信息流向国外。
42%的增长速度!
彭博社报道称,全球生成式人工智能市场正以每年42%的速度扩张。预计到2032年,市场规模将达到1.3万亿美元,约为2022年400亿美元规模的32倍。据估计,全球只有约5%的人口将英语作为第一语言,这意味着非英语人工智能大模型潜在需求巨大。
新加坡上个月宣布了一项计划,将针对印尼语、马来语和泰语研发大语言模型。《环球时报》记者此前参观过几家中国的人工智能实验室,基本上也都使用中文语料在训练人工智能大模型。
日本公司也一直在开发日语生成式人工智能。《日经亚洲评论》报道称,日本电气公司去年推出了cotomi大语言模型,日本电报电话公司将于3月份推出基于人工智能大模型Tsuzumi的服务,两个大模型都在日语语境下表现出很高的准确性。
媒体报道称,日本政府联合日本电气公司、富士通、软银等大型科技公司投入数亿美元,开发日语大型语言模型。软银公司首席执行官宫川润一表示,大型语言模型如果了解日本的商业习惯,在可用性方面将更具优势,比如说能以更自然的语言完成电子邮件回复等工作。
去年8月,韩国网络服务公司NAVER推出了为韩语定制的生成式人工智能HyperClova X。HyperClova X将集成到该公司的搜索引擎和线上购物平台上去,帮助用户更高效地找到他们想要的东西。NAVER称,这款人工智能大模型的韩语数据库比ChatGPT的韩语数据库大6500倍,因此可以更自然地生成文本,更流畅地识别语言。
“人工智能技术不应该依赖外国公司”
浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林24日在接受《环球时报》记者采访时表示,各国由于语言不同,其人工智能模型生成的文本也不一样。如果大语言模型是生产力工具,这个生产力工具自然需要适合本国老百姓的需求。有些国家的语言文化背景更为相似,比如西欧国家和美国,很多时候只需要直接翻译、组织语言即可,但中国是象形字,语言语境完全不同,如果你用英语人工智能大模型给出回答再翻译,往往会有浓重的翻译腔,这种翻译痕迹在国产大模型上就不会出现。
《日经亚洲评论》分析称,各国都意识到过于依赖美国技术的风险,都在积极展开本土化人工智能研发。有人担心,使用另一个国家开发的人工智能程序会导致敏感信息数据泄露。武河文表示,人工智能技术不应该依赖外国公司。随着学生们越来越多地使用人工智能来学习,人工智能技术输出的内容可能会对年轻一代产生巨大的影响。
盘和林表示,人工智能本身只是一个工具,是在模仿人类行为。人工智能大模型背后是数据训练,而不是数据库。我们之所以要用中国的人工智能,并不仅仅是因为担心其他国家的价值观输入,也是因为中国人的文化和语境等各方面都不同,如果我们使用其他国家的人工智能,可能会导致一系列使用不方便的问题。在此基础上,中国人工智能大模型如果能融入全世界,就能给中文使用群体提高生产力,同时也能提高中国内容、精神产品的生产力水平。