新浪新闻客户端

人数不够,AI来凑?“谁是卧底”还能这么玩

人数不够,AI来凑?“谁是卧底”还能这么玩
2023年06月02日 11:28

  AIGC 一路狂飙,在泛娱乐社交领域正掀起大片浪花。AI 的引入,一方面促进社交连接方式的变迁,从人与人的连接,延伸到人与虚拟人的连接,为社交玩法创造更多想象空间;另一方面 AI 可以进一步增强社交黏度,作为一个强共情能力和无私的社交对象,提供社交中最重要的情绪价值,降低人际关系摩擦。

  长久以来,声网都在 AI 这一领域持续投入,比如 AI 降噪、AI 回声消除等能力就是基于声网自研的AI推理引擎实现。近期,声网也在结合社交玩法中的一些应用去帮助开发者使用大模型实现场景的创新,比如基于特定场景下定制模型的训练与打磨,大模型的多模态特别是声音模态的大模型探索。

  GPT+X,新玩法的探索

  AIGC (AI Generated Content 人工智能生成内容),也可以称为生成式 AI,例如 AI 文本续写,文字转图像的 AI图、AI 主持人等,都属于 AIGC 的范畴。GPT (Generative Pre-Trained Transformer 生成式预训练转换器)是一种基于互联网的、可用数据来训练的、文本生成的深度学习模型,GPT 是AIGC技术的一个种类。近期,数字化、企服、金融等行业都在探索与 GPT 的融合,泛娱乐社交产品融入 GPT 玩法也将是行业趋势。比如虚拟主播,桌游以及社交产品中的一些代聊场景,都很适合与大语言模型结合。

  今天我们来了解一下声网在以上领域最新探索的成果,GPT与“谁是卧底”玩法的结合。

  谁是卧底是一个经典的多人社交推理类游戏,游戏开始时 n(n≥3) 个人拿到相同的一个词语,剩下的人(卧底)拿到与之相关的另一个词语。每人每轮只能说一句话描述自己拿到的词语(但不能直接说出),既不能让卧底发现,也要给同伴以暗示。每轮描述完毕,n 人投票选出怀疑是卧底的那个人,得票数最多的人出局,平票则进入下一轮描述,若最后仅剩三人(包含卧底),则卧底获胜。

  因为对参与人数有一定要求,且此类游戏人多才更有互动氛围。基于此痛点,声网推出了GPT + 谁是卧底的新玩法,由 GPT 来充当其中一名玩家,在游戏中学习、提炼其他玩家的发言格式,对自己的关键词进行描述发言,并能通过分析其他玩家的发言,做出“谁是卧底”的判断并进行投票。

游戏场景展示游戏场景展示

  在游戏中,我们也遇到过 AI 当卧底的局,测试下来 AI 的局内表现亮眼,甚至有作为卧底获胜的能力

  该模式的成功探索未来可以应用到诸如狼人杀、剧本杀等更多游戏场景中。现阶段,社交行业对AIGC的应用如火如荼,市面上也出现了各类“AIGC+社交“的玩法,例如,AI 智能问答客服,可以对新手玩家进行游戏玩法指引;AI 陪聊,可以和玩家1对1聊天,起到倾听、陪伴的作用;AI 主持人,可以学习游戏等主题规则并引导玩家进行游戏或聊天等。

  在音视频社交场景中,声网也在积极探索 AIGC +X的更多形式,赋予 AI 不同的角色适用于不同的玩法和场景中。比如在电商直播、秀场直播中,AI 可作为问答助手帮助主播实时回复一些粉丝的提问;在社交应用中,AI 可以作为聊天助手,为真实用户带去更多的互动和陪伴;而在游戏场景中,AI 则能够和真人玩家一起语聊互动、参与游戏,带来更为丰富的游戏体验。

  4大技术优势,带来全新社交体验

  1.声网实时互动能力与元宇宙、GPT 玩法相结合

  · 极低延时:采用声网实时互动能力,信令延时低至30ms、端到端语音延时最小到65ms,带来“面对面”拟真体验,减少AIGC整体方案的延迟,让AI“反应”的更快

  · 领先语音技术:通过声网 AI 回声消除、降噪等技术,即便在嘈杂的背景环境下,也能让 GPT “听到”清晰的语音,并做出相应回复

  · TTS、STT 识别更准确:即便在高达80%的丢包环境下,也能通过准确的人声识别和断句,让语音转文字(STT)更准确,文字转语音(TTS)更清晰、流畅

  · 目前很多开发者都在使用 IM 的方式让玩家和 AI 角色互动,接入声网 RTC,花样语音互动方式让玩法更有趣、更沉浸

  2.场景化的专业训练能力

  · 丰富的 AI 个性和风格:声网能够满足不同泛娱乐场景中用户对于 AI 角色个性化风格的需求

  · 快速的模型训练:根据需求,声网最快1周即可改进、优化不同的场景模型

  · 专业化的场景建设能力:基于声网多年在泛娱乐社交行业积累的经验,结合 GPT 算法专家知识能力,输出更好玩的 AI+音视频社交场景玩法

  3.拥有GPT 大模型,STT、TTS 等合作伙伴优势

  · 声网与国内知名厂商合作,能够提供相关能力且在方案中可以按需自由替换,避免企业自己对接踩坑,提高整体上线速度

  · 在利用GPT大模型方面,声网会根据客户的场景选择合适的大模型,根据不同的场景做特定的模型数据库和prompt,同时结合声网RTC的低延时特性,让用户交互延迟达到最优,模型输出更符合真实场景

  4.与丰富的元宇宙玩法相结合

  声网能够提供写实、卡通等各种模型语音驱动的 AI 形象,让 AI 玩家、助手不再单调,真实玩家与 AI 共同娱乐。

  目前 AIGC 版谁是卧底 DEMO 已开放体验 ,其他好玩的 AIGC +社交场景也在火速开发中,感兴趣的伙伴可以在声网微信公众号获取!

  (来源:看头条网)

责任编辑:孙青扬

AI

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2023 SINA Corporation

All Rights Reserved 新浪公司 版权所有