云知声上市稳健推进，山海多模态大模型带来多模态拟人交互体验|云知声

　　2022年底，ChatGPT横空出世。市场玩家蜂拥而上，希望能从这个风口上分得一杯羹。国内的硬科技赛道、企业服务和数字化服务赛道等多个行业也都在积极部署大模型，后半年甚至上演了轰轰烈烈的“百模大战”。但时至今日，实现大模型商业化的玩家并不多见，云知声却寻找到了自己的答案，自推出山海大模型，始终坚持商业化之路，深入各个行业应用，并在不久前上线山海多模态大模型，继续朝AGI迈进。

　　云知声积极布局大模型，赋能各行业智能化转型

　　云知声是较早部署大模型的玩家之一。

　　早在2017年，云知声就在Transformer算法上取得了突破。2018年，在BERT算法上又有了新成果。云知声依据其在自然语言处理上的积累，以及在交互式AI方面的研发能力，率先推出基于BERT的大语言模型Unicore，作为云知声的中心技术平台云大脑的初始核心算法模型。

　　在Unicore不断演进和迭代中，云知声在2023年推出了拥有600亿个参数的自有大模型产品山海大模型。与Unicore大模型相比，山海大模型有更大的数据规模、强大的多语言知识能力、指令调优和人类反馈强化，最终通过MaaS适配医疗、酒店、交通等诸多场景。尤其在云知声主营的智慧生活和智慧医疗场景中，很好地赋能企业客户提高质量和效率，降低成本和失误。

　　迈向AGI关键一步，云知声推出山海多模态大模型

　　2024年8月，云知声再次发力大模型领域，推出山海多模态大模型，迎来“Her时代”。通过整合跨模态信息，山海多模态大模型能够接收文本、音频、图像等多种形式作为输入，并实时生成文本、音频和图像的任意组合输出，带来实时多模态拟人交互体验。

　　山海多模态大模型更加能听会说，带来智能化的语音交互，实现了实时秒回和自由插话的功能，使得语音交互与现实对话中的响应时间相似，用户几乎感知不到延迟。同时，它还具备感知和表达情绪的能力，能够通过语音文本和语气、节奏、音调等微妙变化来准确感知用户的情绪状态，并给予适当的情感反馈。此外，山海还支持音色自由切换，可以根据用户的个性化需求来打造专属声音，增强对话的生动性和趣味性。