新浪新闻客户端

云知声上市稳健推进,山海多模态大模型带来多模态拟人交互体验

云知声上市稳健推进,山海多模态大模型带来多模态拟人交互体验
2024年09月05日 15:35

  2022年底,ChatGPT横空出世。市场玩家蜂拥而上,希望能从这个风口上分得一杯羹。国内的硬科技赛道、企业服务和数字化服务赛道等多个行业也都在积极部署大模型,后半年甚至上演了轰轰烈烈的“百模大战”。但时至今日,实现大模型商业化的玩家并不多见,云知声却寻找到了自己的答案,自推出山海大模型,始终坚持商业化之路,深入各个行业应用,并在不久前上线山海多模态大模型,继续朝AGI迈进。

  云知声积极布局大模型,赋能各行业智能化转型

  云知声是较早部署大模型的玩家之一。

  早在2017年,云知声就在Transformer算法上取得了突破。2018年,在BERT算法上又有了新成果。云知声依据其在自然语言处理上的积累,以及在交互式AI方面的研发能力,率先推出基于BERT的大语言模型Unicore,作为云知声的中心技术平台云大脑的初始核心算法模型。

  在Unicore不断演进和迭代中,云知声在2023年推出了拥有600亿个参数的自有大模型产品山海大模型。与Unicore大模型相比,山海大模型有更大的数据规模、强大的多语言知识能力、指令调优和人类反馈强化,最终通过MaaS适配医疗、酒店、交通等诸多场景。尤其在云知声主营的智慧生活和智慧医疗场景中,很好地赋能企业客户提高质量和效率,降低成本和失误。

  迈向AGI关键一步,云知声推出山海多模态大模型

  2024年8月,云知声再次发力大模型领域,推出山海多模态大模型,迎来“Her时代”。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出,带来实时多模态拟人交互体验。

  山海多模态大模型更加能听会说,带来智能化的语音交互,实现了实时秒回和自由插话的功能,使得语音交互与现实对话中的响应时间相似,用户几乎感知不到延迟。同时,它还具备感知和表达情绪的能力,能够通过语音文本和语气、节奏、音调等微妙变化来准确感知用户的情绪状态,并给予适当的情感反馈。此外,山海还支持音色自由切换,可以根据用户的个性化需求来打造专属声音,增强对话的生动性和趣味性。

  山海多模态大模型看得见读得懂,拥有更直觉的视觉交互。它能够通过摄像头看见周围环境,实现所见即所得的精准识别,从场景理解分析到物体信息描述都能精准拿捏。同时,山海还具备图像创意生成的能力,可以根据用户指令快速创建视觉内容,并提供符合个性化需求的定制画面。

  云知声在AI领域的持续探索和创新,特别是在大模型及多模态交互技术方面的突破,展现了其深厚的技术积累和市场洞察力。山海多模态大模型的推出,更是云知声迈向AGI关键一步的重要标志,也为不同行业带来了全新的交互体验和应用可能性,为用户带来更加智能、便捷和人性化的交互体验!

责任编辑:何奎良

云知声

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2024 SINA Corporation

All Rights Reserved 新浪公司 版权所有