新浪新闻客户端

李未可科技多模态AI大模型正式发布,积极推进AI在终端的场景应用

李未可科技多模态AI大模型正式发布,积极推进AI在终端的场景应用
2024年04月19日 10:42

  4月18日,2024中国生成式AI大会上李未可科技正式发布为眼镜等未来终端定向优化自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。

  该大模型围绕 GPS 轨迹+视觉+语音打造新一代 LLM-Based的自然交互,同时多模态问答技术的加持,能实现所见即所问、所问即所得的精准服务。此外,融合了人类意图理解、长期记忆机制、情感大模型及TTS 克隆,可以为用户提供超拟人的情感陪伴服务。

  为保证实时交互场景的智能性及响应速度 ,WAKE-AI 使用 MOE 架构,FlashAttention 混合精度训练、知识蒸馏等技术大幅降低算力需求跟计算时间。该大模型针对眼镜端用户的使用方式、场景等进行了优化。在语音返回速度上能做到<500ms以内,语音唤醒的准确度>90%,ASR字错率低于2%。同时为用户提供在室外多个场景,如户外运动、文化旅行、日程管理及实时翻译的多模态AI服务。

  据悉,李未可将于近期正式发布搭载WAKE-AI能力的新终端,从室外场景切入为用户提供更智能、更全面的AI+服务。

  会上,李未可科技合伙人&AI负责人古鉴表示WAKE-AI 将逐步开放平台能力,便于更多企业及开发者调用WAKE-AI能力,共建AI+硬件生态。

  (来源:News快报)

责任编辑:何奎良

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2024 SINA Corporation

All Rights Reserved 新浪公司 版权所有