李未可科技多模态AI大模型正式发布,积极推进AI在终端的场景应用

　　4月18日，2024中国生成式AI大会上李未可科技正式发布为眼镜等未来终端定向优化自研WAKE-AI多模态大模型，具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。

　　该大模型围绕 GPS 轨迹+视觉+语音打造新一代 LLM-Based的自然交互，同时多模态问答技术的加持，能实现所见即所问、所问即所得的精准服务。此外，融合了人类意图理解、长期记忆机制、情感大模型及TTS 克隆，可以为用户提供超拟人的情感陪伴服务。

　　为保证实时交互场景的智能性及响应速度，WAKE-AI 使用 MOE 架构，FlashAttention 混合精度训练、知识蒸馏等技术大幅降低算力需求跟计算时间。该大模型针对眼镜端用户的使用方式、场景等进行了优化。在语音返回速度上能做到<500ms以内，语音唤醒的准确度>90%，ASR字错率低于2%。同时为用户提供在室外多个场景，如户外运动、文化旅行、日程管理及实时翻译的多模态AI服务。

　　据悉，李未可将于近期正式发布搭载WAKE-AI能力的新终端，从室外场景切入为用户提供更智能、更全面的AI+服务。

　　会上，李未可科技合伙人&AI负责人古鉴表示WAKE-AI 将逐步开放平台能力，便于更多企业及开发者调用WAKE-AI能力，共建AI+硬件生态。

　　（来源：News快报）

责任编辑：何奎良