新浪新闻客户端

患渐冻症的前京东副总裁蔡磊使用人工喉,研发团队回应

患渐冻症的前京东副总裁蔡磊使用人工喉,研发团队回应
2023年11月17日 15:04 界面新闻

  据“BRTV医者”官方账号视频,11月13日,渐冻人蔡磊试用了清华大学团队开发的可穿戴人工喉,成为全球首个使用可穿戴人工喉的试用者。

  蔡磊曾是京东副总裁,2019年9月30日确诊渐冻症,因该疾病逐渐失声。在上述视频中,人工喉先采集蔡磊的声音,再还原蔡磊原声,发出了与蔡磊正常时候几乎完全一样的声音。

  人工喉顾名思义,即人工制造的喉咙,是一种辅助发声的工具。现有人工喉基本可分为三类:机械式人工喉,电子人工喉,植入式人工喉。

  此次蔡磊佩戴的人工喉是一种可穿戴的智能人工喉,任天令告诉界面新闻,他认为这款人工喉不属于目前市场上的任何一类,而是开创了一个新类别:智能人工喉,相对于目前市场上各类技术产品,这款可穿戴人工喉具有显著优势。

  据《FUTURE远见》,今年2月23日,清华大学集成电路学院任天令教授及合作团队在智能语音交互方面取得重要进展,其研发的可穿戴人工喉可以感知喉部发声相关的多模态机械信号以用于语音识别,并依靠热声效应播放对应的声音,研究结果为语音识别与交互系统提供了一条新的技术途径。该成果以《使用可穿戴人工喉的混合模态语音识别与交互》为题发表在《自然》人工智能子刊《自然·机器智能》上。

  任天令团队开发的这款石墨烯的智能可穿戴人工喉,同商业麦克风和压电薄膜相比,人工喉对低频的肌肉运动、中频食管振动和高频声波信息有很高的灵敏度,同时也具有抗噪声的语音感知能力,还可以通过热声效应实现声音的播放功能。

  值得注意的是,这款设备利用人工智能模型对人工喉感知的信号进行语音识别和合成,实现了对基本语音元素(音素、声调和词语)的高精度识别,以及对喉癌患者模糊语音的识别与再现。任天令接受界面新闻采访时也提到,第三代智能石墨烯人工喉相较前两代最突出的特点就是能够最大程度还原使用者的原声。

  实验结果表明,人工喉采集的混合模态语音信号可以识别基本语音元素(音素、音调和单词),平均准确率为99.05%。同时人工喉的抗噪声性能明显优于麦克风,在60dB以上环境噪声下仍能保持识别能力。通过集成AI模型,人工喉能够识别一名喉切除术患者模糊说出的日常词汇,准确率超过90%。识别出的内容被合成为语音在人工喉上播放,可以初步恢复患者的语音交流能力。

  不过,任天令团队也表示该人工喉还有很大的优化和拓展空间,例如提高声音的质量和音量,增加语音的多样性和表情,以及结合其他生理信号和环境信息实现更自然和智能的语音交互。

  对于最新一代的人工喉何时进行量产,任天令表示,“目前我们已经将核心的技术问题解决,剩下的就是如何打造优化人工喉的产品形态。人工喉从样品到商业化的产品,中间还有一段路要走。”

  任天令还告诉界面新闻,目前的样品主要供参与实验研究的志愿者使用,长时间佩戴的产品还需要经过医疗产品认证等过程。

  实际上,这款可穿戴智能人工喉设备此前已经经历了两次迭代。2017年,任天令团队创新性地提出了一种基于石墨烯的收发同体的集成声学器件:利用压阻效应来接收信号,并基于热声效应发射声音,从而巧妙地实现了单器件的声音收发同体。在器件制备工艺上,团队采用独特的激光直写技术,能够直接将成本低廉的大面积聚酰亚胺薄膜快速转化为图形化的多孔石墨烯材料。

  石墨烯是从石墨材料中剥离出来、由碳原子组成的只有一层原子厚度的二维晶体,具有极高的电子迁移率、优秀的机械强度、优秀的导热性,对低频的肌肉运动、中频食管振动和高频声波信息有很高的灵敏度,同时也具有抗噪声的语音感知能力。

  2020年8月,该团队研究的第二代石墨烯智能人工喉(WAGT)在器件柔性可贴附、声音收发系统集成、动作监测系统、轻型可穿戴等方面有了重大突破。

  据清华大学官网,第二代智能石墨烯人工喉集收声和发声于一体,可直接贴附于失语者喉部,并将喉部的不同动作转化为对应声音,有望帮助失语者正常与他人“交谈”。第二代智能石墨烯人工喉首次实现了石墨烯人工喉的可穿戴功能。在未来,该器件将与声纹识别、机器学习等技术结合,在语音识别、家庭医疗等领域具有广阔前景。

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2023 SINA Corporation

All Rights Reserved 新浪公司 版权所有