让人工喉更多的声音妨碍者战语音交互的用户
任天令引见,该人工喉还有很大的优化和拓展空间,例如提大声音的质量和音量,添加语音的多样性和脸色,以及连系其他心理信号和消息实现更天然和智能的语音交互。研究团队但愿通过进一步的研究和合做,让人工喉更多的声音妨碍者和语音交互的用户。
团队还操纵人工智能模子对人工喉的信号进行语音识别和合成,实现了对根基语音元素(音素、声和谐词语)的高精度识别,以及对喉癌患者恍惚语音的识别取再现,为声音妨碍者的沟通和交互供给了一种立异的处理方案。
尝试成果表白,人工喉采集的夹杂模态语音信号能够识别根基语音元素(音素、腔调和单词),平均精确率为99.05%。同时人工喉的抗噪声机能较着优于麦克风,正在60分贝以上噪声下仍能连结识别能力。任天令研究团队进一步演示了它的语音交互式使用:通过集成AI模子,人工喉可以或许识别一名喉切除术患者恍惚说出的日常词语,精确率跨越90%。识别出的内容被合成为语音正在人工喉上播放,能够初步恢复患者的语音交换能力。
并于近日正在线颁发正在《天然》人工智能子刊《天然机械智能》上。这一研究成果为语音识别取交互系统供给了一条新的手艺路子,
语音是人类交换的主要体例,但措辞人的健康形态(例如神经疾病、癌症、外伤等缘由导致的声音妨碍)和四周(乐音干扰、介质)往往会影响声音的传输和识别。一曲以来,研究人员正在努力改良语音识别和交互手艺以应对微弱的声源或嘈杂的。多通道声学传感器能够显著提大声音识此外精度,但会导致更大的设备体积,而可穿戴设备可以或许获取高质量的原始语音或其他心理信号。然而,目前尚无充实的表白喉部肌肉的活动模式和反映正在体表的发声器官振动中现含着可识此外语音特征,且尚无尝试证明其做为语音识别手艺的完整性。
一枚硬币大小的石墨烯片,贴正在颈部接近喉咙处,就能帮帮发音妨碍者获得新“声”。近日,大学集成电学院任天令传授及合做团队正在智能语音交互方面取得主要进展,其研发的可穿戴人工喉能够喉部发声相关信号,并通过人工智能模子将其识别和合成为语音,还原精确率跨越90%。
为处理这一问题,任天令团队开辟了一款基于石墨烯的智能可穿戴人工喉,同贸易麦克风和压电薄膜比拟,人工喉对低频的肌肉活动、中频食管振动和高频声波消息有很高的活络度,同时也具有抗噪声的语音能力。对声学信号和机械活动的夹杂模态的使人工喉可以或许获得更低的语音基频信号。此外,该器件还能够通过热声效应实现声音的播放功能。人工喉的制做过程简单、机能不变、易于集成,为语音识别和交互供给了一种新的硬件平台。