网站首页 文章专栏 脑机接口技术迎来重大突破:可使渐冻症患者重新流畅说话、唱歌
脑机接口技术迎来重大突破:可使渐冻症患者重新流畅说话、唱歌
发布 作者:清源 浏览量:1
加州大学戴维斯分校研发的新型脑机接口技术使瘫痪患者能够顺畅说话和唱歌,几乎没有延迟,标志着该领域的一项重大突破。

6 月 16 日消息,据外媒 New Atlas 14 日报道,脑机接口技术迎来一项重大突破:加州大学戴维斯分校研发的新型植入系统,让一位瘫痪患者不仅能顺畅说话,甚至还能借助电脑“哼唱”旋律,几乎没有任何延迟。

The BCI setup and the study participant using the voice synthesis tech

研究团队在一位渐冻症患者身上试验了这项技术。通过在大脑中控制发音的区域植入四组微电极阵列,系统能实时捕捉说话时产生的神经信号,再结合低延迟处理和 AI 解码模型,将这些信号同步转化为语音,在扬声器中播放。

需要强调的是,这项技术并不是在“读心”,而是识别出患者尝试发声时大脑发出的运动指令。系统合成出的声音与患者本人极为相似 —— 这得益于在其发病前录制的语音样本训练出的声音克隆算法。

从信号采集到语音生成,全程只需 10 毫秒,几乎可以实现实时对话。

系统还能识别出患者试图唱歌的动作,判断其想表达的音高,并据此合成旋律。在研究团队发布的视频中,这一功能尚显初级,但对于那些逐渐失去表达能力的人来说,无疑是一种重获声音的希望。

The study participant's neural signals from reading on-screen text helped train the AI decoder model

该研究论文的资深作者 Sergey Stavisky 表示,这一进展为脑机语音合成带来了转折点。他说:“借助即时语音输出,神经义体用户能真正参与对话 —— 他们可以打断别人,也更不容易被别人误打断。

该系统能复现“啊”“喔”“嗯”等语气词,判断句子是疑问还是陈述,甚至辨别出强调词语的位置。研究团队还指出,系统能准确合成此前从未见过的虚构词语。这使得语音表达更自然、更具表现力。

IT之家从报道中获悉,研究人员也指出,目前试验仅在一位患者身上进行,下一步将拓展至其他因不同原因丧失语言能力的人群,以验证技术的普适性。

loading