8月23日,学术顶刊Nature刊登了两篇关于脑机接口的论文,两组研究都能将大脑神经信号“翻译”转化成文本或单词,并由合成语音说出,速度各为每分钟60到80个单词。
(资料图)
当前,人类自然对话的速度约为每分钟160个单词,而这两项新研究都已超越了此前脑机接口解码语音的最快速度,且准确率都在七成以上,可谓是脑机接口领域的重大突破。
其中一项研究来自加州大学旧金山分校,研究团队采用了一种名叫脑皮层电图(ECoG)的技术,在患者的大脑皮层表面放置一个包含253个电极的矩形薄纸,用来记录数千个神经元的组合活动。然后采用特定的AI算法读取患者的脑部活动,最终通过某种“化身”发出声音。
接受治疗的患者安(Ann)在18年前因脑干中风失去说话的能力,现年47岁。研究团队基于她的婚礼视频、录音进行训练,模仿她的面部表情并合成声音,最终创造出了一个与安受伤前的声音、面容较为相似的虚拟人化身。
借由这一“化身”,安现在平均每分钟“说”出78个单词,错误率约为25.5%。在接受治疗后的一次反馈中,安激动地对研究人员说:“听到与自己相似的声音,就像我真的有能力为自己说话,这太重要了。”
另一篇论文则来自斯坦福大学。不同于加州大学旧金山分校所采用的非侵入式的脑皮层电图技术,斯坦福大学团队的技术方案需要将一系列电极插入大脑皮层下几毫米处,参与语言处理的部分,然后也通过AI算法来识别患者大脑中的独特信号,再从音素中解码单词,形成口语化的语音亚单位。
接受这一治疗的患者贝内特(Bennett)现年67岁,患有肌萎缩侧索硬化症,会导致患者的肌肉控制逐渐丧失,导致移动困难和说话困难。当他参考包含12.5万个单词的大型词汇集,试图说出各种短语时,单词表述的错误率约为23.8%。
研究团队称,由于使用的是侵入式的脑机接口技术,因此能够更加精准地捕获神经活动,在患者想要表述的词汇量较多时,更具有优势。
在上述两项研究中,两位患者在思考说话时,仍有能力控制他们的面部肌肉,并且他们与语言相关的大脑区域完好无损。因此,斯坦福大学团队中的一位科学家表示,他们的研究只是一种概念证明,目的是为这个领域的其他科学家提供动力,以期在未来产生可以实际使用的产品。
而对于所谓“可实际使用的产品”,一位来自法国格勒诺布尔神经科学研究所的科学家表示,适合日常使用的脑机接口产品应该由完全植入性的系统制成,没有可见的连接器或电缆。
还有同领域的研究人员认为,当前脑机接口技术或设备还需要在更多人身上进行测试,才能知晓其可靠性——不过,在这一过程中,也必须“节制”地使用技术,谨慎对待脑机接口技术对于人群的广泛推广。
采写:南都记者 杨博雯