2022《解码大脑》观后感

  许多患有神经疾病的病人丧失了语言能力,需要依赖特定的通讯

设备进行沟通,这类设备利用脑机接口或者头部/眼睛的非言语动作

来控制光标去选择字母,从而“说”出他们想说的话。但是,这个过程

要远远慢于正常的人类说话速度。

  已故物理学家斯蒂芬·霍金就需要依靠类似的系统,工程师团队

为避免他一个一个字母地拼写单词,曾采集大量霍金的文档,分析词

频及上下文关联,以便在霍金输入时给出最合适的预测词。

  而此次,美国加州大学旧金山分校科学家爱德华·张(音译)及

其同事,利用与人类下颌、喉头、嘴唇和舌头动作相关的脑信号,开

发出了一种人类语音合成系统。首先,他们在5 名被试者大声说出几

百个句子时,记录下他们的大脑皮层活动,然后据此设计了一种能够

解码负责声道动作的脑信号的系统。之后,他们便能够根据解码出的

动作合成语音。在包含101 个句子的试验中,听者可以轻松地识别并

记录下合成的语音。

  在论文随附的新闻与观点文章中,美国埃默里大学和乔治亚理工

学院科学家切丹·潘达利纳斯和亚海亚·阿里表示,研究团队完成了一

项非常有力的概念验证,目前,要使该系统真正成为一个临床可行的

语音脑机接口,尚面临着许多挑战。

  总编辑圈点

  说话,可以算是人类执行的最复杂的活动之一。依靠脑机接口设

备,因疾病而失语的病人其实也可以“讲话”,不过以往的设备只能达

到一个个“蹦单词”的程度。现在,新技术的辨识度和流畅度远非此前

可比,几乎解决了这一系统所面临的重大挑战,但重构语音毕竟要逊

于自然语音,必须通过收集更大的数据集并继续开发基础计算方法以

改进。未来,其或能真正实现让病患们恢复“讲话”能力,进而与世界

重新建立联系。