2018年5月18日,北京大学心理与认知科学学院罗欢研究员课题组与浙江大学丁鼐教授课题组合作的研究“Prior Knowledge Guides Speech Segregation in Human Auditory Cortex ”发表于Cerebral Cortex杂志。该研究揭示了先验知识如何帮助人类区分多重语音流。罗欢课题组的博士研究生王原野和丁鼐课题组博士研究生张剑锋为本研究的共同第一作者,罗欢研究员和丁鼐教授为共同通讯作者。

鸡尾酒会效应是听觉领域的一个经典现象。当人们身处喧嚣的酒会现场,依然可以分辨出是否有人在呼唤自己的名字。这种将多重语音流分离开来的过程通常被认为需要两种线索,即自上而下的线索和自下而上的线索。自下而上的线索包括语音流中不同的音调,音色等。这一部分已经被充分研究过,并且得到了相对稳定一致的结论。而自上而下的线索,比如先验知识,则仍缺乏足够的实证证据。本研究就试图探究先验知识对于多重语音分离的作用。在实验中,为了能够充分排除自下而上的线索,本研究选取同一位女性朗读的不同的故事A和故事B并将其分割成多个片段,通过将这两种刺激在同一声道中叠加起来作为混合语音。在实验过程中,混合语音中需要被注意的刺激先播放2秒。实验分为两种条件:启动组和非启动组。启动组中被试首先被呈现一次需要注意的语音,即具有了关于需要注意语音的先验图式,接下来再收听混合语音。非启动组中被试则直接收听混合语音。被试的任务在两组中是一致的,即判断需要注意的语音中是否存在1.5秒的空白(图1)。本研究采用脑磁图(magnetoencephalogram, MEG)技术考察了十六名健康被试的样本,试图探究大脑如何利用先验知识来区分多重语音流。


图1.实验任务流程。

通过神经解码(neural decoding) 计算,本研究得到的结果显示,无论被试是否具有需要被注意的刺激语音的先验知识,大脑都会较好的追踪处理需要被注意的刺激。然而在有先验知识的情况下,大脑对于不需要被注意的语音刺激的追踪会显著变弱。即大脑会通过压制对于非注意刺激的加工来更好的区分两种刺激。

接下来本研究通过时间响应函数(temporal response function, TRF)和溯源分析(source localization)的计算得到这一过程主要发生在听觉皮层,并且从混合刺激出现的 100ms就开始了,全过程持续约600ms,且仅发生在1-8hz的低频频段。

综上脑成像研究的结果表明,人类通过先验知识来区分多重语音流的过程主要发生在听皮层,并且于早期便开始,一直持续600ms左右。这一过程主要是通过抑制对于非注意语音刺激的加工来完成。这为理解自上而下的线索对于鸡尾酒会效应的影响提供了重要的实证证据,也为听皮层的功能探索提供了新的线索。

本研究得到了国家自然科学基金面上项目的资助。

Wang, Y. , Zhang, J. , Zou, J. , Luo, H. , & Ding, N. . (2018). Prior knowledge guides speech segregation in human auditory cortex. Cerebral Cortex.


2019-11-20