与传统理论不一样，最新研究发现我们的大脑是并行处理声音的

2021年11月07日

对我们大多数人来说，听觉是如此轻松，以至于通常很难理解大脑的听觉系统需要处理和理清多少信息。它必须接收传入的声音，并将它们转化为我们所能感知到的声学对象：朋友的声音，狗的叫声，雨声。它必须从背景噪音中提取相关声音。它必须确定两个不同的人说的一个词具有相同的语言学意义，同时还要区分这些声音，并评估它们的音高、音调和其他品质。

根据传统的神经处理模型，当我们听到声音时，我们的听觉系统从声音中提取简单的特征，然后将其组合成越来越复杂和抽象的表示。这个过程使大脑能够将某人说话的声音，例如，转换成音素，然后是音节，最后是单词。

但在8月份发表在《Cell》期刊上的一篇论文中，一组研究人员对这一模型提出了挑战，他们报告说，听觉系统经常同时处理声音和语言。研究结果表明，大脑理解语言的方式与科学家们的预期大相径庭，来自耳朵的信号在早期处理阶段就分支到不同的大脑路径有时甚至绕过被认为是构建复杂声音表征的关键的大脑区域。

这项研究为大脑如何如此快速有效地分解重叠的听觉刺激流提供了新的解释。然而，这一发现不仅质疑了关于语音处理的成熟的理论;它也挑战了关于整个听觉系统如何工作的观点。关于我们对声音的感知，大部分普遍的智慧都是基于我们对视觉系统的计算所知的类比。但越来越多的证据，包括最近对语言的研究，暗示听觉处理的工作方式非常不同，以至于科学家开始重新思考听觉系统的各个部分在做什么，以及这对我们如何破译丰富的音景(SoundScapes)意味着什么。

“这项研究是一项具有里程碑意义的事业，”哈佛大学认知神经学家Dana Boebinger说。尽管她还没有准备好放弃关于大脑如何处理复杂听觉信息的传统理论，但她认为这些结果“令人兴奋”，因为它们暗示“也许我们实际上对正在发生的事情并没有很好地了解。”

颠覆了传统的层次框架

我们对声音感知的最初阶段是很容易理解的。当我们听到某人说话时，我们耳朵里的耳蜗将复杂的声音分成不同的频率组成部分，并通过几个处理阶段将这个表征传送到听觉皮层。首先，从这些信号中提取出有关声音在空间中的位置、音调和变化幅度的信息。接下来会发生什么就更难确定了:高级皮层区域被认为会按照分层顺序梳理出与语音特别相关的特征——从音素到韵律。其他复杂类型的声音(如音乐)的特征也可以用类似的方法处理。

这种排列方式反映了视觉系统的工作模式:它首先将照射在视网膜细胞上的光线模式解释为线条和边缘，然后将其解释为更复杂的特征和模式，最终构建出一张脸或一个物体的表征。

但是，剖析听觉信息流的细节一直很困难。用动物来研究语言是走不远的，因为语言是人类独有的特征。而对于人类，大多数研究不得不使用间接的方法来测量大脑活动。获得直接记录非常困难，因为它具有侵入性:科学家需要借助医疗程序，从植入癫痫病患者大脑的电极中收集数据。但很多感兴趣的听觉区域位于大脑深处额叶和颞叶之间——外科医生通常不会在这个区域寻找记录。

尽管如此，许多直接和间接的研究发现了听觉和语言处理的传统层次模型的证据:这一过程的早期阶段之一，初级听觉皮层，似乎被调整为编码声音的简单特征，比如频率。随着信号远离初级听觉皮层，大脑的其他区域似乎对越来越复杂的声音特征做出更多反应，包括语音特有的特征，比如音素。到目前为止，还挺好。

但是，德克萨斯大学奥斯汀分校(University of Texas, Austin)的神经学家Liberty Hamilton说，科学家们根据“不一定要看这些区域是如何连接的”或它们变得活跃的序列的实验，推断出了这种层次框架。

因此，在2014年，她着手构建一个更全面的听觉皮层语音表征图，以了解从一个声音中提以了解从不同大脑区域的声音中提取出什么样的信息，以及这些信息如何从一个区域整合到下一个区域。

她有一个难得的机会来探索这个问题，先是在加州大学旧金山分校(University of California, San Francisco)神经外科医生Edward Chang的实验室做博士后研究，然后在她自己位于奥斯汀的实验室。Chang,Hamilton和他们的同事们找到了几个病人，治疗需要电极网格被放置在不同的听觉位置。

包括德克萨斯大学奥斯汀分校神经科学家 Liberty Hamilton（左）和加州大学旧金山分校神经外科医生 Edward Chang（右）在内的一组研究人员绘制了听觉皮层的不同部分如何处理语音和其他声音的特征。Courtesy of Liberty Hamilton; Tom Seawell for UCSF

由于监测这些区域的机会很难获得，它们的记录是“非常宝贵的数据，令人兴奋，”Boebinger说。研究人员曾希望能够详细说明大脑如何将初级听觉皮层中的低级声音表征转换为更复杂的语音表征，即层次结构更高的区域，即颞上回。

Hamilton表示，他们的发现“在某种程度上颠覆了这个想法”。

早期途径不同

事情进展不如预期的第一个暗示很快就来了。Chang 研究小组分析了不同听觉区域对纯音和口语单词、句子特征的反应。他们证实了之前的发现，并补充了地图上确实的细节。

但他们也观察到了一些奇怪的现象。如果信息像他们所想的那样层次化地从“低”区域流向“高”区域，那么初级听觉皮层应该在颞上回之前对输入做出反应。然而，颞上回的一些区域似乎对语言的开始做出反应，就像初级听觉皮层对简单的声音特征做出反应一样快，比如频率。

Hamilton表示，这一观察结果引出了一个诱人的假设：两个大脑区域并行处理同一输入的不同方面，而且“这种语音感知的并行路径可以绕过初级听觉皮层——我们认为所有信息都应该去那里。”。这意味着语音的某些表征不需要从初级听觉皮层中提取的低级特征中构建出来。Hamilton说：“在一个分层模型中，你会认为初级听觉皮层是你到达大脑皮层语言区之前必须经过的第一个中转站。”但她的结果表明，这不一定是真的。

Samuel Velasco/Quanta Magazine

Chang, Hamilton及其同事们决定进一步测试这个想法。当他们刺激患者的初级听觉皮层以扰乱其功能时，患者仍然可以毫无问题地感知语言。相反，他们报告了幻听:他们听到叠加在他们听到的单词或句子之上的声音，从嗡嗡声、敲击声到流水和移动的碎石。

当研究人员刺激颞上回的一个子区域时，他们看到了相反的情况:患者不能理解语言，但显然仍能正常听到声音。“我能听到你说话，但听不清是什么意思，”一名受试者报告说。

Hamilton说，“这就像只有两个独立的过程一样。”——声音处理的独立路径和与语言相关的高级特征。

在听觉皮层中发现并行处理并不完全令人惊讶。伦敦大学学院(University College London)的神经学家Sophie Scott说，“当你谈论感知系统时，层次结构很好也很清晰，因为在某种程度上你知道，你会从一个嘈杂的信号变成更高层次、更抽象的东西。”

只有在某些时候，不同的大脑回路必须同时处理不同类型的听觉信息，这才说得通。事实上，研究人员已经报告了在听觉处理的后期阶段的平行功能:复杂的音乐和语言元素被分开处理，它们的表征至少部分是并行地形成的。

但是，只有在信号通过初级听觉皮层之后，才会发生语音和声音处理的分离。Hamilton和Chang的工作在这个过程的早期就发现了这样一个分支点——如此之早，可能意味着信息被整合到皮层下而不仅仅是皮层来表示语音。如果皮层下处理在语言中扮演如此重要的角色，研究人员可能也忽略了大脑理解复杂声音的其他重要方式。

但这些语言和声音处理的分裂只在信号通过初级听觉皮层后才会发生。Hamilton和Chang的工作很早就在这个过程中发现了这样一个分支点——如此之早，这可能意味着信息在皮层下而不仅仅是皮层中被整合来代表语音。如果皮层下的处理在语言中扮演如此重要的角色，研究人员可能也忽视了大脑理解复杂声音的其他重要方式。

耶路撒冷希伯来大学(The Hebrew University of Jerusalmen)的研究人员Israel Nelken表示，“多年来，我们一次又一次地认识到，我们认为皮质的许多东西至少在某种程度上都是皮层下的。”

事实上，新的研究结果表明，“较低”水平的大脑皮层可能也隐藏着更大的复杂性。例如，Scott发现，刺激初级听觉皮层会在Chang组的病人中产生如此丰富的幻听，这很有趣。据她说，这种幻觉通常与高级皮质区域有关。

此频谱图显示了用小提琴演奏的音乐中的声频组成部分。当复杂的声音进入耳朵时，内耳的耳蜗以类似的方式传递频率信息。研究人员想知道大脑如何处理这些信息以建立我们感知到的声音的表征。

所以初级听觉皮层的作用可能比它通常被认为的更多。最近的其他研究也得出了同样的结论:与初级视觉皮层不同，初级听觉皮层接收的信号已经经过了更多的处理，而且它以一种对环境更加敏感的方式来表示信息。纽约大学(New York University)神经科学家David Poeppel说，它“在功能上比初级视觉皮层更下游”。

“更像是一场闪电风暴”

即便如此，Poeppel 说到“我不认为我们应把层级框架像洗澡水一样全部倒掉。”在这个系统中仍然有层次结构，它们对于构建越来越抽象的心理表征非常重要。

但是，在早期就脱离这个层次，同时处理语音和其他声音可能会带来很多好处。首先，它可以帮助优化听觉系统的速度，由于声音的瞬态性而需要微秒级的精度。“因此，有了这种并行组织，你可能会更快地分析关于语音或其他复杂声音的信息，”Boebinger说。此外，听觉信号在本质上是混乱的：每个个人丢弃音素或不一致地跳过单词，他们在不同的社会环境中可能会说不同的话。并行处理系统可能更擅长处理这种混乱的输入。

它还可能有助于听觉系统更有效地分离复杂、重叠的声音，并允许大脑在这些声音流之间迅速转换注意力。Scott说:“必须在同一时间以一种非常可塑的方式处理多种不同类型的信息流，因为听觉环境可以随时改变。”鉴于语音对人类的重要性，我们的大脑会快速处理它们，并以一种有别于背景或环境声音的方式，这是有意义的。

如果言语和产生它们的声音，那么很早就自然地处理，那么也许其他类型的声音也是如此。要了解，Hamilton和其他人希望对更广泛的听觉输入进行实验——环境声音、音乐、在背景噪音中而不是在沉默中说话——以检验不同类型的并行处理可能在何时何地发生。

“我们才刚刚开始能够剖析这一过程的组成部分，”南加州大学(University of Southern California)的神经科学家Robert Shannon说。他补充说，也许表现的形成将不仅仅是在上升的层级或整齐的平行路径中，而是具有如此多的并行性和复杂性，以至于“更像是一场闪电风暴”。

Nelken说，“这是一幅关于感觉系统如何工作的完全不同的画面。”

参考：

To Pay Attention, the Brain Uses Filters, Not a Spotlight

How the Brain Links Gestures, Perception and Meaning

The Brain Reshapes Our Malleable Senses to Fit the World

原文：https://www.quantamagazine.org/the-brain-processes-speech-in-parallel-with-other-sounds-20211021/

本文转自公众号脑机接口社区·

上一篇：我又失忆了？！海马：是我要歇了下一篇：“手拉手”、“背靠背”！学术繁荣还是内卷？

最热资讯

热门标签