网站首页 文章专栏 耗时 15 年、扫描 1400 个大脑!MIT 神经科学家发现了藏在人脑中的「生物版 ChatGPT」
耗时 15 年、扫描 1400 个大脑!MIT 神经科学家发现了藏在人脑中的「生物版 ChatGPT」
发布 作者:ItHome 浏览量:2
MIT神经科学家Ev Fedorenko通过15年的研究,扫描了约1400人的大脑,发现了一个专门处理语言的‘语言网络’。这个网络类似于‘生物版ChatGPT’,负责将词语与意义映射并拼成句子,但不涉及思考或情绪。研究揭示了语言与思维的分离,表明语言更像是思维的‘接口’而非核心。Fedorenko的研究挑战了传统观点,即语言和思维是同一过程,并提供了关于大脑如何处理语言的新见解。

MIT 神经科学家 Ev Fedorenko 通过扫描约 1400 人的大脑,识别出一个类似「生物版 ChatGPT」的语言网络,它不负责思考或情绪,只专注于将词语与意义映射、拼成句子,该研究揭示了语言与思维的分离,让我们重新审视大脑中隐藏的奥秘。

如果告诉你:你的大脑中正跑着一个「生物版 ChatGPT」,你会相信吗?

这不是打比方,而我们的大脑中真有这样一套专门用来处理语言的神经系统:

它不负责思考、也不负责情绪,只负责一件事 —— 把词和意义对上号、再把它们拼成句子。

这个系统被神经科学家 Ev Fedorenko 称作「语言网络」(language network)。

大脑天生的 LLM 系统

很多人可能会有这种感觉:语言和思考是同一过程,找词的过程本身就是思考。

但人类的语言和思维是一回事吗?

语言究竟是思维的核心,还是一个完全独立的过程?

对此,Fedorenko 提出了一个有点反直觉的观点:

语言不等于思考,它更像是思考的「接口」和「外包装」。

对许多人来说,找到合适的词本身就是思考的重要组成部分,而不是某个独立系统的产出。

她把这个独立于思考之外的专门系统称为「语言网络」,用来映射词语与其意义之间的对应关系。

Fedorenko 将之想象成一个加强版的解析器:

「它就像一张地图,告诉你大脑里哪一块地方存着哪一类意义,也好比一个加强版的解析器,帮我们把语言拼起来。」

至于真正的思考和有趣的东西,则全部发生在这个语言网络之外。

事实上,早在 ChatGPT 出现之前,过去的 15 年里 Fedorenko 一直在收集人类大脑中语言网络的证据,并且发现它和大模型(LLM)之间有不少相似之处。

在某些意义上,我们确实随身携带着一个「生物版的 ChatGPT」:一个不具备心智的语言处理器。

Fedorenko 的研究,也许会让人觉得有一些安慰:一台机器虽然可以生成一段流畅的文字,但是它还是不会思考。

在麻省理工学院的实验室里,Fedorenko 已经花了 15 年时间积累关于语言网络的生物学证据。

不同于大模型,人类的语言网络不会把词随便串成听起来像那么回事的句子。

它更像是连接外部输入(听到的、看到的、甚至手语)和大脑其他区域意义表征(如情景记忆、社会认知,而 LLM 并没有这些能力)之间的翻译器。

而且人类的语言网络并不大,如果把相关组织都聚在一起,只有一颗草莓大小。

虽然很小,一旦它受损影响却十分巨大。

比如,受损的语言网络会导致各种失语症,这种情况下人的复杂思维依然存在,却被困在无法表达的脑中;有时甚至连别人说的词都难以区分。

Fedorenko 在 MIT 与博士后研究员 Andrea de Varda (左) and Halie Olson (右)

扫描 1400 人大脑,她发现了人脑中的「语言网络」

Fedorenko 上世纪 80 年代在苏联长大,自幼便对语言萌发了兴趣。

她在母亲的要求下,学会了俄语、英语、法语、德语、西班牙语和波兰语六种语言。

成绩优异的她最终获得了哈佛大学全额奖学金。

她在哈佛大学主修语言学,但在学习过程中,她发现了语言学的局限性。

「这些语言学课很有趣,但更像是在解谜,而不是在解释现实世界到底是怎么运作的。」

于是她又学习了心理学。

2002 年,她从哈佛大学毕业,获得心理学与语言学学士学位。

随后,Fedorenko 进入麻省理工学院(MIT)攻读认知科学与神经科学的研究生课程,并于 2007 年获得博士学位。

在此期间,她开始与 Nancy Kanwisher 合作,后者首次发现了梭状回脸区,这个区域专门负责识别人脸。

Fedorenko 想找到语言在大脑中的对应区域,但当时这方面的研究基础相当薄弱。

在对大约 1400 名受试者的大脑扫描中,Fedorenko 识别出一个普遍存在的语言网络,她将之定义为「始终负责语言计算的组织」。

在不断累积的研究成果之后,2024 年 Fedorenko 在《Nature Reviews Neuroscience》上发表了一篇综述。

她将人类语言网络定义为一种「自然类别」—— 一个天然、独立成型、专门处理语言的功能单元,存在于「每一个典型的成年人脑中」。

Fedorenko 办公室里的三个大脑模型突出了语言网络。从上到下:紫色的是 Laura Bundesen 的刺绣作品;红色的是 Hannah Small 的十字绣;红色的是 3D 打印模型。

什么是语言网络?

在成年人大脑中,有一组核心区域作为一个互相连结的系统,负责计算语言结构。

它们存储词语与意义之间的映射关系,以及如何把词组合成句子的规则。

我们在学习一门语言时,学的就是这些东西。

只要掌握了它们,我们就能很灵活地使用这种「代码」:只要你会一门语言,就能把一个念头转换成词序。

Fedorenko 表示,语言网络和人类身体的其他器官一样,是一个自然类别,拥有一个能指出具体位置的物理结构。

比如,梭状回脸区就是一个可以明确界定的功能单元。

而在语言网络里,大多数人的额叶皮层都有三个区域,都位于左额叶的侧面。

另外,还有几个区域沿着中颞回的侧面分布,那是一大片厚厚的组织沿着整个颞叶延伸。

这些构成了语言网络的核心部分。

我们可以从多个角度看到它们的整体性。

例如,把人放进 fMRI 扫描仪里观察语言处理与对照条件的差异,这些区域总是一起变化。

Fedorenko 称到目前为止扫描了大约 1400 人,已经能建立一张概率地图,显示这些区域最可能出现的位置。

虽然个体之间略有差异,但整体模式非常一致。

在这些额叶和颞叶的大区域里,每个人都会有一些组织在可靠执行语言计算。

语言网络,与其它已知与语言相关的脑解剖区域,如布罗卡区(Broca’s area)不同。

Fedorenko 认为布罗卡区更多是一个发音动作的规划区域。

它主要是根据语音的声音表征,计算出说出这些声音所需的动作,指挥嘴部肌肉的活动,属于语言网络下游,接收语言网络传过去的结构化语言信息。

语言网络既不负责发声,也不负责思考,它在本质上是低层级的感知与运动系统,是与高层级的抽象意义和推理系统之间的接口。

Fedorenko 提到人类主要用语言做两件事。

第一是表达:脑子里蹦出一个模糊的念头,你再从词汇库里(不仅是词,还有更大的结构和组合方式)挑出一套词序,把这个念头表达出来。

然后语言网络把这个词序交给运动系统,让你说出来、写出来或打手语。

第二是理解:声音进耳朵或光线进眼睛后,感知系统先把输入处理成词序。

然后语言网络解析它,在词序里找熟悉的块,再把它们指向存储在别处的意义表征。

对于表达和理解,这个系统都是一个不断更新的「形式到意义的映射仓库」。

掌握了这套代码后,我们既能把想法说出来,也能理解别人说的话。

语言网络的功能是为了交流,那么语言网络的专门化究竟细到什么程度,是否存在专门对某些话语反应的细胞?

Fedorenko 认为语言依赖上下文,因此推测语言网络系统内的编码方式会有些分布式,可能存在对语言某些特定方面反应特别强的神经元。

比如,语言网络区域的一些细胞对书面语和听觉语言也会有类似反应。

谈到语言网络的模式或者特征,Fedorenko 认为大脑的一般物体识别机制和语言网络的抽象程度非常接近。

这和下颞皮层里储存物体形状片段、梭状回脸区储存「一张脸的模板」是类似的。

我们利用这些表征来识别现实世界中的物体,但它们本身与我们的世界知识并无直接联系。

以一句无意义句子「无色的绿色想法愤怒地沉睡」为例,我们可以大致能听懂它的结构,却完全无法把它对应到任何现实知识上。

Fedorenko 和其他团队的研究证实,语言网络对这种无意义句子的反应强度,和对那些有意义的句子几乎一样。

这并不意味着语言网络「笨」,而是说明它确实是个比较浅层的系统。

Fedorenko 认同「每个人脑子里都有个 LLM」这样的说法。

她认为语言网络在很多方面都很像早期的大模型:学习语言的规律,以及词和词之间的关系。

在现实中,你可能会遇到一个说话特别流畅的人,但听了一会儿会发现他们根本没讲什么内容,而他们的大脑也没任何损伤。

这说明他们只调动了大脑中语言网络部分的功能,而思考部分完全没有用上。

虽然,人类语言来自一个类似 ChatGPT 那样「无意识」的系统,这听起来有点不符合直觉。

而且,Fedorenko 在研究早期也认为语言是高级思维的核心,但后来她的研究并不支持这一假设。

早在 2011 年,她已经很清楚,语言网络的所有部分都高度专门化用于语言。

「对于科学家来说,只能更新认知,继续向前探索。」

参考资料:

loading