纸飞机:开源数据！综艺场景下多人对话的fMRI+MEG自然场景公开数据集

动态 2025-11-28 07:56

　　：同时有好几个人在说话，你得在嘈杂中锁定目标、随时切换注意、记住是谁说了什么、下一句可能接什么话。

　　传统语言神经科学多在实验室里用控制良好的句子或单人叙述来研究语言加工，这当然干净、可重复，但也不可避免地“失真”：现实世界的语言交流往往是多说话人、情绪浓、话题跳转快、甚至彼此打断。要理解我们真实是如何在脑中处理语言，必须把实验拉回生活本身。

　　这篇数据论文提供了一个少见而扎实的“自然场景（naturalistic）”大礼包：研究团队把两组各30名受试者分别送进fMRI和MEG仪器里，同时观看同一段25分钟的中文真人秀《爸爸去哪儿》（第一季）片段。节目发生在乡村场景，有11位说话者（五对父子加工作人员/村民），对话真实、情绪充沛、频繁换说话人、还有自然的打断与重叠语音。看完视频后，受试者还要做5道理解题，随后进行15分钟“回放式静息（replay-like rest）”，让研究者观察观看后记忆与加工的延续效应。这样的设计既有fMRI的空间分辨率优势（在哪里激活）、又有MEG的时间分辨率优势（何时激活），非常适合研究多人会话理解、注意力重定向与社会性沟通的神经机制。相关流程在图1（第2页）里有一张总览图，从刺激到预处理到技术验证与注释一目了然。

　　最关键的是，作者不仅把神经数据开源到OpenNeuro，还把音频/文本做了精细注释：逐句对齐的文字、说话人标签、声学特征（音高f0、强度RMS）、以及词层面的词频、词性（POS）、多种句法解析复杂度（比如自顶向下/自底向上/左角策略的“parser actions”数）。这对做语言模型-脑映射、语音-语义分层建模，或研究“说话人切换（speaker switching）”的学者，是一套可直接上手的资源。作者还在fMRI/MEG上做了一致性（ISC）与GLM/回归验证：如在说话人切换瞬间，右侧颞顶联合区（right TPJ）显著激活——这个区域常被认为参与“把注意力从当前不关注、却与任务相关的刺激上重新拉回”的关键网络。图6（第9页）把“音高/强度/说话人切换”三个特征的fMRI结果与Neurosynth的术语反推图谱做了对照，解释力很强；对应的MEG时间动力学也在图7（第10–11页）给出，补上“何时发生”的拼图。