基于情景记忆模型的乌贼行为模拟:揭示跨物种认知演化的计算机制
《Scientific Reports》:Episodic-like memory in a simulation of cuttlefish behavior
【字体:
大
中
小
】
时间:2025年12月14日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对无脊椎动物情景记忆的神经机制难题,通过构建受海马索引理论启发的三维记忆模型,成功模拟了乌贼在捕食者-猎物复杂环境中的决策行为。模型通过Delta规则学习"what-when-where"关联,采用Softmax函数进行行为选择,不仅复现了乌贼延迟满足实验中的情景记忆特征,更揭示了查询方式(What-When vs When-Where)对风险决策的显著影响,为垂直叶(vertical lobe)的认知计算功能提供了新的理论框架。
在认知科学领域,情景记忆(episodic memory)长期被视为人类独有的高级认知功能,其特征是能够回忆特定事件中的"什么(what)"、"何时(when)"和"何地(where)"信息。然而近年来的行为实验不断挑战这一观点:从能够记住食物储藏位置的灌丛鸦(scrub jays),到表现出延迟满足能力的乌贼(cuttlefish),越来越多的证据表明情景记忆可能存在于缺乏大脑皮层的生物中。特别令人惊讶的是,乌贼作为无脊椎动物,其神经系统与脊椎动物存在显著差异,却能在实验中准确记忆偏好食物(虾)出现的时间和位置,这种跨物种的认知相似性引发了关于认知演化机制的重要科学问题。
为探究这一现象,加州大学欧文分校的Kandimalla团队在《Scientific Reports》发表的研究中,构建了一个基于海马索引理论(hippocampal indexing theory)的计算模型。该研究通过两个阶段的模拟实验,不仅成功复现了乌贼经典的情景记忆行为,更创新性地引入捕食者-猎物动态场景,揭示了记忆查询方式如何影响决策策略这一深层机制。
研究采用的核心技术方法包括:1)构建三维记忆矩阵模型(8×8/12×12网格环境),通过Delta规则(Δepimem[what,when,where]=α(r-epimem[what,when,where]))进行强化学习;2)采用Softmax函数(act=βevi/Σjβevj)进行行为选择;3)设计两种记忆查询模式(What-When查询与When-Where查询);4)通过100次重复模拟(100天×3小时/200天×6小时)确保统计可靠性。
在复现乌贼经典实验的模拟中,模型完美展现了相位依赖的行为转换。相位1(前50天)时虾和蟹均可持续获取,模型选择虾的比例达75.3%(图4A);相位2(后50天)当虾仅在3小时延迟后可用时,模型在1小时延迟后选择蟹的比例升至68.9%,而在3小时延迟后转向虾的比例达81.4%(图4B)。这一结果与Jozet-Alves等(2013)的实际实验数据高度一致,证明三维记忆结构可有效支持"what-when-where"关联记忆。
当引入捕食者(视野范围4格)与区域化食物分布(虾在区域6,蟹在区域8)的复杂环境后,两种查询模式展现出截然不同的行为模式:
- •What-When查询实验:通过汇总各物体在所有位置的价值总和进行决策,模型最终表现出风险规避特性。第100天时虾捕获量(均值3.2次/天)显著高于蟹(1.1次/天),且被捕食率降至0.3次/天(图5)。行为时序分析显示,后期模型能精准避开捕食者活动时段(第1-3小时),在安全时段(第4-6小时)集中捕食虾(图6B)。
- •When-Where查询实验:按区域汇总价值的方式则引发机会主义行为。虽然虾的价值更高,但模型更倾向于选择路径安全的区域8捕蟹(第100天蟹捕获量2.8次/天 vs 虾1.5次/天),甚至在第2-3小时捕食者存在时仍冒险进入区域6(图8B),导致被捕食率(0.9次/天)显著高于What-When模式(图7)。
研究还发现,通过对记忆矩阵进行跨时间维度的连续查询(如图9所示),模型可生成预期价值的时间景观图。这种机制使代理能够"预演"不同时段各空间位置的风险收益分布,虽未在本文中实现自主推理算法,但为未来实现真正意义上的心理时间旅行(mental time travel)提供了基础架构。
这项研究的突破性在于首次通过计算模型揭示了乌贼垂直叶(vertical lobe)可能存在的索引编码机制。尽管乌贼缺乏海马体,但其垂直叶的扇入-扇出(fan-in fan-out)结构与海马索引理论存在功能相似性:来自前叶(frontal lobes)的多模态输入相当于皮层索引,而大型传出神经元至运动区的投射则类似海马至皮层的反馈通路。模型对查询策略敏感性的发现(What-When查询导致风险规避,When-Where查询引发机会主义)进一步表明,记忆的提取方式可直接塑造决策模式,这为理解动物行为的灵活性提供了新视角。
该模型虽然简化了生物细节(如路径规划、时间感知机制),但为跨物种认知比较建立了可扩展的计算框架。未来通过结合稀疏量化霍普菲尔德网络(sparse quantized Hopfield networks)等先进记忆模型,或嵌入具身机器人(如CuttleBot项目)实现主动环境交互,将能进一步验证垂直叶在自然场景中的计算效能。这项研究最终提示,情景记忆可能是一种通过不同神经结构实现的功能收敛(convergent evolution),而非脊椎动物独有的认知特权。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号