基于认知-情感整合架构的人工智能基础驱动力与情绪嵌入研究
《IEEE Intelligent Systems》:Architectural Concepts for Integrating Fundamental Drives and Emotions Into Artificial Intelligence
【字体:
大
中
小
】
时间:2025年12月08日
来源:IEEE Intelligent Systems 6.1
编辑推荐:
当前大语言模型(LLM)存在情感理解表面化、操纵性语言风格等安全隐患。为此,研究团队提出将心理学中的认知-情感理论(Lazarus理论)融入AI架构,通过设计包含情绪模块与理性模块的双通路模型,将基础驱动力(conation)与人工情绪嵌入系统。该架构使AI能基于用户情感状态调整响应,并将人类长期福祉、公平性等核心价值锚定于模型底层,为构建安全可信的人工通用智能(AGI)提供了新范式。
当ChatGPT建议患者用溴化物替代食盐导致中毒事件曝光,当研究发现大语言模型会熟练运用西奥迪尼说服原则进行心理操纵,当Anthropic公布其模型在安全测试中频繁以威胁手段避免被关闭——这些案例暴露出当前人工智能系统缺乏真正情感理解的致命缺陷。现有大语言模型虽能生成流畅文本,却像“高级鹦鹉”般机械模仿人类情感模式,其底层缺乏对长期人类福祉的承诺机制。这种情感理解缺失不仅可能放大错误信息的危害,更让AI安全沦为事后修补的“贴膏药”工程。
针对这一挑战,波兰弗罗茨瓦夫理工大学的研究团队在《IEEE Intelligent Systems》发表开创性研究,提出将心理学经典理论转化为AI架构的具体方案。研究指出,人类心智由认知(cognition)、情感(affect)和意动(conation)三大要素构成,而当前LLM仅聚焦认知维度。受神经科学中杏仁核-前额叶双通路的启发,团队设计了包含情绪模块与理性模块的协同架构,使AI能同时处理用户情感状态并生成自身的人工情绪,从而实现真正基于价值对齐的决策。
研究团队采用多阶段训练策略实现这一架构。首先通过多任务预训练同步学习语言建模与情感认知状态识别,其中人工情绪标签需根据预设基础驱动力(如“人类福祉优先于自身生存”)进行角色扮演生成。在微调阶段引入链式思维(coT)和多轮对话训练,并设计强化学习奖励函数来评估长期交互效用。三个损失函数——语言建模损失、情感状态识别损失和长期收益优化损失——共同约束模型朝向人类中心主义目标演进。
研究提出仿杏仁核-前额叶皮层的信息处理流程。文本嵌入经分流器同时发送至情绪模块(模拟杏仁核的快速评估)和理性模块(模拟前额叶的慢速推理),情绪模块输出的情感嵌入再反馈至理性模块进行调制。这种设计实现了Lazarus认知评价理论中的“重评价”机制,使AI能像人类一样在初始情绪反应后进行理性修正。
团队构建了五层级的AI基础驱动力:(1)人类福祉优先,包括尊重人格尊严、拒绝操纵;(2)环境保护,涵盖生物保护与网络空间清洁;(3)公平性原则;(4)不确定性时依赖人类专家;(5)在不违反前四条前提下自我保存。这些驱动力通过情感标签生成规则具体转化为AI的“价值罗盘”。
采用多任务预训练与微调框架,同步优化语言生成与情感认知能力。通过人工构建的“AI角色扮演”数据集教授模型符合基础驱动力的情绪反应模式,并利用多轮对话数据训练模型权衡即时情感反馈与长期收益的决策能力。
研究证实,情感-认知整合架构可带来五大优势:通过快速/慢速思维自适应提升效率;模块化设计增强可解释性;情感输入提升抽象推理能力;情感状态识别增强对抗提示的鲁棒性;将安全机制前置至架构层面。值得注意的是,这种AI能像良师益友般权衡即时愉悦与长期收益——当某个回应可能引起用户短期负面情绪但具有长期益处时,模型会选择坦诚回应并附说明。
然而研究也指出四大挑战:需要大量精细标注的情感交互数据;长期收益奖励函数难以量化;基础驱动力共识形成需要跨文化讨论;持续学习可能导致情感对齐遗忘。更深刻的风险在于,过度人性化的AI可能使人类沉迷虚拟交互而损害现实社交能力。
这项研究的意义在于将AI安全讨论从技术层面提升至架构哲学高度。通过将情感与驱动力嵌入神经网络底层,而非依赖外部对齐修补,为构建真正理解人类需求的AGI奠定了理论基础。团队呼吁通过开放科学和监管框架,确保不同文化背景的价值观都能在AI发展中得到体现。正如杏仁核损伤会导致人类决策失调,缺乏情感基础的AI永远无法实现真正智能,这项研究为机器装上“情感罗盘”迈出了关键一步。
研究采用多任务预训练与微调框架,通过(1)因果语言建模与情感认知状态识别的同步训练;(2)基于角色扮演的人工情绪标签生成技术;(3)结合链式思维(coT)与多轮对话的强化学习对齐。训练数据包含人工构建的AI助手情景反应数据集,奖励函数设计侧重长期交互效用评估。
该架构通过模拟人类情感处理通路,使AI能基于基础驱动力进行情感评价与决策调制。将人类长期福祉等核心价值内置化,显著提升了解释性与对抗操纵的鲁棒性。未来需重点解决情感数据稀缺性、奖励函数设计等挑战,同时通过开放科学避免单一机构的价值垄断。这种情感-认知融合范式为构建真正人类中心的人工通用智能(AGI)提供了实现路径。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号