Agentic AI的双重范式:架构、应用与未来方向的系统综述
《ARTIFICIAL INTELLIGENCE REVIEW》:Agentic AI: a comprehensive survey of architectures, applications, and future directions
【字体:
大
中
小
】
时间:2025年11月16日
来源:ARTIFICIAL INTELLIGENCE REVIEW 13.9
编辑推荐:
本刊特荐:为解决Agentic AI领域概念混淆(如概念复古fitting)及研究碎片化问题,研究人员开展了首次基于PRISMA框架的系统性综述,引入双重范式分类法(符号化/古典 vs. 神经/生成),通过对90项研究(2018-2025)的分析,明确了各范式的理论基础、应用领域及治理挑战,指出神经符号混合架构是未来实现兼具适应性与可靠性智能系统的关键路径。此项工作为Agentic AI的研究、开发与政策制定提供了清晰的概念框架与战略路线图。
在人工智能(AI)研究领域,一场静默的革命正在发生:研究的焦点正从开发被动的、任务特定的工具,转向设计能够展现真正自主行为(Agency)的系统。这就是Agentic AI的时代。现代Agentic AI系统,如AutoGPT、CrewAI等,展现出主动规划、情境记忆、复杂工具使用以及根据环境反馈调整行为的能力。它们不再是简单的“求解器”,而是能够动态感知复杂环境、推理抽象目标、并编排一系列行动(无论是独立进行还是作为复杂多智能体生态系统的一部分)的协作伙伴。
然而,这场快速的演进也带来了理解上的碎片化与时代错位。一个关键问题在于“概念复古拟合”(Conceptual Retrofitting),即错误地应用经典的符号化框架(如BDI模型、PPAR循环)来描述基于大型语言模型(LLM)构建的现代系统,而后者运作于完全不同的随机生成和提示驱动编排原则之上。这种做法模糊了基于LLM的智能体的真实运作机制,并在不兼容的架构范式之间制造了一种虚假的连续性。此外,现有的综述往往局限于特定技术方面、应用领域或高层概念,缺乏一个能够承认根本性范式分裂的统一框架。
为了厘清这片迷雾,发表在《Artificial Intelligence Review》上的这篇综述文章《Agentic AI: a comprehensive survey of architectures, applications, and future directions》应运而生。它旨在通过引入一个新颖的双重范式分类法,为Agentic AI领域提供一个清晰、系统的分析框架。
研究人员为了回答“如何清晰界定并系统分析Agentic AI领域”这一核心问题,采用了严谨的系统性文献综述方法。他们遵循PRISMA 2020指南,对2018年至2025年3月期间的文献进行了检索与筛选。最终,通过对90项研究的深入分析,并结合对12篇符号AI领域奠基性文献的补充参考,构建了本次综述的实证基础。
本研究的核心贡献在于提出了一个全新的概念框架,明确将Agentic系统划分为两个截然不同的谱系:符号化/古典范式和神经/生成范式。
- •符号化/古典范式:其根源在于显式逻辑、算法规划和确定性或概率模型。它依赖于算法规划和持久状态,其演进涵盖了从马尔可夫决策过程(MDP)、部分可观测马尔可夫决策过程(POMDP)到BDI、SOAR等认知架构。这些系统通过符号表示直接实现感知-计划-行动-反思(PPAR)循环,其智能被视为一种自上而下的演绎过程。
- •神经/生成范式:则建立在从数据中进行统计学习的基础上,其顶峰是大型语言模型(LLM)的生成能力。它利用随机生成和提示驱动编排,标志着从显式逻辑转向涌现的、随机性行为的决定性转变。现代框架如LangChain、AutoGen、CrewAI等,并非实现符号化的PPAR循环或BDI架构,而是代表了一种LLM编排的新范式。在这些框架中,预训练模型充当中央执行器,通过提示链、多智能体对话、基于角色的工作流等机制来协调任务。
为了开展这项研究,作者团队主要运用了几项关键技术方法:首先是系统性文献综述方法(PRISMA),确保了文献检索、筛选与合成的透明度和可重复性。其次是双重范式分类与主题合成,使用预定义的符号与神经范式类别作为初始编码,进行演绎性编码,并辅以归纳性编码识别新兴主题,编码者间信度(Cohen‘s Kappa)达到0.82,保证了分析可靠性。此外,研究还进行了跨范式比较分析,对比两种范式在实现机制、性能表现和应用局限等方面的根本差异。最后,通过领域聚类与伦理编码,将应用按领域(如医疗保健、金融、机器人学)分组,并使用结构化词典标记治理、安全、透明度等伦理挑战主题,重点关注这些挑战在不同范式中的差异化表现。
研究发现揭示了Agentic AI领域的几个关键模式:
分析表明,范式选择是一个战略决策,高度依赖于领域特定的约束条件。在医疗健康、法律科技等高风险、受严格监管的领域,符号化或高度受限的神经架构占据主导地位,以确保安全性和可审计性。例如,基于规则的临床决策支持工具(符号化),或用于生成结构化医疗报告但被限制在确定性工具链管道中的LLM框架(神经范式)。而在金融、教育科技等动态、数据丰富的环境中,神经编排框架则更为盛行,用于复杂的市场分析、风险建模和自适应学习。
在多智能体系统(MAS)协调机制上,两种范式展现出根本性差异。符号化范式依赖于预先定义的算法协议,如合同网协议、黑板系统,这些协议可验证、可预测,但灵活性低。神经范式的协调则通过结构化对话和提示驱动编排涌现出来,例如AutoGen中的多智能体对话、CrewAI中的角色工作流,具有高适应性,但可验证性和可追溯性较低。
伦理与治理研究明显偏向神经范式,关注其对齐、偏见、不透明性等新挑战。而对于现代复杂符号化系统的治理框架研究则存在显著空白,这在符号化AI主导的安全关键系统部署中构成了潜在脆弱性。
对Agentic系统的评估不能仅靠准确率等传统指标,而需采用多维度框架。符号化系统侧重于目标完成保真度、计划最优性和逻辑健全性等可验证性指标。神经系统则需评估其任务成功率、上下文窗口和记忆管理、工具使用熟练度、提示鲁棒性以及实际成本与延迟等。
数据显示了一个清晰的时序范式转变:符号化和混合认知架构在早期研究(2018-2021)中占主导地位,而神经编排框架在2022年LLM兴起后占据了绝对优势。
伦理挑战在两种范式中的表现和缓解策略截然不同。符号化范式的风险包括“有害实例化”(完美执行有缺陷的目标规范)和规则集的偏见,治理策略侧重于形式化验证和逻辑审计。神经范式的风险则包括提示注入、目标漂移、价值误泛化以及训练数据偏见的随机放大,治理更依赖于红队测试、对抗性去偏见和宪法AI等方法。神经范式特有的“归因鸿沟”对建立在直接因果关系和意图基础上的法律框架构成了严峻挑战。
综述识别了诸多研究空白,并提出了范式特定的路线图。关键空白包括:缺乏针对各范式的标准化评估基准;符号化系统在开放世界中的 brittleness(脆弱性)与神经系统在真正抽象推理方面的不足;神经系统的长期记忆问题;以及对大规模云计算的极端依赖。最具前景的未来方向是神经符号集成,旨在创建结合符号化可靠性和神经适应性的混合架构。其他方向包括在多智能体生态系统中定义范式专业化角色、发展范式感知的治理框架,以及与其他技术(如物联网、区块链、量子计算)的融合。
本综述通过引入并验证双重范式分类法,成功解决了Agentic AI领域的概念混淆问题。它清晰地表明,将现代LLM编排的智能体用符号化系统的语言(如PPAR循环、BDI)来描述,会掩盖其真实本质并阻碍进步。有效的治理、评估和发展必须针对每种架构谱系进行战略性定制。
这项工作的最重要意义在于论证了最具生产力的前进道路是混合智能,而非孤立发展。Agentic AI的未来在于神经符号架构的战略性整合,以利用符号化可靠性和神经适应性的互补优势。这项研究为研究人员、工程师和政策制定者提供了精确的词汇表和功能分类法,以便对系统进行分类,恰当地评估其能力和风险,并做出明智的设计选择。
最终,Agentic AI的发展不仅仅是一个技术挑战,更是一个社会技术挑战。其成功与否取决于我们能否构建出不仅强大而且值得信赖的系统。这需要一种自觉和审慎的努力,去建造混合智能系统——既适应性强又可靠,既富有创造性又稳健可靠。通过认识并拥抱这两种架构谱系的独特性质,我们可以引导这项变革性技术走向一个未来,在那里,Agentic系统能够真正作为值得信赖的协作者,服务于科学发现、提供公平可及的服务,并构成关键基础设施的健壮、可验证的支柱。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号