来看一篇综述文章,了解 AI Agent 和 Agentic AI(注:在这篇论文的语境下接近于 Multi-Agent)这两个当前 AI 领域的热门概念的联系和区别。

论文:

[2505.10468] AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges

一、什么不是 Agent?

都说今年是「Agent 元年」,各种号称「Agent」的系统层出不穷,万物都变成了 Agent。但与此同时,另一个概念「Agentic AI」也开始进入视野。这两个词听起来很像,都和「Agent」有关,它们到底有什么区别?是同一个东西的不同叫法,还是代表了 AI 智能体发展的不同阶段或模式?

要理解 AI Agent,我们得先回顾一下不是 Agent 的 AI 是什么样子。

我们就仅以生成式 AI(Generative AI) 为例,比如能写文章、翻译、聊天的大型语言模型(LLMs),以及能理解和生成图像的大型图像模型(LIMs)。它们的核心能力在于「生成内容」,它们是被动反应式的。你给它一个 Prompt,它响应一次,然后就「忘记」了这次交互,等待下一个 Prompt。它们没有自己的目标,不会主动去感知环境、采取行动,更无法调用外部工具去完成现实世界的任务。它们就像一个被困在数字世界里的「理论家」,只能在自己的世界里创作,无法伸出手去触碰外部世界。

但现实世界的任务往往需要 AI 不仅能「说」或「写」,还需要能「做」。比如,帮我预定机票、查询最新的股票价格、分析一份 PDF 文档、或者控制一个机器人完成某个操作。裸的生成式 AI 本身做不到这些。

有需求就有变革。越来越多的研究者开始思考,如何让这些强大的生成模型变得更加「主动」和「有用」,能够像一个真正的「智能体」(Agent)那样,替我们去完成任务。

二、什么是 Agent?

在今天的大多数语境下,你可以把 AI Agent「狭义地」理解为一个由强大的生成模型驱动,并配备了各种外部工具的单体智能体。它的出现,让 AI 从一个「内容生成器」变成了一个「任务执行者」。

2.1 核心特征

在这篇综述论文中,AI Agent 被定义为能够在特定数字环境中执行目标导向任务的自主软件实体。它有几个核心特征: