综述：AI Agent 与 Agentic AI 有什么区别？

来看一篇综述文章，了解 AI Agent 和 Agentic AI（注：在这篇论文的语境下接近于 Multi-Agent）这两个当前 AI 领域的热门概念的联系和区别。

文章首先将生成式 AI 定位为基础，指出 AI Agent 在此基础上通过集成工具、强化推理和 Prompt 工程实现任务自动化。AI Agent 通常是模块化的、由大语言模型（LLM）或大图像模型（LIM）驱动的、专注于特定任务的系统。
Agentic AI 代表了一种范式转变，它涉及多个 AI Agent 之间的协作、动态任务分解、拥有持久记忆以及更高级的自主性。
文章通过比较它们的架构演进、运行机制、交互方式和自主水平，展示了这两种范式的区别。
论文还对比了两者的应用领域（如客服 vs. 研究自动化）并分析了各自面临的独特挑战（如幻觉、脆弱性 vs. 涌现行为、协调失败），并提出了相应的潜在解决方案。
为构建稳健、可扩展、可解释的 AI 驱动系统提供一个明确的路线图。

论文：

[2505.10468] AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges

一、什么不是 Agent？

都说今年是「Agent 元年」，各种号称「Agent」的系统层出不穷，万物都变成了 Agent。但与此同时，另一个概念「Agentic AI」也开始进入视野。这两个词听起来很像，都和「Agent」有关，它们到底有什么区别？是同一个东西的不同叫法，还是代表了 AI 智能体发展的不同阶段或模式？

要理解 AI Agent，我们得先回顾一下不是 Agent 的 AI 是什么样子。

我们就仅以生成式 AI（Generative AI） 为例，比如能写文章、翻译、聊天的大型语言模型（LLMs），以及能理解和生成图像的大型图像模型（LIMs）。它们的核心能力在于「生成内容」，它们是被动反应式的。你给它一个 Prompt，它响应一次，然后就「忘记」了这次交互，等待下一个 Prompt。它们没有自己的目标，不会主动去感知环境、采取行动，更无法调用外部工具去完成现实世界的任务。它们就像一个被困在数字世界里的「理论家」，只能在自己的世界里创作，无法伸出手去触碰外部世界。

但现实世界的任务往往需要 AI 不仅能「说」或「写」，还需要能「做」。比如，帮我预定机票、查询最新的股票价格、分析一份 PDF 文档、或者控制一个机器人完成某个操作。裸的生成式 AI 本身做不到这些。

有需求就有变革。越来越多的研究者开始思考，如何让这些强大的生成模型变得更加「主动」和「有用」，能够像一个真正的「智能体」（Agent）那样，替我们去完成任务。

二、什么是 Agent？

在今天的大多数语境下，你可以把 AI Agent「狭义地」理解为一个由强大的生成模型驱动，并配备了各种外部工具的单体智能体。它的出现，让 AI 从一个「内容生成器」变成了一个「任务执行者」。

2.1 核心特征

在这篇综述论文中，AI Agent 被定义为能够在特定数字环境中执行目标导向任务的自主软件实体。它有几个核心特征：

自主性（Autonomy）： 在设定目标后，能在一定程度上独立运作，减少人工干预。
任务特异性（Task-Specificity）： 通常被设计用来完成某个或某类特定的任务，例如客服、日程安排、信息检索等。