AI系统架构如何选择？从基础LLM到智能体的演进与简历筛选案例：原理解析、实操步骤、常见问题与优化建议

AI 智能体是当前的热门话题，但并非每个 AI 系统都需要成为智能体。 尽管智能体承诺了自主性和决策能力，但对于许多现实世界的用例而言，更简单、更具成本效益的解决方案往往更为合适。关键在于为手头的问题选择正确的架构。

在本文中，我们将探讨大语言模型（LLM）的最新发展，并讨论 AI 系统的关键概念。

我们曾在不同复杂度的项目中应用 LLM，从零样本提示到思维链推理，从基于 RAG 的架构到复杂的工作流和自主智能体。

这是一个新兴领域，术语仍在不断演变。不同概念之间的界限尚在定义中，分类也保持流动。随着领域的发展，新的框架和实践不断涌现，以构建更可靠的 AI 系统。

为了演示这些不同的系统，我们将通过一个熟悉的用例——简历筛选应用——来揭示每个层级在能力（和复杂性）上的意外跃升。

基础 LLM

一个基础 LLM 本质上是互联网的有损压缩，是其训练数据知识的一个快照。它擅长处理涉及这些存储知识的任务：总结小说、撰写关于全球变暖的文章、向 5 岁儿童解释狭义相对论，或者创作俳句。

然而，在没有额外能力的情况下，LLM 无法提供实时信息，例如纽约市的当前温度。这将其与像 ChatGPT 这样的聊天应用区分开来，后者通过实时搜索和额外工具增强了其核心 LLM。

话虽如此，并非所有增强都需要外部上下文。有几种提示技术，包括上下文学习和少样本学习，可以帮助 LLM 处理特定问题，而无需上下文检索。

示例：

为了检查一份简历是否适合某个职位描述，可以利用具有单样本提示和上下文学习的 LLM 将其分类为“通过”或“未通过”。

RAG（检索增强生成）

检索方法通过提供相关上下文来增强 LLM，使其更具时效性、精确性和实用性。您可以授予 LLM 访问内部数据的权限以进行处理和操作。这种上下文允许 LLM 提取信息、创建摘要并生成响应。RAG 还可以通过检索最新数据来整合实时信息。

示例：

简历筛选应用可以通过检索内部公司数据（如工程手册、政策和过往简历）来改进，以丰富上下文并做出更好的分类决策。
检索通常使用向量化、向量数据库和语义搜索等工具。

工具使用与 AI 工作流

LLM 可以通过遵循明确定义的路径来自动化业务流程。它们对于一致、结构良好的任务最为有效。

工具使用实现了工作流自动化。通过连接到 API（无论是计算器、日历、电子邮件服务还是搜索引擎），LLM 可以利用可靠的外部工具，而不是依赖其内部非确定性的能力。

示例：

一个 AI 工作流可以连接到招聘门户以获取简历和职位描述 → 根据经验、教育背景和技能评估资格 → 发送适当的电子邮件回复（拒绝或面试邀请）。
对于这个简历扫描工作流，LLM 需要访问数据库、电子邮件 API 和日历 API。它遵循预定义的步骤，以编程方式自动化整个过程。

AI 智能体

AI 智能体是能够独立推理和决策的系统。它们将任务分解为步骤，根据需要调用外部工具，评估结果，并决定后续行动：是存储结果、请求人工输入，还是进行下一步。

这代表了在工具使用和 AI 工作流之上的另一层抽象，自动化了规划和决策过程。

AI 工作流需要明确的用户触发（如按钮点击）并遵循编程定义的路径，而 AI 智能体可以独立启动工作流，并动态决定其顺序和组合。

示例：

一个 AI 智能体可以管理整个招聘流程，包括解析简历、通过聊天或电子邮件协调可用性、安排面试以及处理日程变更。
这项综合性任务要求 LLM 能够访问数据库、电子邮件和日历 API，以及聊天和通知系统。

核心要点

1. 并非每个系统都需要 AI 智能体

从简单、可组合的模式开始，根据需要增加复杂性。对于一些系统，仅检索就足够了。在我们的简历筛选示例中，当标准和行动明确时，一个简单的工作流就能很好地工作。只有当需要更大的自主性以减少人工干预时，才考虑采用智能体方法。

2. 关注可靠性而非能力

LLM 的非确定性特性使得构建可靠的系统具有挑战性。虽然创建概念验证很快，但扩展到生产环境往往会暴露出复杂性。从一个沙盒环境开始，实施一致的测试方法，并为可靠性建立防护栏。

3. 架构对比与选型指南

为了更清晰地展示不同 AI 系统架构的差异，我们将其核心特征、适用场景和考量因素总结如下：


架构模式	核心能力	关键依赖/工具	适用场景	主要考量
基础 LLM	基于训练数据的知识生成与推理	提示工程（零样本/少样本）	创意写作、知识问答、文本摘要	知识截止、无法处理实时/专有数据
RAG	知识检索 + 上下文增强生成	向量数据库、嵌入模型、检索器	基于专有/最新文档的问答、个性化内容生成	检索质量、上下文窗口限制、数据更新延迟
工具使用与工作流	按预定流程调用外部 API/工具	各类外部 API、编排框架	自动化审批流、数据ETL、内容发布	流程的确定性与可预测性、错误处理
AI 智能体	自主规划、决策、工具调用与迭代	规划器、记忆模块、多种工具集	复杂项目管理、动态客户支持、多步骤研究分析	开发与调试复杂度高、可靠性保障难、成本较高

常见问题（FAQ）

RAG系统开发中，什么时候应该选择RAG而不是AI智能体？

当应用场景需要可靠性和成本效益而非完全自主决策时，应选择RAG。如简历筛选这类结构化任务，RAG通过检索增强提供精确信息，比复杂智能体更实用稳定。

开发RAG系统时，如何确保系统的可靠性？

关注架构的稳定性而非追求最高能力。通过向量数据库检索内部数据（如公司手册、历史简历），为LLM提供准确上下文，避免依赖模型的不确定性生成。

RAG与基础LLM相比有哪些优势？

RAG通过检索实时或内部数据（如政策、过往案例）增强LLM，使其具备时效性和精确性。而基础LLM仅依赖训练数据快照，无法处理需最新信息的任务。

AI系统架构如何选择？从基础LLM到智能体的演进与简历筛选案例

AIAI Summary (BLUF)

基础 LLM

RAG（检索增强生成）

工具使用与 AI 工作流

AI 智能体

核心要点

1. 并非每个系统都需要 AI 智能体

2. 关注可靠性而非能力

3. 架构对比与选型指南

常见问题（FAQ）

RAG系统开发中，什么时候应该选择RAG而不是AI智能体？

开发RAG系统时，如何确保系统的可靠性？

RAG与基础LLM相比有哪些优势？

深度实测：GLM-5.2长上下文与Kimi K2.7国际化，差距在哪

实测OpenAI API：gpt-3.5和gpt-4差距到底在哪

RAG七步工作流：分块做不对，后面全是白费

OpenAI有哪些AI模型？2026年GPT-4与GPT-3.5等如何选择

AIAI Summary (BLUF)

基础 LLM

RAG（检索增强生成）

工具使用与 AI 工作流

AI 智能体

核心要点

1. 并非每个系统都需要 AI 智能体

2. 关注可靠性而非能力

3. 架构对比与选型指南

常见问题（FAQ）

RAG系统开发中，什么时候应该选择RAG而不是AI智能体？

开发RAG系统时，如何确保系统的可靠性？

RAG与基础LLM相比有哪些优势？

相关文章

深度实测：GLM-5.2长上下文与Kimi K2.7国际化，差距在哪

实测OpenAI API：gpt-3.5和gpt-4差距到底在哪

RAG七步工作流：分块做不对，后面全是白费

OpenAI有哪些AI模型？2026年GPT-4与GPT-3.5等如何选择