在 AI 技術快速發展的今天,許多術語經常被混用,造成理解上的困惑。這篇文章要帶大家釐清三個重要概念:AI AgentsAI Workflows 和 Agentic Workflows,並且說明了agentic AI 的一個關鍵原則:Agentic Workflows。

AI Agents:具備推理能力的智慧系統

Components of AI Agents
Components of AI Agents

AI Agents 是結合了大型語言模型進行推理決策,以及各種工具來與現實世界互動的系統。它們被賦予特定角色和不同程度的自主權來完成目標,並配備記憶系統以從過往經驗中學習。

AI Agents 有三個核心組成要素:

1. 推理能力(Reasoning)

  • 規劃階段:進行任務分解,將複雜問題拆解為較小的可執行步驟
  • 反思階段:評估行動結果,並根據外部資料來調整行動計畫

2. 工具使用(Tools)

由於 LLM 只有靜態的參數化知識,AI Agents 需要透過外部工具來擴展能力,例如網路搜索、向量搜索、API等。

3. 記憶系統(Memory)

  • 短期記憶:儲存對話歷史等即時資訊
  • 長期記憶:跨多個會話累積知識,實現個人化和性能改善

Workflows:從傳統到 AI 驅動的演進

image

Workflows是一系列旨在實現特定任務或目標的連接步驟。最簡單的工作流程類型是確定性的,它們遵循預定義的步驟,無法適應新資訊或不斷變化的條件。

文章很清楚地區分了三種不同類型的工作流程:

1. 傳統工作流程(Traditional Workflows)

  • 特徵:確定性的、遵循預定義步驟
  • 例子:「如果費用標記為餐費且少於 30 美元,則自動批准」
  • 限制:無法適應新資訊或變化條件

2. AI 工作流程(AI Workflows)

  • 特徵:利用 LLM 或其他機器學習模型
  • 分為兩種:非代理 AI 工作流程和代理 AI 工作流程

3. 非代理 AI 工作流程(Non-Agentic AI Workflows)

  • LLM 接收指令並生成輸出
  • 例子:文本摘要工作流程 – 輸入長文本 → LLM 摘要 → 返回摘要
  • 特點:靜態 AI 模型,缺乏動態適應能力

Agentic Workflows:動態智慧的工作流程

Agentic Workflows(代理工作流程) 是由一個或多個代理動態執行的一系列連接步驟,用以實現特定任務或目標。

關鍵差異分析

比較維度傳統工作流程非agentic AI 工作流程agent工作流程
決策機制預定義規則靜態 AI 模型動態 AI 代理
適應性無法適應變化有限適應能力高度適應性
規劃能力固定步驟單次推理動態規劃和任務分解
工具使用預設功能有限工具整合動態工具選擇和使用
學習能力具備短期和長期記憶
錯誤處理固定錯誤處理基本錯誤回應反思和迭代改進

讓工作流程變得「代理化」(agentic)的三個關鍵要素

  1. 制定計畫:透過任務分解將複雜任務拆解為子任務,並決定最佳執行路線
  2. 使用工具執行行動:使用預定義工具配合權限來完成任務
  3. 反思迭代:評估每步結果,必要時調整計畫,直到達到滿意的結果

實際應用中的差異

文本摘要的不同實作方式:

非agentic AI 工作流程

輸入文本 → LLM 摘要提示 → 生成摘要 → 輸出結果

agent工作流程

輸入文本 → agent分析文本複雜度 → 決定摘要策略 → 可能查詢相關背景資訊 → 生成摘要 → 自我評估摘要品質 → 如需要則迭代改進 → 最終輸出

Agentic Architectures vs. Agentic Workflows

文章也澄清了另一組容易混淆的概念:

  • Agentic Workflow:agent為達成特定目標所採取的一系列步驟
  • Agentic Architecture:用於實現特定任務的技術框架和整體系統設計

簡單來說,Workflow 是「做什麼」,Architecture 是「怎麼建構」。

三大核心設計模式

1. 規劃模式(Planning Pattern)

image

透過任務分解將複雜問題拆分成更小、更簡單的子任務。這特別適用於解決方法不明確且需要適應性問題解決的情況。

2. 工具使用模式(Tool Use Pattern)

image

讓 AI 代理能夠動態與現實世界互動,而不僅僅是從中檢索資料。常見工具包括 API、向量搜尋、網頁瀏覽器等。

3. 反思模式(Reflection Pattern)

image

這是一個自我回饋機制,agent會迭代評估其輸出或決策的品質,然後用這些批評來改進方法。

實際應用案例

文章介紹了幾個令人印象深刻的應用:

Agentic RAG(檢索增強生成): 不只是簡單的資料檢索,而是能夠分解複雜查詢、評估檢索資料的相關性,並在需要時重新制定查詢策略。

Agentic Research Assistants: 像是 OpenAI、Perplexity 和 Google 的深度研究功能,能夠主動尋求使用者指導、適應計畫並追求新的有趣角度來合成資訊。

Agentic Coding Assistants: 如 Anthropic 的 Claude Code 和 Cursor 的 Agent,不僅能生成程式碼,還能執行、除錯並從錯誤中學習。

優勢與挑戰並存

主要優勢:

  • 靈活性和適應性強
  • 在複雜任務上表現更佳
  • 具備自我糾錯和持續學習能力
  • 提升營運效率和可擴展性

主要挑戰:

  • 簡單任務可能造成不必要的複雜性
  • 自主性增加可能降低可靠性
  • 需要謹慎考慮倫理和實際應用問題

何時該使用 Agentic Workflows?

在決定是否使用代理工作流程時,可以問自己幾個問題:

  • 這個任務是否複雜到需要適應性決策?
  • 簡單的 AI 輔助工具是否就能達到同樣效果?
  • 工作流程是否涉及不確定性、變化條件或多步驟推理?
  • 賦予代理自主權的風險是什麼,能否有效控制?

結語

Agentic Workflows 代表了 AI 技術發展的一個重要里程碑,它們不僅僅是更聰明的自動化工具,而是能夠思考、適應和學習的智慧系統。雖然這項技術仍在快速發展中,但它已經展現出在複雜任務自動化方面的巨大潛力。

關鍵是要理解:並非所有情況都需要使用代理工作流程。選擇合適的工具來解決特定問題,才是明智的做法。隨著技術的成熟,我們期待看到更多創新的應用和更完善的實作方式。

更多技術文章,歡迎參考技術文章

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

返回頂端