本文將淺談 AI Agent 對於 AI 實際應用的重要性,以及其定義和熱門的應用案例。
從 ChatGPT 到 AI Agent
自 2022 年 11 月 30 日 ChatGPT 推出以來,全球各大科技企業紛紛競相購入更多的圖形處理單元(Graphics Processing Unit,GPU),提升訓練大型語言模型(Large Language Model,LLM)的運算能力,並建構規模更大、參數更多的 LLM。此期間,AI 是否會再次出現泡沫化的議題也開始被廣泛討論。許多人認為,探索 LLM 如何應用於商業領域和一般使用者,以及如何實現其創新的商業模式,才是目前推動 AI 發展的關鍵因素,而非單純地提升 LLM 的參數量和能力。
因此,AI Agent 的概念被推向市場,並被視為軟體產品的典範轉移。根據 Grand View Research 的研究報告指出,2023 年全球 AI Agent 市場規模達 38.6 億美元,2024 年預估將增至 56 億美元。2024 年至 2030 年的複合年度成長率(Compound Annual Growth Rate,CAGR)可能高達 45.1%,預估 2030 年全球市場規模將達 522.7 億美元。
什麼是 AI Agent?
AI Agent 是一種先進的軟體系統,能夠理解使用者意圖和目標,並自主地完成使用者任務。根據 Google Brain 和 Coursera 共同創辦人 Andrew Ng 於 2024 年末在 Snowflake 的演講《人工智慧代理人與代理式推理的崛起(The Rise Of AI Agents And Agentic Reasoning)》,AI Agent 具備以下四種能力:
- 反思(Reflection):自我檢討並改進輸出結果。
- 使用工具(Tool Use):判斷何時應調用外部 API、搜尋網頁或執行程式碼。
- 規劃(Planning):將任務拆解成多個步驟並依序執行。
- 多代理人協作(Multi-Agent Collaboration):單(多)個 Agent 扮演不同的角色互相合作,以提升任務執行的效果。
與傳統的語言模型對比,AI Agent 採用多步驟流程,而不僅是單次產生輸出;與傳統的軟體系統相比,傳統軟體需要使用者了解如何操作軟體以達成自己的目標。使用 AI Agent,使用者只需要清晰地描述自己的目標,不需要知道如何完成。從人類的工作模式來看,AI Agent 可以被視為使用者的助理,而使用者則扮演著管理者的角色,負責指導和監督它的工作。
所以,AI Agent 是一種以 LLM 為核心的軟體系統,其主要特點是能夠理解使用者意圖和目標,並自主地完成任務。它具備四個核心能力:反思、使用工具、規劃和多代理人協作,能夠有效地提升使用者工作效率和解決問題的能力。
AI Agent 熱門應用
AI Agent 已被廣泛應用於各個領域,包括產品開發、客戶服務和支援、銷售和行銷、財務金融、人力資源、教育、醫療保健、大眾運輸和農業等。接下來將著重介紹產品開發和教育領域的應用案例。
智慧軟體開發助手:Copilot
GitHub Copilot 能夠即時提供程式碼建議,協助開發者減少重複性工作,從而提升開發速度。根據 2024 年 2 月的資料,已經有超過 130 萬個訂閱使用者,較該上季度成長了 30%。然而,不少使用者抱怨其準確性,有時候需要去花大量的時間去修正 AI 產生出來的錯誤(Bug)。
智慧個人家教:Khanmigo
可汗學院(Khan Academy)推出的 Khanmigo 能根據每位學生的學習進度和需求,提供適切的學習建議和資源。對教師而言,它可協助制定課程大綱和批改作業,讓老師能更專注於教學。不過,也有人認為過度依賴 AI 輔導可能會削弱學生的自主學習能力,特別是在問題解決和批判性思維的方面。
總結
- ChatGPT 的推出,引發了全球科技企業對 LLM 大規模的投資與發展。然而,探索 AI 在商業領域和一般使用者的應用,和實現其商業模式,才是推動 AI 發展的關鍵。
- AI Agent 能夠理解使用者意圖和目標,透過反思、使用工具、規劃和多代理人協作,可以自主地完成多種領域的任務,包括產品開發、教育、客戶服務等。
- 開啟新的電腦時代,使用者著重在清晰地表達需求,而不用學習複雜的軟體操作,就可以達成目標。