AI Agent是AI實現商業化的關鍵路徑之一,尤其在2025年被視為商業化元年。”商湯大裝置事業群CTO宣善明在近日舉行的【中國軟件研發創新科技峰會】上講到。在此次大會《AI Agent智算生產Infra實踐》主題演講中,宣善明全面分享了商湯大裝置AI Agent Infra端到端體系搭建及場景實踐成果。

Agent:操作系統級的智能入口
宣善明認為,Agent不再是單一任務工具,而是“操作系統級別的入口”。Agent既是人與AI交互的統一接口,還能進行組織、編排及自我進化。可以想象一下,未來我們可以依托Agent體系,一個人即可組建公司,通過編排AI員工形成團隊,甚至進一步擴展成復雜的AI組織。
與傳統AI模型不同,Agent的核心挑戰在于其不確定性。我們無法完全預設Agent行為,系統必須具備發散性評估與自我優化能力,在持續反饋中實現自主進化。
這要求Agent具備四大核心能力:統一入口、可擴展性、自我進化能力和評估體系等。
智能中樞:Agent Infra的底層支撐
2030年,經濟體將演變為一個 Agent 經濟體,其中每個 Agent 像神經網絡的節點一樣互聯協作,通過統一入口分發任務并與其他 Agent 交互完成工作。這樣的體系高度復雜、動態且自組織,無法完全依賴人工手工搭建,因此需要系統化的 Agent Infra 來支撐。
首先,需要構建智能中樞。
商湯大裝置Agent Infra智能中樞體系由公共能力組件、外部工具接入以及自我進化機制共同組成的體系,使agent能通過持續進化不斷擴展自身能力。

- 公共能力組件是Agent Infra智能中樞體系中支撐Agent高效運行的核心基礎模塊。它通過提供統一的Memory、Agent元數據管理、沙盒環境、規劃器和摘要器等公共能力,使Agent能夠高效地管理自身知識、跟蹤任務狀態、進行安全隔離的實驗等,以及在復雜任務中實現智能規劃與決策。
- 在外部工具接入能力方面,體系引入經過遴選與驗證的工具和MCP,確保Agent在面對自身無法解決的問題時能夠調用外部資源,同時通過開放搜索MCP發現和評估新的功能資源,從而拓展任務覆蓋范圍并提升問題解決能力。
- 自我進化機制是支撐智能體持續提升能力的核心環節。該機制依托MCP Builder和Agent Builder兩個關鍵組件構建。MCP Builder主要用于快速構建基礎功能。相比之下,Agent Builder面向更復雜的智能體需求,它不僅僅生成一段代碼邏輯,而是賦予生成的智能體自我驗證、自我迭代、自我思考的能力。通過Agent Builder,智能體可以在實際應用中不斷反思與優化自身行為,從而實現能力的自主擴展與進化。
除此之外,Agent Infra智能中樞Memory體系承擔著智能體感知、決策與自我迭代的功能。我們基于多模態解析構建了統一的Knowledge Graph,將文本、圖像、視頻等多源信息進行結構化存儲與索引,以實現高效檢索與使用。此外,Memory還用于智能體的自我迭代,每次執行任務后,成功與失敗路徑都會被記錄于Knowledge Graph,供下一次Planning參考,使Agent能夠低成本、高效地沿用成功經驗、規避失敗路徑,實現自主進化。
Agent Infra端到端實踐:閉環驗證與產業落地
在商湯大裝置的Agent Infra實踐中,端到端構建流程涵蓋從Agent生成、離線驗證到灰度上線的完整閉環。
- SRE-Agent:商湯作為業內領先的AI基礎設施廠商,SRE-Agent是保障其大規模算力集群穩定運行的重要工具。宣善明現場演示了SRE-Agent進行故障排查的過程。當一個2000P集群中的任務無法啟動時,SRE-Agent能自主完成故障排查。它對接日志與監控系統,結合知識庫生成排查計劃,并在執行中動態調用檢索工具,最終產出根因分析與解決方案。與人工數小時的排查相比,分鐘級即可完成,大幅提升運維效率并減少人力投入。
- 具身智能Agent:另外在具身智能領域,商湯大裝置開發了具身仿真數據生成Agent,來為客戶提供高效的數據生成能力。該Agent基于已有的仿真平臺(如NVIDIA仿真環境),通過Agent系統進行全流程規劃與任務拆解,進行場景素模構建和場景集成,并能夠進行光影調整與參數優化等來形成大量高質量數據集。可以看到,Agent在數據生成環節的自主規劃與智能執行能力,能夠從數據多樣性與場景覆蓋等角度,幫助客戶快速獲取可用于訓練和驗證的具身智能數據。
- 行業性Agent:商湯大裝置在某大型項目中,實現了以唯一業務入口統一管理和調度超過100個Agent,大部分由頂層Agent自主生成,系統覆蓋30余內部業務系統、4000余工具及十多個垂類模型,實現了AI自主定位與任務執行,成功驗證了Agent Infra在行業級項目落地中的可擴展性和高效性。
“我們正在見證一個完整閉環的逐步成型。商湯大裝置的AI Agent Infra實踐,正通過基礎設施與智能體模板、開放生態社區以及Marketplace等層層推進,支撐起繁榮的Agent經濟生態。這不僅實現了從技術落地到產業化的閉環,更展現了商湯在AI Agent時代的戰略遠見。” 宣善明總結道。