在倫敦Unscripted大會上,DevOps公司Harness展示了最新AI驅動模塊,包括AI管道構建器、AI測試自動化、構建失敗時的自主代碼修復、AI應用安全和AI混沌測試等。該公司指出,軟件團隊僅有30-40%時間用于規劃編碼,其余時間消耗在測試、安全、部署和優化上。CEO表示,通過專用AI智能體分解任務并相互驗證輸出,結合組織上下文知識,可有效減少AI幻覺問題。
2025年,人工智能進入智能體時代,AI不再只是分析數據或生成文本,而是能夠代表用戶執行實際操作。AI智能體可以預訂旅行、管理預算、處理保險理賠等,但這種自主性也帶來了巨大風險。與傳統軟件不同,智能體在動態環境中運作,行為難以預測。目前的測試方法無法應對復雜的現實場景,急需新的驗證層來持續監控和驗證智能體行為,確保其安全可靠地運行。