SonarSource研究發現,盡管最新大語言模型在編程基準測試中表現更佳,但同時引入了更多嚴重漏洞和安全風險。研究測試了Claude、GPT-4o、Llama等模型的4400多個Java編程任務,發現所有模型都存在系統性安全意識缺陷。其中Llama 3.2 90B有超過70%的漏洞被評為最高危險等級,Claude Sonnet 4雖功能測試得分最高,但嚴重漏洞比例比前代增加93%。研究建議對AI生成代碼采用"信任但驗證"方法。
隨著AI代碼生成工具的廣泛應用,企業面臨著新的挑戰。AI生成的代碼可能存在安全漏洞、架構問題和合規風險。為此,企業需要實施嚴格的驗證流程,認識AI在復雜代碼庫中的局限性,理解AI代碼的特有問題,要求開發人員對代碼負責,并建立高效的AI工具審批機制。同時,專門的代碼分析工具也變得不可或缺。
今天,微軟安全響應中心 (MSRC) 發布2019-2020年度“最具價值安全研究者”榜單,奇安信代碼安全實驗室的五名研究員入選。