OpenAI推出新AI模型GPT-5-Codex,能夠在無用戶協助下完成數小時的編程任務。該模型是GPT-5的改進版本,使用額外編碼數據訓練。測試顯示,GPT-5-Codex可獨立工作超過7小時,能自動發現并修復編碼錯誤。在重構基準測試中得分51.3%,比GPT高出17%以上。模型可根據任務難度調整處理時間,簡單請求處理速度顯著提升。目前已在ChatGPT付費計劃中提供。
谷歌在倫敦云峰會上發布Firebase Studio更新,新增Gemini命令行界面集成、模型上下文協議支持和"代理模式"。代理模式提供三種AI協作層次:對話式"詢問"模式用于頭腦風暴,人機協作代理需開發者確認代碼變更,以及幾乎完全自主的代理模式。盡管谷歌聲稱已有數百萬應用使用該平臺,但目前仍需精心設計提示詞,非工程師用戶還無法直接創建成熟應用。
AI編程編輯器Cursor背后的公司Anysphere推出網頁應用,用戶可通過瀏覽器管理AI編程代理網絡。該應用支持桌面和移動端,用戶可用自然語言分配編程任務、監控代理工作進度并合并代碼更改。Cursor年經常性收入已超5億美元,被超半數財富500強企業使用。新應用面向Pro計劃及更高級別訂閱用戶開放,旨在降低使用門檻。公司預計到2026年AI編程代理將承擔軟件工程師至少20%的工作。
Canva 現要求開發崗位候選人在面試中使用 AI 編碼助手,如 Copilot、Cursor 和 Claude,以便更真實評估實際工作表現,同時考察其利用 AI 提升生產力的能力。