谷歌DeepMind發布新一代世界模型Genie 3,相比前代產品實現多項關鍵提升。新模型支持720p分辨率輸出,可持續運行數分鐘而不產生偽影,并首次支持實時交互和文本提示功能,用戶可通過文本指令動態改變模擬世界狀態。DeepMind將其定位為AI智能體訓練工具,可用于自動駕駛等場景的"假如"情況訓練,提高模型可靠性。
Google 正式向用戶推出 Gemini Live 的新 AI 功能,讓用戶能夠通過手機屏幕或攝像頭實時與 AI 進行交互。這項源自 "Project Astra" 的技術,可以實時解讀視頻內容并回答相關問題。目前該功能已向 Google One AI Premium 計劃的 Gemini Advanced 訂閱用戶開放,展現了 Google 在 AI 助手領域的領先地位。
一段令人驚嘆又讓人不安的AI語音演示在網上引發熱議。2013年,斯派克·瓊斯的電影《她》描繪了一個人們與AI語音助手建立情感聯系的未來。近12年后,AI初創公司Sesame發布的新對話語音模型使這一虛構的設想更接近現實,許多用戶對此感到既著迷又不安。