谷歌正式推出其最強大的Gemini 2.5深度思考AI模型,但僅向每月250美元的AI Ultra訂閱用戶開放。該模型基于Gemini 2.5 Pro,通過增加"思考時間"和并行分析來處理復雜查詢。深度思考模型在多個基準測試中表現(xiàn)優(yōu)異,在人類最終考試中得分34.8%,遠超其他模型的20-25%。該模型特別擅長數(shù)學推理、科學分析和編程,響應時間需要數(shù)分鐘,每日使用次數(shù)有限制。
最新調(diào)查顯示,32%的受訪者表示有興趣使用AI進行心理治療而非人類治療師。專家認為,AI聊天機器人具有超強耐心,在快節(jié)奏社會中頗具吸引力。年輕人因習慣單向網(wǎng)絡(luò)關(guān)系而更易接受AI治療。研究表明AI在預測自殺傾向方面準確率達70%,但也存在風險,包括過度肯定和缺乏真實人際連接。專家建議應謹慎整合AI與傳統(tǒng)心理治療,既發(fā)揮技術(shù)優(yōu)勢又保持人性化關(guān)懷。
谷歌正在將其基于人工智能的圖片轉(zhuǎn)視頻技術(shù)推廣到更多應用程序中。這項技術(shù)能夠?qū)㈧o態(tài)圖片轉(zhuǎn)換為動態(tài)視頻內(nèi)容,利用先進的AI算法分析圖片內(nèi)容并生成流暢的視頻效果。此舉標志著谷歌在AI視覺處理領(lǐng)域的進一步布局,預計將為用戶提供更豐富的多媒體創(chuàng)作體驗。
谷歌Gemini嵌入模型正式發(fā)布并在權(quán)威MTEB基準測試中排名第一,現(xiàn)已集成到Gemini API和Vertex AI中。該模型支持語義搜索和檢索增強生成等應用,采用Matryoshka表示學習技術(shù),支持100多種語言。阿里巴巴開源的Qwen3-Embedding模型緊隨其后,為企業(yè)提供了專有模型與開源替代方案之間的新選擇。
OpenAI推出ChatGPT Agent,標志著人工智能進入數(shù)字勞動力時代。與傳統(tǒng)AI不同,智能體AI具備真正的"自主性",能夠設(shè)定目標、做出決策并執(zhí)行復雜任務。市場規(guī)模將從2024年的50億美元增長至2030年的500億美元。目前已涌現(xiàn)七類數(shù)字工作者:業(yè)務任務、對話服務、研究分析、開發(fā)編程等智能體,它們正在重塑消費者體驗和企業(yè)運營模式。
以色列魏茨曼科學研究所、英特爾實驗室和d-Matrix研究人員開發(fā)出新算法,能顯著降低大語言模型服務成本。該算法基于投機解碼技術(shù),無需專門的草稿模型即可將令牌生成速度提升2.8倍。研究提出三種方法:令牌級交集、字符串級精確匹配和字符串級拒絕采樣,解決了不同模型詞匯表匹配問題。算法已集成到Hugging Face框架中,開發(fā)者僅需一行代碼即可使用。
語音AI解決方案提供商Krisp發(fā)布了VIVA語音隔離AI模型和軟件開發(fā)工具包,專為語音AI智能體設(shè)計。VIVA每月處理超過10億分鐘的語音音頻,能在20毫秒內(nèi)處理音頻,將對話輪轉(zhuǎn)準確性提升3.5倍,減少50%的通話中斷。該工具可過濾背景噪音和笑聲,避免AI誤判,提升轉(zhuǎn)錄準確性和用戶體驗。
AI第四代生成式AI標志著技術(shù)范式轉(zhuǎn)變,正在用戶體驗、應用自動化和平臺三個層面為企業(yè)帶來重大價值和顛覆。企業(yè)應關(guān)注商業(yè)價值而非技術(shù)本身,需要從業(yè)務問題出發(fā)量化價值。未來五年將在認知任務處理上取得巨大進展,但需要創(chuàng)新思維應對勞動力轉(zhuǎn)型。六大顛覆性支柱包括下一代AI能力、數(shù)據(jù)平臺、機器人技術(shù)、量子計算、企業(yè)用戶體驗和云架構(gòu)等。
本文分析了AI向AGI發(fā)展的七大路徑中的S曲線路徑,該路徑預測AI發(fā)展將經(jīng)歷三個階段:2025-2030年AI多模態(tài)模型和智能體技術(shù)快速發(fā)展;2030-2035年進入停滯平臺期,引發(fā)AI寒冬擔憂;2035-2040年技術(shù)突破重新啟動,自改進AI系統(tǒng)和混合認知架構(gòu)推動AGI最終實現(xiàn)。
谷歌周四宣布,通過Gemini應用為其Veo 3 AI視頻生成器增加圖像生成視頻功能。該功能此前已在5月I/O開發(fā)者大會上推出的AI視頻工具Flow中提供。目前Veo 3視頻生成功能已在150多個國家推出,僅限Google AI Ultra和Pro用戶使用,每日限制生成3個視頻。用戶可上傳照片并添加音頻描述來生成視頻。發(fā)布7周來,用戶已創(chuàng)建超過4000萬個視頻,所有視頻都帶有可見和不可見的數(shù)字水印。
微軟研究團隊提出"AI綠色推理"新模式,將AI計算集群直接部署在風電場等可再生能源站點,繞過電網(wǎng)瓶頸直接利用綠色能源。該方案通過Heron軟件路由器動態(tài)管理工作負載,根據(jù)實時電力供應情況智能分配計算任務。研究顯示,目前可在風電場部署超過600萬個高端GPU。這種模塊化數(shù)據(jù)中心架構(gòu)不僅緩解傳統(tǒng)電網(wǎng)壓力,還能有效利用未充分使用的可再生能源,為云計算提供商提供可持續(xù)發(fā)展的新路徑。
文章介紹了AI大語言模型中最新的深度研究功能,這是目前最令人印象深刻的新功能之一。作者詳細解析了ChatGPT、Claude和Gemini等主流模型的使用方法,并重點展示了深度研究功能的實際應用。通過實際測試,作者用ChatGPT 4.5的深度研究功能生成了一份關(guān)于1990-2025年最令人厭煩歌曲的詳細報告,展示了AI如何通過思維鏈進行深度研究和分析。文章還提到了語音交互模式將進一步改變用戶與AI的交互體驗。
隨著AI引發(fā)投資熱潮,越來越多初創(chuàng)企業(yè)獲得獨角獸地位。TechCrunch追蹤了今年迄今為止成為獨角獸的風投支持初創(chuàng)企業(yè)。雖然大多數(shù)與AI相關(guān),但令人驚訝的是許多企業(yè)專注于其他行業(yè),如衛(wèi)星公司Loft Orbital和區(qū)塊鏈交易網(wǎng)站Kalshi。名單涵蓋軟件開發(fā)、機器人技術(shù)、企業(yè)網(wǎng)絡(luò)基礎(chǔ)設(shè)施、體育軟件、客服AI代理等多個領(lǐng)域,估值從10億美元到100億美元不等。
德國TNG Technology Consulting公司基于DeepSeek R1-0528開發(fā)出新變體R1T2 Chimera,采用專家組裝技術(shù)融合三個預訓練模型。該模型在保持90%原版推理能力的同時,輸出token數(shù)量減少60%,推理速度提升200%。新模型采用MIT開源許可,已在Hugging Face平臺發(fā)布,為企業(yè)應用提供更高效的AI推理解決方案。
MIT、哈佛和芝加哥大學研究人員提出"波將金理解"概念,用于描述大語言模型的新型失效模式。這些模型在概念基準測試中表現(xiàn)優(yōu)異,但缺乏實際應用這些概念的真正理解能力。研究顯示,模型能準確解釋概念定義,卻無法正確識別、生成或編輯相關(guān)實例。測試發(fā)現(xiàn)模型概念識別準確率達94.2%,但在實際應用中失敗率高達40-55%。這種現(xiàn)象使基準測試結(jié)果產(chǎn)生誤導性,表明AI距離真正的通用人工智能還有很長路要走。
Cerabyte公司表示,到2030年將推出容量超過100PB的歸檔存儲機架,帶寬達2GBps,首字節(jié)訪問時間少于10秒。該技術(shù)基于飛秒激光在玻璃基板上蝕刻陶瓷記錄層,玻璃片存儲在類似磁帶的盒式存儲器中。與磁帶相比,該技術(shù)壽命超過100年,成本僅1美元/TB,數(shù)據(jù)傳輸速度1-2GBps。公司已獲得Pure Storage等投資,正在開發(fā)試點生產(chǎn)系統(tǒng)。
Linux之父Linus Torvalds警告稱,新一代bcachefs文件系統(tǒng)可能在6.17版本內(nèi)核中被移除。爭議源于bcachefs維護者Kent Overstreet在發(fā)布候選階段提交了包含新功能的代碼,違反了該階段只能修復漏洞的規(guī)則。Torvalds對此表示不滿,并暗示雙方將"分道揚鑣"。bcachefs項目歷時十年發(fā)展,剛于2024年1月納入6.7版本內(nèi)核,現(xiàn)在面臨被踢出的風險。即使被移除,該項目仍可通過外部開發(fā)、FUSE子系統(tǒng)或DKMS工具等方式繼續(xù)發(fā)展。
人工智能與量子技術(shù)正在改變傳統(tǒng)心臟診療方式。SandboxAQ首席執(zhí)行官介紹了一種突破性方法,通過量子傳感器檢測心臟磁場替代傳統(tǒng)心電圖的電場檢測。這種新技術(shù)能夠獲得360度完整、高密度的心臟信息,避免傳統(tǒng)心電圖間接檢測導致的誤診問題。該方法結(jié)合AI和量子計算,為心血管疾病提供更精準的個性化診斷和治療方案。
Genspark推出超級智能體,將"氛圍編程"概念擴展至企業(yè)工作流程,實現(xiàn)"氛圍工作"模式。該系統(tǒng)采用9個大語言模型的專家混合架構(gòu),配備80多種工具和10多個數(shù)據(jù)集,通過規(guī)劃-執(zhí)行-觀察-回溯循環(huán)運行。系統(tǒng)能自主處理復雜業(yè)務任務,甚至代替用戶撥打電話。45天內(nèi)實現(xiàn)3600萬美元年收入,展現(xiàn)了自主智能體平臺的商業(yè)可行性,挑戰(zhàn)傳統(tǒng)企業(yè)AI架構(gòu)理念。
人工智能平臺提供商Aquant推出"檢索增強對話"(RAC)新技術(shù),改變大語言模型信息檢索和呈現(xiàn)方式。與傳統(tǒng)檢索增強生成(RAG)一次性提供完整答案不同,RAC采用逐步對話模式,像領(lǐng)域?qū)<乙粯油ㄟ^提問填補知識空白,生成定制化解決方案。該技術(shù)能整合手冊、交易數(shù)據(jù)、作業(yè)歷史等多種數(shù)據(jù)源,在成本、風險和時間之間找到最佳平衡,預計兩年內(nèi)成為AI檢索指導的主要機制。