研究顯示,主流AI大語言模型普遍存在性別偏見問題。開發者Cookie發現,當她更換頭像為白人男性后,AI對其量子算法工作的質疑明顯減少。多項研究證實,由于訓練數據存在偏見,AI模型會對女性用戶產生刻板印象,如假設技術崗位由男性擔任。專家指出,雖然AI公司正在努力解決偏見問題,但用戶需認識到這些模型本質上是文本預測機器。
OpenAI為ChatGPT推出"購物研究"新功能,恰逢假期購物季。該功能面向免費和付費用戶開放,支持移動端和網頁版。用戶詢問購物問題時,ChatGPT會提供個性化購物助手服務,通過一系列問題幫助用戶篩選價格、用途和功能偏好。該功能基于專為購物任務優化的GPT-5 mini版本,從優質網絡資源獲取產品信息。OpenAI計劃推出即時結賬功能,允許用戶直接在ChatGPT內購買商品。
微軟推出首個智能體小語言模型Fara-7B,專為"計算機使用"任務設計,能夠控制鼠標和鍵盤完成各種操作。該模型僅有70億參數,可在個人電腦上本地運行,無需聯網或向云端傳輸數據,有效提升隱私保護和響應速度。Fara-7B能夠通過視覺感知網站內容,執行在線購物、信息搜索和地圖測距等任務,性能可媲美更大規模的模型系統。
Anthropic周一發布了旗艦模型Opus 4.5,這是4.5系列的最后一個模型。新版本在編程、工具使用和問題解決等基準測試中表現出色,是首個在SWE-Bench驗證測試中得分超過80%的模型。同時推出Claude for Chrome和Claude for Excel產品,分別面向不同用戶群體。Opus 4.5還改進了長文本處理的內存管理,支持付費用戶的"無限聊天"功能,并針對智能體應用場景進行了優化,將與OpenAI的GPT 5.1和谷歌的Gemini 3展開競爭。
研究人員開發出更有效的方法從大型語言模型中提取記憶內容,可幫助解決監管擔憂和版權糾紛。該技術名為RECAP,通過智能反饋循環迭代提取特定內容,包含突破模型拒絕回應的組件。在基準測試中,RECAP在文本提取方面比現有最佳方法提升78%,能從《哈利波特》首部小說中提取約3000段文字。這項研究有助于提高AI模型透明度。
微軟開發總監Scott Hanselman在Ignite大會上宣布開源Zork I-III游戲源代碼,采用MIT許可證發布。Zork是游戲史上的里程碑作品,這款文字冒險游戲允許玩家使用自然語言與游戲互動。該游戲最初為PDP-10計算機開發,后被分為三部分以適配當時的個人電腦。微軟此舉旨在為學生、教師和開發者提供歷史重要代碼,供學習研究使用。
OpenAI宣布ChatGPT群聊功能正式向全球所有用戶開放,涵蓋免費版、Go版、Plus版和Pro版計劃。該功能允許最多20人在共享對話中與ChatGPT協作,用于規劃旅行、共同撰寫文檔、解決爭議或進行研究。用戶個人設置和記憶保持私密,ChatGPT能智能判斷何時參與對話。這標志著OpenAI將ChatGPT從簡單聊天機器人轉變為社交協作平臺的重要步驟。
維基百科編輯團隊發布了一份識別AI寫作的公開指南,成為目前最有效的AI文本檢測資源。該指南基于2023年啟動的"AI清理項目",通過分析大量編輯內容總結出AI寫作的特征模式:過度強調主題重要性、使用"關鍵時刻"等通用表述、詳述次要媒體報道以凸顯重要性、頻繁使用模糊的重要性聲明如"強調意義"等現在分詞結構,以及傾向于使用"風景如畫"等營銷化語言。這些特征深植于AI模型訓練方式中,難以完全消除。
OpenAI發布了ChatGPT教師版,專門面向K-12學校教職員工,免費使用至2027年6月。該版本包含GPT-5.1 Auto無限消息功能,支持文件上傳、圖像生成等特性,同時符合《家庭教育權利法》要求。教師可用其創建教學材料,分享聊天記錄,并獲得其他教師使用建議。此前OpenAI已推出面向學生的ChatGPT Edu和學習模式功能。
人工智能為已經過度充斥內容的社交媒體世界增添更多燃料。AI的大規模生產能力讓內容泛濫問題更加嚴重,同時算法操控也變得更加可疑。在廣告領域,AI工具可能徹底改變傳統廣告模式,通過智能代理的受托責任替代常見廣告形式。未來AI甚至可能使用人類的AI化身代筆寫書,模仿其聲音、歷史和個性。這引發了關于人類作者身份和寫作本質的深刻思考。
本文介紹了提示工程領域的新技術"協作提示",該技術能讓AI從傳統的單輪快速回答模式轉向多輪協作對話模式。文章提供了短版和長版兩種協作提示模板,解釋了AI通常不具備協作性的原因,并通過實例對比展示了協作提示的效果。研究表明,這種方法能夠幫助用戶獲得更深入、更實質性的AI回答,特別適用于復雜問題的探索和解決。
OpenAI宣布推出GPT-5的首個重大升級版本GPT-5.1,包含Instant和Thinking兩個變體。新模型在對話風格上更加自然溫暖,具備自適應推理能力,能根據問題復雜度調整思考深度。GPT-5.1提供八種個性化對話模式供用戶選擇,減少專業術語使用,提升易理解性。該升級旨在解決GPT-5發布后用戶反饋的不足,將逐步向訂閱用戶推出。
谷歌Gemini深度研究工具現已升級,可訪問Gmail、Drive和Chat等應用獲取數據來回答研究問題。該功能基于Gemini 2.5 Pro,采用多步驟流程進行深度分析。用戶需授權后,系統可訪問Google Workspace中的相關數據以提升研究效果。谷歌確認連接應用的信息不會用于改進AI模型,但會有人工審核員審查部分數據。專家對該功能評價不一,有人質疑其僅能產生"研究外觀"而非真正研究。
谷歌地圖將集成Gemini人工智能技術,旨在將其升級為一個"全知型副駕駛"助手。這一整合將大幅提升地圖服務的智能化水平,為用戶提供更加個性化和全面的導航體驗。通過AI技術的加持,谷歌地圖有望在路線規劃、地點推薦和實時信息服務等方面實現重大突破。
雖然ChatGPT等AI工具正在快速改變世界,但它們并非無所不知的神諭。ChatGPT擅長"令人信服的錯誤",經常提供有偏見、過時或完全錯誤的答案。在健康診斷、心理健康、緊急安全決策、個人財務規劃、機密數據處理、違法行為、學術作弊、實時信息監控、賭博預測、法律文件起草和藝術創作等11個關鍵領域,用戶應避免完全依賴ChatGPT,而應尋求專業人士幫助。
數十年來,命令行界面一直是IT管理的基石,但智能代理AI技術正在顛覆這一模式。通過自然語言指令,IT專業人員可以直接向AI代理下達任務,無需掌握復雜的命令語法。盡管CLI在精確控制、性能和資源效率方面仍有優勢,但隨著AI工具日趨成熟、學習成本降低,智能代理有望成為常規管理任務的默認解決方案,傳統命令行技能可能逐漸過時。
OpenAI宣布從11月4日開始向印度用戶免費提供一年ChatGPT Go訂閱服務。該計劃月費不到5美元,于8月在印度推出,是OpenAI最實惠的付費訂閱方案。印度擁有超過7億智能手機用戶,是OpenAI僅次于美國的第二大市場。ChatGPT Go提供比免費版本多10倍的使用量,包括生成回復、創建圖像和上傳文件功能。
OpenAI發布"企業知識"功能,為ChatGPT商業版、企業版和教育版用戶提供連接組織數據的能力。該功能集成Slack、SharePoint、Google Drive、Teams和Outlook等應用,但不包含OneDrive。用戶需單獨驗證每個連接器,數據經過加密且不用于訓練。與微軟365 Copilot的30美元月費相比,ChatGPT商業版僅需25美元,在品牌認知度和價格方面具有競爭優勢。
微軟發布新版Copilot人工智能助手,支持最多32人同時參與聊天會話的Groups功能,并新增連接器可訪問OneDrive、Outlook、Gmail等多項服務。助手記憶功能得到增強,可保存用戶信息供未來使用。界面新增名為Mico的AI角色,并提供"真實對話"模式生成更機智回應。醫療研究功能也得到改進,可基于哈佛健康等可靠來源提供答案。同時推出內置于Edge瀏覽器的Copilot Actions功能,可自動執行退訂郵件、預訂餐廳等任務。
OpenAI于周二發布AI瀏覽器ChatGPT Atlas,目標是讓ChatGPT成為搜索和問答的首選界面而非谷歌。該瀏覽器目前僅支持Mac,但正在開發Windows、iOS和Android版本。Atlas將ChatGPT設為默認搜索選項,并具備記憶功能,可結合瀏覽歷史提供個性化答案。與其他AI瀏覽器不同,Atlas更專注于強化ChatGPT生態系統,為OpenAI提供更多用戶數據和分發控制權,而非改善傳統瀏覽體驗。