OpenAI 正在推出一套新的 API 和工具,旨在幫助開發者和企業更高效地構建基于 AI 的代理,這些代理基于 OpenAI 自家首個 AI 代理 Deep Research 和 Operator 的技術。Deep Research 獨立搜索互聯網,生成豐富、組織良好且有引用的報告,而 Operator 則根據用戶的文本指令自主控制網頁瀏覽器光標并執行諸如查找體育票或進行預訂等操作。
SambaNova Systems 推出新的 AI 深度研究框架,可生成深度報告的速度提高 3 倍,成本大幅降低。該框架與 CrewAI 合作開發,支持企業分析私密數據,使用開源大語言模型和 SambaNova 的 AI 加速器,無需依賴 Nvidia GPU。新框架包含智能路由系統,可根據需求選擇最合適的智能體,提供從基礎搜索到深度財務分析的全方位研究能力。
人工智能正在重塑商業、工作和日常生活。新突破如生成式語言模型和推理能力加速了AI的應用。本文列舉了15個重要統計數據,揭示了當前AI革命的真實影響,涵蓋了AI圖像生成、社交媒體、深度偽造、投資規模、市場前景、企業應用、醫療保健、信任度差異等多個方面,展現了AI技術的巨大潛力和面臨的挑戰。
Hugging Face 的聯合創始人兼首席科學官 Thomas Wolf 表示,當前 AI 發展范式無法產生具有創造性問題解決能力的 AI。他認為,AI 目前主要是填補人類已知之間的空白,而非通過連接不相關事實來產生新知識。Wolf 呼吁 AI 行業轉向能夠衡量 AI 提出非常規問題和開辟新研究路徑能力的評估方法。
領先的 AI 公司正在采用"蒸餾"技術,以創造更便宜、更易采用的 AI 模型。這種技術在 DeepSeek 成功應用后引起廣泛關注,引發了硅谷 AI 領導地位的動搖。蒸餾技術通過將大型語言模型的知識轉移到小型模型中,實現了高效且經濟的 AI 應用。這一突破為初創公司和開發者提供了更多機會,同時也對現有 AI 公司的商業模式構成了挑戰。
物理人工智能代表了人工智能從純數字系統向能夠與現實世界互動的智能機器的演變。與僅依賴軟件的人工智能不同,物理人工智能將算法與傳感器和執行器結合在機器人、車輛和設備中,使它們能夠感知周圍環境并實時做出決策。這些系統能夠自主運行,適應不斷變化的環境,而不是遵循固定的編程。
Google聯合創始人謝爾蓋·布林重返公司,呼吁員工每周工作60小時,以贏得人工智能競賽。他認為Google有望實現通用人工智能(AGI)突破,但需要員工全身心投入。這一呼吁引發了對工作效率和AI發展前景的討論,同時也反映了科技巨頭在AI競爭中的緊迫感。
騰訊推出新AI模型"混元Turbo S",定位為"快思考模型",旨在與DeepSeek-R1等"慢思考模型"競爭。該模型通過提高輸出速度和減少首字延遲,實現近乎"即時回復"。混元Turbo S融合了直覺式短思考鏈和理性推理長思考鏈,在數學、推理和知識等方面表現可比肩主流AI模型。騰訊采用混合Mamba-Transformer架構,提高效率并降低成本,有望成為未來基礎模型的核心。
IBM 公司今天推出了新的 Granite AI 模型系列,具備實驗性推理、視覺和預測能力,旨在在企業人工智能市場中占據一席之地。所有 Granite 模型均在 Apache 2.0 開源許可證下開放,現已在 Hugging Face 和 IBM watson.ai 等平臺上提供。新系列的旗艦產品是 Granite 3.2 Instruct 變體,支持文本處理,能夠執行摘要、問題解決和代碼生成等任務,并設計為遵循指令。
Anthropic 發布全新前沿 AI 模型 Claude 3.7 Sonnet,這是首個混合推理模型,能夠實時回答問題,也可根據用戶需求延長思考時間以提供更深入的答案。該模型在多項基準測試中表現優異,并推出了專注于代碼開發的 Claude Code 版本。
DeepSeek 在上個月發布了一個開放權重的 AI 模型后,現在計劃進一步開源其底層代碼。公司將從下周開始發布五個開源倉庫,涵蓋其在線服務中的關鍵組件。這一舉措將使 DeepSeek 的技術更加透明,有助于推動 AI 領域的集體進步,同時也與 OpenAI 等保持專有模型的公司形成對比。
蘋果推出售價599美元的iPhone 16E,搭載與高端機型相同的A18芯片,支持全套Apple Intelligence功能。這款平價iPhone的推出表明蘋果正努力將AI技術普及到更多用戶手中,降低了用戶體驗AI的門檻。此舉不僅擴大了AI技術的可及性,還有助于蘋果收集更多用戶反饋,進一步完善其AI功能。
上海人工智能實驗室的一項新研究表明,通過適當的工具和測試時擴展技術,參數僅有10億的小型語言模型在復雜數學基準測試中可以超越4050億參數的大型語言模型。這一發現為企業在不同環境和應用中部署小型語言模型進行復雜推理任務提供了新的可能性。
深度節奏是一家專注于日志數據的AI安全初創公司,成立16個月后聘請了首位銷售副總裁。該公司由Evan Powell于2023年11月創立,去年11月首次公開。新任銷售副總裁Chris Bowen曾在Hammerspace擔任銷售高級副總裁。深度節奏開發的日志語言模型(LLGM)能夠識別日志數據中的攻擊事件,并將檢測到的事件轉發至安全信息和事件管理(SIEM)資源。該軟件在Snowflake環境中運行,能夠在任何數據湖中識別異常活動并發送警報。通過聘請Bowen,深度節奏表明其有產品可售,并可能將銷售重點放在Snowflake渠道上。
馬斯克的 AI 公司 xAI 推出了 Grok 3 模型,號稱在多項技術指標上超越競爭對手。這款 AI 在數學、科學推理和編程等方面表現出色,并在用戶測試中領先 GPT-4 等模型。Grok 3 的發布標志著 AI 領域競爭加劇,也凸顯了馬斯克與 OpenAI 之間的緊張關系。
DeepSeek于1月推出的R-1 AI模型顯著改變了企業AI的格局,導致美國科技股市損失超過1萬億美元。該公司聲稱其推理模型在性能上可與OpenAI的o1相媲美,速度是其兩倍,成本僅為10%。盡管模型開發存在爭議,DeepSeek加速了AI模型的商品化,為CIO提供了更多選擇和更低的內部構建AI能力的門檻。隨著模型成本下降,企業在商業解決方案上將有更大選擇,內部開發應用變得更為現實。
Perplexity 通過推出 Deep Research 工具,顛覆了 AI 市場的現狀。該工具能夠在幾分鐘內生成全面的研究報告,并以極低的企業成本向用戶開放先進的 AI 能力。Perplexity 的 CEO Aravind Srinivas 強調,知識應該是普遍可獲取和有用的,而不是被高昂的訂閱計劃所限制。Deep Research 的推出揭示了 AI 定價的痛苦真相:昂貴的企業訂閱可能是多余的。Perplexity 提供的服務在價格上具有競爭力,可能迫使大型 AI 公司重新審視其定價結構。
{一項來自上海交通大學的研究表明,大型語言模型(LLMs)可以在不依賴大數據集的情況下學習復雜的推理任務。研究結果顯示,僅需少量精心挑選的示例,就能訓練LLM完成原本認為需要數萬個訓練實例的任務。這種高效性源于現代LLM在預訓練階段獲得的內在知識。隨著新的訓練方法變得更加數據和計算高效,企業可能能夠在不需要大型AI實驗室資源的情況下創建定制模型。}
{如今,幾乎所有前沿的 AI 產品和模型都采用變壓器架構。大型語言模型(LLMs)如 GPT-4o、LLaMA、Gemini 和 Claude 都是基于變壓器的,其他 AI 應用如文本轉語音、自動語音識別、圖像生成和文本到視頻模型也以變壓器作為其基礎技術。隨著 AI 熱潮的持續,了解變壓器的工作原理及其在可擴展解決方案增長中的重要性顯得尤為重要。變壓器不僅僅是表面現象,它們是處理數據序列的神經網絡架構,適用于語言翻譯、句子補全和自動語音識別等任務。}