ElevenLabs是一家剛剛完成1.8億美元融資的人工智能初創公司,主要以其音頻生成能力而聞名。該公司通過推出首個獨立的語音轉文本模型Scribe,邁出了另一個技術方向。該初創公司估值為33億美元,已幫助許多其他公司提供語音轉文本服務,利用其龐大的聲音庫。然而,該公司現在希望進入語音檢測領域,與Gladia、Speechmatics、AssemblyAI、Deepgram和OpenAI的Whisper模型競爭。
OpenAI 推出代號"Orion"的 GPT-4.5 模型,這是公司迄今最大規模的 AI 模型。GPT-4.5 在計算能力和訓練數據方面均超越以往版本,但 OpenAI 并不認為它是前沿模型。該模型將逐步向付費用戶開放,但運營成本高昂。盡管在某些基準測試中表現出色,但 GPT-4.5 在部分任務上仍落后于其他 AI 推理模型,凸顯了傳統預訓練方法的局限性。
IBM 公司今天推出了新的 Granite AI 模型系列,具備實驗性推理、視覺和預測能力,旨在在企業人工智能市場中占據一席之地。所有 Granite 模型均在 Apache 2.0 開源許可證下開放,現已在 Hugging Face 和 IBM watson.ai 等平臺上提供。新系列的旗艦產品是 Granite 3.2 Instruct 變體,支持文本處理,能夠執行摘要、問題解決和代碼生成等任務,并設計為遵循指令。
埃隆·馬斯克的人工智能公司 xAI 推出了備受期待的旗艦 AI 模型 Grok 3。新模型推出后,Grok 應用的下載量和活躍用戶數大幅增長。然而,近期圍繞 Grok 3 的爭議可能會影響用戶的熱情。能否保持增長勢頭并留住用戶,成為 xAI 面臨的重要挑戰。
Google 宣布擴展 Gemini AI 模型系列,增加現有模型的可用性。公司推出了更新的 Gemini 2.0 Flash 模型,并發布了 2.0 Pro 和 2.0 Flash Thinking 的實驗版本。此外,Google 還推出了新的 2.0 Flash-Lite 模型,旨在提供最具成本效益的 AI 解決方案。這些舉措旨在提升 AI 性能,并為開發者和用戶提供更多選擇。
OpenAI 發布了其 o3-mini 大語言模型,這是一款低成本、高速的推理優化模型。它在 ChatGPT 多個版本中可用,并通過 API 向開發者開放。o3-mini 在性能測試中表現出色,顯示出 OpenAI 在推理模型領域的持續進展。
OpenAI正尋求400億美元新一輪融資,估值或達3400億美元。軟銀可能領投150-250億美元,并協助尋找其他投資者。這筆資金將用于支持虧損業務運營和建設AI數據中心網絡,以應對來自競爭對手的挑戰,推動AI技術進步。
Mistral AI 和艾倫人工智能研究所發布了新的開源大語言模型。Mistral Small 3 擁有 240 億參數,可在某些 MacBook 上運行。AI2 的 Tülu 3 405B 是基于 Meta 的 Llama 3.1 405B 模型改進而來。兩個模型都聲稱在各自類別中處于領先地位,并以開源許可發布。
文章深入探討了 AI 技術的快速發展趨勢及其未來影響。作者通過分析量級增長 (OOM)、AI 能力躍升以及模型的情境意識等方面,論證了 AI 即將迎來重大突破。特別強調了到 2027 年 AI 可能具備 AI 研究員/工程師的工作能力,以及 AI 系統在獲得持久記憶和更廣泛上下文后將產生質的飛躍。
谷歌正在向人工智能公司Anthropic追加投資超10億美元,總投資額已達30億美元。Anthropic還將從其他投資者籌集20億美元,估值可能達到600億美元。該公司開發的Claude大語言模型在某些任務上據稱優于GPT-4,并計劃進一步提升模型能力和基礎設施,以應對不斷增長的需求。