法國AI初創公司Mistral發布Mistral 3系列開放權重模型,包含一個大型前沿模型和九個小型離線模型。該公司試圖證明小型模型在企業應用中更具優勢,可在單GPU上運行,成本更低且效率更高。Mistral Large 3具備多模態和多語言能力,參數達675億。Ministral 3小型模型系列提供三種規格,支持視覺處理和大上下文窗口,可部署在邊緣設備上。
亞馬遜云科技宣布在其AI模型組合中新增全托管開放權重模型Qwen3和DeepSeek-V3.1。這些模型為依賴Amazon Bedrock生成式AI服務的客戶提供更大靈活性。Qwen3來自阿里巴巴,在編程和推理方面表現出色;DeepSeek-V3.1在數學、編程和智能體任務方面性能卓越。開放權重模型具有成本優勢和選擇優勢,支持模型精調和定制化。AWS計劃在亞洲、拉美、歐洲和北美等全球關鍵市場推出這些新模型。
Meta周六推出了最新一代生成式AI模型家族Llama 4,包括Scout和Maverick兩款開放權重的多模態模型。Scout是較小的170億參數模型,Maverick則是中型模型,擁有170億參數和128個專家子網絡。測試顯示Maverick在文本生成方面超越了ChatGPT-4o。更多Llama 4系列模型將在本月晚些時候公布。