亞馬遜云服務宣布為S3云對象存儲推出向量存儲功能S3 Vectors,聲稱可將AI存儲中向量數據的上傳、存儲和查詢成本降低90%。該服務旨在讓客戶以經濟方式在AWS云中存儲大量向量數據并進行語義搜索,可替代昂貴的向量數據庫。每個S3 Vectors存儲桶支持多達1萬個向量索引,每個索引可存儲數千萬個向量。
AWS為S3對象存儲新增向量存儲桶功能,旨在降低Amazon OpenSearch Service中低頻訪問向量的存儲成本。該功能專為向量數據存儲設計,可將上傳、存儲和查詢向量的總成本降低90%。新的向量存儲桶提供專用API,無需預配置基礎設施即可存儲和查詢向量數據。每個存儲桶最多支持10000個向量索引,每個索引可容納數千萬個向量。該功能已與Amazon Bedrock Knowledge Bases集成,支持構建RAG應用程序,并可與OpenSearch Service協同工作以優化成本。
AWS Amazon Bedrock負責人Atul Deo正致力于讓人工智能軟件變得更便宜和更智能。他在12月re:Invent大會前只有六個月時間來證明這一目標的可行性。Deo表示AI領域發展速度前所未有,模型每幾周就會改進,但客戶只有在經濟效益合理時才會部署。為此,AWS推出了提示緩存、智能路由、批處理模式等功能來降低推理成本,同時開發能執行多步驟任務的自主代理軟件,將AI應用從聊天機器人轉向實際業務流程自動化。
傳統數據中心基礎設施雖然對企業至關重要,但也是預算和房地產的重大負擔。模塊化數據中心正成為強有力的替代方案,解決企業面臨的運營、財務和環境復雜性問題。這種模塊化方法在印度日益流行,有助于解決環境問題、滿足人工智能的電力需求、降低成本并支持新一代分布式應用。相比傳統建設需要數年時間,工廠預制的模塊化數據中心基礎設施可在數周內部署完成。
AI項目從試點轉向生產階段時,企業面臨意外的云成本激增問題。推理工作負載需要全天候運行以確保服務正常,成本可能一夜間飆升1000%以上。許多公司每月費用從5000美元激增至50000美元。為控制成本,企業開始采用混合架構:將推理工作負載遷移至本地或托管設施,訓練任務保留在云端。這種模式可削減60-80%的基礎設施支出,在保持性能的同時實現成本可預測性。
企業在AI模型選擇上面臨開放源碼與封閉專有技術的抉擇,這一選擇對財務和定制化都有重要影響。開放模型如Meta Llama提供更大控制權和定制選項,而封閉模型如OpenAI GPT-4o提供簡化使用和企業級支持。專家建議采用投資組合策略,根據準確性、延遲、成本、安全性等因素選擇合適模型,而非單一選擇。
凱捷研究院調研顯示,盡管AI在自動化重復性業務任務方面帶來顯著成本節約,但應用場景相對簡單。調研涵蓋1607名來自年收入超10億美元企業的高管,發現AI可降低客戶運營成本40%、人員運營成本26%。然而,四分之三的高管仍偏好專有AI模型,其中43%選擇超大規模云服務商產品。盡管開源模型如DeepSeek能實現11倍計算成本降低,企業領導者仍因技術專業性要求、安全風險和社區支持等因素,對開源AI方案保持謹慎態度。
通用汽車推出的鋰錳富含電池(LMR)在降低成本的同時保證續航,預計2028年量產,將顯著減少對鎳和鈷的依賴。
本文對比分析了 OpenAI 的 GPT-4o 與 Anthropic 的 Claude 3.5 Sonnet 分詞方式的差異,揭示其在企業應用中隱藏的額外費用問題。
NASA人員分析團隊因成本考慮,從使用十年之Neo4j轉向Memgraph,提升了實時數據分析和Python集成效率,并支持智能查詢系統應對預算緊縮。
波士頓咨詢集團調研顯示,近60%CIO認為經濟衰退可能已來臨或正在發生。在關稅沖擊與經濟放緩壓力下,他們正在縮減IT預算、延緩非必要項目,并加大對AI和自動化的投入,同時調整全球采購策略以應對風險。
SAP公布財報顯示,盡管營收略低于預期,其營業利潤大幅超預期,同時云收入顯著提升,并維持全年指引,成本管控與新客戶拓展為增長奠定堅實基礎。
OpenAI 推出了 GPT-4.1 系列,專注提升編程效率、擴展長文本處理能力與指令執行準確性,同時大幅降低成本,為企業和開發者提供更靈活的 AI 工具。
微軟公司reportedly縮減了多個數據中心項目,這一決定發生在其宣布投資800億美元建設AI數據中心三個月后。報道稱,微軟暫停或推遲了在澳大利亞、印度尼西亞、英國和美國多個州的項目。微軟表示這反映了其戰略的靈活性,但也可能與AI開發成本下降和新興低成本模型趨勢有關。這一舉動引發了對AI行業發展方向的思考。
N2WS 發布最新備份軟件,支持 AWS、Azure 和 Wasabi 的跨云備份功能。通過云原生、平臺無關的塊級快照技術,提供高速讀寫訪問能力,并采用按虛擬機收費的定價模式。新版本可降低長期存儲成本,支持 Azure Blob 和 Wasabi S3 直接冷存儲備份。
皇家芭蕾舞團和歌劇院技術交付主管 Keith Nolan 分享了 IT 創新如何支持藝術表演。從降低成本到改善觀眾體驗,IT 在幕后發揮著關鍵作用。疫情期間的數字化轉型、云計算的應用以及流媒體技術的發展,都為藝術表演帶來新的可能性。Nolan 強調,通過創新技術節省開支,可以將更多資金投入到世界級的演出中。
百度推出兩款新型人工智能模型 ERNIE 4.5 和 ERNIE X1,分別為多模態語言模型和推理模型。這些模型在多項第三方基準測試中表現優異,超越了 DeepSeek 和 OpenAI 的同類產品,同時大幅降低了使用成本。盡管存在一些限制,如未開源和上下文窗口較小,但百度計劃在未來開源 ERNIE 4.5,并通過 API 和文心一言為用戶提供訪問。
SambaNova Systems 推出新的 AI 深度研究框架,可生成深度報告的速度提高 3 倍,成本大幅降低。該框架與 CrewAI 合作開發,支持企業分析私密數據,使用開源大語言模型和 SambaNova 的 AI 加速器,無需依賴 Nvidia GPU。新框架包含智能路由系統,可根據需求選擇最合適的智能體,提供從基礎搜索到深度財務分析的全方位研究能力。
人工智能應用,尤其是生成式AI,正推動企業云計算成本上升。一項報告顯示,這些成本平均增長了30%。大多數IT和財務領導認為GenAI導致的云支出已難以控制。專家指出,不加管理的GenAI可能使創新在財務上不可持續。然而,AI工具也可以幫助預測和管理云支出。專家建議采用混合云模式和邊緣計算來控制成本,并根據組織的云計算發展階段做出架構決策。
Google DeepMind 首席執行官 Demis Hassabis 在內部會議上回應了員工對中國 AI 初創公司 DeepSeek 的擔憂。他強調 Google 擁有更高效、性能更強的 AI 模型,對公司戰略充滿信心。Hassabis 認為 DeepSeek 的成本可能被低估,并可能依賴西方公司的先進模型。