处破女av一区二区,日韩中文字幕精品视频,亚洲视频久久久

計算
- 服務器
- 數據中心
存儲
網絡與安全
軟件與服務
商用辦公
CIO與CTO
- 企業開源智庫
- 企業開源實踐聯盟通訊
數字化轉型
新基建
云資訊
人工智能
端側AI
AIPC
數據要素
- 區塊鏈
物聯網
資訊
- 行業資訊

AI推理關鍵字列表

人工智能

AI推理

新型芯片

2025-10-28

高通進軍數據中心AI芯片市場挑戰英偉達AMD

高通發布兩款全新AI加速器芯片AI200和AI250，正式進軍蓬勃發展的數據中心市場，直接挑戰GPU巨頭英偉達的AI市場主導地位。這家此前專注于移動和無線設備芯片的半導體公司表示，新芯片將通過全新內存架構提供機架級性能，以更低成本實現增強的AI推理能力。AI200將于2026年商用，AI250于2027年推出。

人工智能

AI推理

超低延遲技術

2025-09-09

d-Matrix推出IO加速器，宣稱AI推理延遲將達到全新低點

d-Matrix在AI基礎設施峰會上發布JetStream IO加速卡，這款定制PCI卡可提供400Gbps帶寬和2微秒延遲。該產品基于FPGA技術，可與去年發布的Corsair推理加速平臺配合使用，支持在服務器內部和多節點間擴展。CEO表示，隨著行業重點從大模型訓練轉向商業化推理，該產品旨在解決內存計算瓶頸后的IO瓶頸問題。JetStream采用標準以太網協議，可直接部署到現有數據中心。

人工智能

AI推理

融資輪次

2025-09-08

AI推理初創公司Baseten獲1.5億美元融資

AI推理初創公司Baseten完成1.5億美元D輪融資，估值達21.5億美元。該輪融資由BOND領投，谷歌母公司Alphabet旗下CapitalG等多家知名機構參投。Baseten提供AI推理加速平臺，聲稱性能比競品快50%，支持本地部署和云端托管。平臺采用拓撲感知并行技術優化硬件使用，通過算子融合和量化工具提升模型性能，并提供完整的開發者工具鏈和監控功能。

分布式內存

AI推理

超低延遲處理

2025-06-20

GridGain技術助力AI推理，分布式內存架構釋放計算潛能

GridGain軟件通過集群服務器實現內存共享，使內存密集型應用能在單獨內存不足的服務器上運行。該技術在AI推理領域日益重要，因為所需令牌數量不斷增長。軟件提供跨x86服務器集群的分布式內存空間，具備大規模并行架構。GridGain聲稱其引擎可用于任何數據驅動的分析或事件處理項目，提供超低延遲的分布式多模型數據存儲和計算引擎，實時為AI推理引擎提供企業數據。