隨著AI服務成本上升和數據隱私擔憂加劇,越來越多用戶開始嘗試本地部署大語言模型。硬件性能提升和軟件工具優化使得在個人設備上運行AI模型變得可行。通過量化技術降低模型精度要求,配合llama.cpp等開源工具,用戶可在消費級硬件上運行各類專業模型。雖然本地模型在通用性上仍遜色于云端大模型,但在特定場景下已能滿足需求,且在隱私保護和成本控制方面優勢明顯。
谷歌DeepMind發布了名為Gemini Robotics On-Device的新語言模型,可在機器人上本地運行任務而無需互聯網連接。該模型基于3月發布的Gemini Robotics模型構建,能夠控制機器人動作,開發者可通過自然語言提示進行控制和調優。谷歌稱其性能接近云端版本,在演示中展示了機器人執行拆袋和折衣等任務。