從“Chat”到“Act”:AutoGLM 如何引領 AI 智能設備新范式?
智譜AI率先推出了 AutoGLM,試圖打造一款能夠理解、規(guī)劃、執(zhí)行,并最終實現“無人駕駛”操作系統(tǒng)的 AI Agent。
近年來,人工智能領域風起云涌,而大模型技術的崛起無疑是其中最耀眼的“明星”。它不僅重新定義了人機交互的方式,更在各行各業(yè)掀起了一場顛覆性的革命。然而,當下的 AI 應用大多停留在“聊天機器人”的階段,人們期待著 AI 能夠更進一步,從“Chat”走向“Act”,真正成為解決實際問題、提升效率的得力助手。
面對這一需求和挑戰(zhàn),智譜AI率先推出了 AutoGLM,試圖打造一款能夠理解、規(guī)劃、執(zhí)行,并最終實現“無人駕駛”操作系統(tǒng)的 AI Agent。 然而,通往未來的道路并非一帆風順,AutoGLM 的出現也引發(fā)了人們的諸多疑問:它究竟強大到什么程度?能否真正解放人們的雙手?又將如何改變我們的生活和工作方式?
從簡單操作到復雜任務:AutoGLM 不斷進化
起初,AutoGLM 只能完成一些簡單的手機操作,例如點外賣、發(fā)朋友圈、領紅包等。然而,在不斷的迭代升級中,它展現出了驚人的學習能力和執(zhí)行力。如今,AutoGLM 已經能夠挑戰(zhàn)更加復雜的任務。

可以實現超長任務。能在無需人為干預的情況下自主執(zhí)行超過 50 步的操作,例如自動完成一份復雜的采購清單。
AutoGLM 實現了跨 App 操作。AutoGLM打破了應用之間的壁壘,能根據用戶的指令在不同 App 間自由切換,例如一邊瀏覽商品信息,一邊自動打開購物 App 下單。
理解能力不斷提升,避免了繁瑣的指令,可對用戶的短指令進行理解。AutoGLM不再需要冗長的指令描述,只需簡單幾個字,就能理解用戶的意圖,例如用戶只要說出“點咖啡”,就能自動完成咖啡預訂的所有步驟。用戶不必記住冗長的咖啡的具體品名,他會根據用戶以往的習慣進行自助選擇。
還可以采用“隨便模式”。即在用戶沒有明確指示的情況下,根據用戶的意圖主動做出決策,可以據用戶的口味偏好推薦咖啡。按智譜 CEO 張鵬的說法,這就是一個“盲盒模式”能讓用戶能感受到不一樣的“新奇體驗”。
這些功能的實現,得益于 AutoGLM 在泛化能力、思維鏈能力上的突破。它能夠將用戶的指令拆解成一系列更細化的步驟,并調用不同的應用程序來完成,真正實現了從“被動執(zhí)行”到“主動思考”的轉變。
從手機到電腦:GLM-PC 開啟“無人駕駛”新時代
除了手機端的 AutoGLM,智譜AI 還推出了面向 PC 端的 GLM-PC,試圖打造一款能夠“像人一樣操作電腦”的 AI Agent。目前,GLM-PC 已經能夠實現:

會議替身: 自動預定會議、發(fā)送會議紀要。
文檔處理: 下載、發(fā)送、理解和總結文檔。
網頁搜索與總結: 在指定平臺搜索關鍵詞,并對搜索結果進行閱讀和總結。
遠程和定時操作: 通過手機遠程控制電腦,或設定定時任務。
隱形屏幕: 在用戶工作時,在后臺執(zhí)行任務,不占用屏幕資源。
GLM-PC 的出現意味著 AI Agent 不再局限于移動端,而是開始向更加復雜、應用場景更加豐富的 PC 端拓展。雖然現階段 GLM-PC 的功能還比較有限,需要用戶輸入非常精準的指令,但它所展現出的潛力無疑是巨大的。
從 L1 到 L5:AI Agent 發(fā)展之路任重道遠
Agent將迎來高速發(fā)展期。Gartner預測,到2028年,至少15%的日常工作決策將通過人工智能代理自主完成(這一比例在2024年尚為0%)這依賴于強大的大模型能力。為此智譜AI將大模型能力的演進劃分為五個階段:
L1 語言能力: 能夠理解和生成自然語言。
L2 邏輯能力: 能夠進行邏輯推理和問題求解。
L3 使用工具的能力: 能夠使用各種工具完成任務。
L4 自我學習能力: 能夠自主學習和改進自身的能力。
L5 探究科學規(guī)律: 能夠像科學家一樣探索未知領域。
張鵬介紹道,目前大模型在 L1 和 L2 階段已經取得了顯著進展,但在 L3 工具使用能力方面還處于早期階段。AutoGLM 和 GLM-PC 的出現,正是為了推動 AI Agent 在 L3 階段的快速發(fā)展,最終實現 L4 自我學習能力的突破。
AutoGLM 和 GLM-PC 的出現,意味著 AI 不再僅僅是冷冰冰的代碼,而開始擁有了“手”和“眼”,能夠像人一樣與現實世界進行交互。這不僅將徹底改變人機交互的方式,更將催生出全新的應用場景和商業(yè)模式。
智譜不僅要讓AI的能力局限在手機和電腦,還會將他擴展到不同的領域:手機+AI 會成為人們隨時隨地的個人智能助理,PC+AI 將會成為企業(yè)和個人的全新生產力工具,汽車+AI 將會讓汽車變?yōu)槿藗兊闹悄艿谌羁臻g。
而這些不僅僅是智譜的暢想,現在有很多場景都已落地。在AI與手機的結合中,榮耀手機的很多典型應用已結合了智譜GLM大模型。榮耀 AI 技術總監(jiān)王作建表示,智譜GLM模型已在YoYo助理、榮耀筆記、榮耀文檔產品中規(guī)模上線,給用戶帶來了全新體驗。
華碩 AIPC 智能生態(tài)負責人鐘懷圣對華碩與智譜的合作充滿了更多期望,他表示,將和智譜共同打造云端一體的AIPC智能助手。在內容提煉、軟件控制、AI創(chuàng)作、個人知識庫、AI聊天、硬件體驗等場景不斷發(fā)掘AI的創(chuàng)新能力。不僅如此,智譜不斷在不斷擴大著自己的朋友圈,從小鵬汽車到高通、英特爾、以及眾多賦能2B、2G的合作伙伴……
正如張鵬所說:“我們期待著 AI 不再局限于語言交互,而是能夠做更多的事情。”
在不久的將來,各種 AI 原生設備將如雨后春筍般涌現,一個由 AI Agent 驅動的智能時代即將到來。 在這個過程中,智譜AI 將繼續(xù)深耕大模型技術,與合作伙伴攜手共進,共同推動 AI Agent 技術的進步和應用落地,為人類創(chuàng)造更加美好的未來。
本文章選自《AI啟示錄》雜志,閱讀更多雜志內容,請掃描下方二維碼