從“Chat”到“Act”：AutoGLM 如何引領 AI 智能設備新范式？

作者：趙曉勤

2024-12-02

“

智譜AI率先推出了 AutoGLM，試圖打造一款能夠理解、規(guī)劃、執(zhí)行，并最終實現“無人駕駛”操作系統(tǒng)的 AI Agent。

近年來，人工智能領域風起云涌，而大模型技術的崛起無疑是其中最耀眼的“明星”。它不僅重新定義了人機交互的方式，更在各行各業(yè)掀起了一場顛覆性的革命。然而，當下的 AI 應用大多停留在“聊天機器人”的階段，人們期待著 AI 能夠更進一步，從“Chat”走向“Act”，真正成為解決實際問題、提升效率的得力助手。

面對這一需求和挑戰(zhàn)，智譜AI率先推出了 AutoGLM，試圖打造一款能夠理解、規(guī)劃、執(zhí)行，并最終實現“無人駕駛”操作系統(tǒng)的 AI Agent。然而，通往未來的道路并非一帆風順，AutoGLM 的出現也引發(fā)了人們的諸多疑問：它究竟強大到什么程度？能否真正解放人們的雙手？又將如何改變我們的生活和工作方式？

從簡單操作到復雜任務：AutoGLM 不斷進化

起初，AutoGLM 只能完成一些簡單的手機操作，例如點外賣、發(fā)朋友圈、領紅包等。然而，在不斷的迭代升級中，它展現出了驚人的學習能力和執(zhí)行力。如今，AutoGLM 已經能夠挑戰(zhàn)更加復雜的任務。

可以實現超長任務。能在無需人為干預的情況下自主執(zhí)行超過 50 步的操作，例如自動完成一份復雜的采購清單。

AutoGLM 實現了跨 App 操作。AutoGLM打破了應用之間的壁壘，能根據用戶的指令在不同 App 間自由切換，例如一邊瀏覽商品信息，一邊自動打開購物 App 下單。

理解能力不斷提升，避免了繁瑣的指令，可對用戶的短指令進行理解。AutoGLM不再需要冗長的指令描述，只需簡單幾個字，就能理解用戶的意圖，例如用戶只要說出“點咖啡”，就能自動完成咖啡預訂的所有步驟。用戶不必記住冗長的咖啡的具體品名，他會根據用戶以往的習慣進行自助選擇。

還可以采用“隨便模式”。即在用戶沒有明確指示的情況下，根據用戶的意圖主動做出決策，可以據用戶的口味偏好推薦咖啡。按智譜 CEO 張鵬的說法，這就是一個“盲盒模式”能讓用戶能感受到不一樣的“新奇體驗”。

這些功能的實現，得益于 AutoGLM 在泛化能力、思維鏈能力上的突破。它能夠將用戶的指令拆解成一系列更細化的步驟，并調用不同的應用程序來完成，真正實現了從“被動執(zhí)行”到“主動思考”的轉變。

從手機到電腦：GLM-PC 開啟“無人駕駛”新時代

除了手機端的 AutoGLM，智譜AI 還推出了面向 PC 端的 GLM-PC，試圖打造一款能夠“像人一樣操作電腦”的 AI Agent。目前，GLM-PC 已經能夠實現：

會議替身：自動預定會議、發(fā)送會議紀要。

文檔處理：下載、發(fā)送、理解和總結文檔。

網頁搜索與總結：在指定平臺搜索關鍵詞，并對搜索結果進行閱讀和總結。

遠程和定時操作：通過手機遠程控制電腦，或設定定時任務。

隱形屏幕：在用戶工作時，在后臺執(zhí)行任務，不占用屏幕資源。

GLM-PC 的出現意味著 AI Agent 不再局限于移動端，而是開始向更加復雜、應用場景更加豐富的 PC 端拓展。雖然現階段 GLM-PC 的功能還比較有限，需要用戶輸入非常精準的指令，但它所展現出的潛力無疑是巨大的。

從 L1 到 L5：AI Agent 發(fā)展之路任重道遠

Agent將迎來高速發(fā)展期。Gartner預測，到2028年，至少15%的日常工作決策將通過人工智能代理自主完成（這一比例在2024年尚為0%）這依賴于強大的大模型能力。為此智譜AI將大模型能力的演進劃分為五個階段：

L1 語言能力：能夠理解和生成自然語言。

L2 邏輯能力：能夠進行邏輯推理和問題求解。

L3 使用工具的能力：能夠使用各種工具完成任務。

L4 自我學習能力：能夠自主學習和改進自身的能力。

L5 探究科學規(guī)律：能夠像科學家一樣探索未知領域。

張鵬介紹道，目前大模型在 L1 和 L2 階段已經取得了顯著進展，但在 L3 工具使用能力方面還處于早期階段。AutoGLM 和 GLM-PC 的出現，正是為了推動 AI Agent 在 L3 階段的快速發(fā)展，最終實現 L4 自我學習能力的突破。

AutoGLM 和 GLM-PC 的出現，意味著 AI 不再僅僅是冷冰冰的代碼，而開始擁有了“手”和“眼”，能夠像人一樣與現實世界進行交互。這不僅將徹底改變人機交互的方式，更將催生出全新的應用場景和商業(yè)模式。

智譜不僅要讓AI的能力局限在手機和電腦，還會將他擴展到不同的領域：手機+AI 會成為人們隨時隨地的個人智能助理，PC+AI 將會成為企業(yè)和個人的全新生產力工具，汽車+AI 將會讓汽車變?yōu)槿藗兊闹悄艿谌羁臻g。

而這些不僅僅是智譜的暢想，現在有很多場景都已落地。在AI與手機的結合中，榮耀手機的很多典型應用已結合了智譜GLM大模型。榮耀 AI 技術總監(jiān)王作建表示，智譜GLM模型已在YoYo助理、榮耀筆記、榮耀文檔產品中規(guī)模上線，給用戶帶來了全新體驗。

華碩 AIPC 智能生態(tài)負責人鐘懷圣對華碩與智譜的合作充滿了更多期望，他表示，將和智譜共同打造云端一體的AIPC智能助手。在內容提煉、軟件控制、AI創(chuàng)作、個人知識庫、AI聊天、硬件體驗等場景不斷發(fā)掘AI的創(chuàng)新能力。不僅如此，智譜不斷在不斷擴大著自己的朋友圈，從小鵬汽車到高通、英特爾、以及眾多賦能2B、2G的合作伙伴……

正如張鵬所說：“我們期待著 AI 不再局限于語言交互，而是能夠做更多的事情。”

在不久的將來，各種 AI 原生設備將如雨后春筍般涌現，一個由 AI Agent 驅動的智能時代即將到來。在這個過程中，智譜AI 將繼續(xù)深耕大模型技術，與合作伙伴攜手共進，共同推動 AI Agent 技術的進步和應用落地，為人類創(chuàng)造更加美好的未來。

本文章選自《AI啟示錄》雜志，閱讀更多雜志內容，請掃描下方二維碼

從“Chat”到“Act”：AutoGLM 如何引領 AI 智能設備新范式？

從“Chat”到“Act”：AutoGLM 如何引領 AI 智能設備新范式？