聯通數科CTO楊海明:行業大模型用特色場景讓AI能力無處不在原創
從百模(魔)大戰到場景落地,大模型正回歸理智。大家經歷了一輪炒作與試用之后,逐漸對大模型從“興趣”回歸到了理性,不僅限于新奇好玩,更要體現出能用、好用。提升工作效率、降低用工成本成為企業的核心訴求。
從百模(魔)大戰到場景落地,大模型正從瘋狂回歸理智。
大家經歷了一輪炒作與試用之后,逐漸對大模型從“瘋狂的興趣”回歸到了理性,不僅限于新奇好玩,更要體現出能用、好用。提升工作效率、降低用工成本成為企業的核心訴求。對大模型的研發、訓練也從通用大模型轉向了行業大模型。
三大運營商均在大模型領域開始進行實踐和探索。“這也是數字化轉型進入深水區的一個必然趨勢,從流程化到數字化,再到智能化。這個大模型的發布只是一個開始,未來還將在反詐、客服、網運、以及針對政企客戶的場景化方向發布新的垂直行業和場景大模型。聯通將實現讓連接無所不在到算力無所不在再到人工智能無所不在的轉變。”聯通數科CTO楊海明接受至頂網記者專訪時這樣表示。

聯通數科CTO楊海明
行業大模型 = 高質量的行業大數據 + 大規模的算力網絡
基于聯通的自有優勢,結合公眾、企業、和政府的實際需求是做好行業大模型的基礎。楊海明表示:”聯通擁有廣泛而龐大的網絡資源、分布在全國數據中心的強大算力資源、以及沉淀多年的各類設備和業務的歷史數據資源,這些是聯通研發行業模型的獨具優勢。”
“現在大家做得比較多的是通用大模型,利用大量的互聯網數據,通過‘大力出奇跡’的方式訓練大模型。這樣訓練出來的模型能讓人感到無所不能:生成圖片、文字、小說、代碼……,然而也會出現很大的‘漂移’,答案的精準度不夠。這樣的模型在企業的工作、生產中就會出現很大偏差,并且同質化嚴重,很難在實際應用中形成優勢。”
“要獲得精準的結果、策略就需要更精準的數據。在行業實際中積累的各類知識、歷史決策數據就成為了優質的訓練數據來源。這種數據的參數規模也會大幅降低。通用大模型的訓練數據動輒就要用千億、萬億的參數,到了具體的行業里就會急劇縮減到只有百億,或幾十億。如果再具體到某個場景下,訓練完的模型調優上也就需要對幾百到幾千萬的參數進行優化,算力需求降低的同時,也大大提高了模型結果的精準性。”
例如在網絡運維場景下,雖然三家電信運營商都有基站、服務器、交換機、路由器這些設備,但各家網絡架構、設備采購的周期不同,幾十年來積累的數據也會有很大的不同。根據多年來積累下的數據、運維經驗所訓練出來模型也就會有很大的區別,利用訓練好的大模型就能帶來極大的運營效率提升。同樣,在客服、網絡、安全這種場景下,大模型具有更大的發展潛力。因此,除了各大運營商外,大型的互聯網企業的垂直大模型都是從這些場景入手,首先用來提升自身的運營效率。
在面向2C的個人場景方面,近年來犯罪分子利用通訊手段實施詐騙的案件層出不窮,給百姓帶來了巨大的經濟損失,也給社會的安全、穩定帶來了諸多隱患。中國聯通根據對大量歷史案件的作案流程、話術的復盤分析,反詐大模型很容易從繁雜的對話、短信中發現罪犯的行跡、目標與套路,幫助百姓降低詐騙風險、減少經濟損失。
推動產業從勞動密集向知識密集型的變革
布局行業大模型的目標是推動政府、企業從勞動密集型向知識密集型的數字化轉型。“以聯通為例,大模型的應用場景首先鎖定在了客服、網運這種原先需要大量人力的工作和崗位。”楊海明認為,“過去企業需要耗費大量人力做簡單重復性的客服、輔助性、文員等工作都將被AI大模型所取代,從而提升用戶體驗,降低企業成本。同時,大模型也將幫企業梳理、完善他們的知識庫,提高協同辦公效率,最終幫助政府、企業走向無處不在的人工智能。”
然而這也不是一蹴而就,訓練大模型的過程就像培養一個學生從學士到碩士到博士,訓練數據從通用到專業,訓練參數從大尺度到小規模。楊海明指出:企業搞大模型技術門檻在逐漸降低,業務理解是提升競爭力的主要方式。利用數據驅動業務是基于大數據實現的業務的自動迭代與升級。這一方面需要企業不斷積累高質量的數據。另一方面需要不斷探索、積極創新。聯通行業大模型秉承'內部使能、外部賦能'的一貫思路逐步推進。內部使能就是這些大模型產品在聯通內部會先用起來,大家覺得能用、好用之后再向外部推廣,擴展其更廣泛的應用場景,之后再通過逐步迭代最終實現雙向賦能。”
大模型未來的發展方向
行業大模型將是非常有前途的發展方向。但面臨需要積累大量行業數據的高門檻以及在算力、資金的強大支持。
行業大模型大概率不會出現百模大戰的競爭格局,行業中的龍頭企業做行業大模型最終會享受到AI與數據的紅利。從另一個角度看,算力調度的工具、訓練調優的工具、加速訓練及提升訓練效果的工具也是形成各家大模型差異化的重要能力。
智算能力入網、智能無處不在將是在人工智能時代基礎設施的重要特征。
“能否深入的了解行業并持續快速地迭代產品將成為行業大模型賽道里最核心的競爭力。” 楊海明這樣說道。
本文章選自《AI啟示錄》雜志,閱讀更多雜志內容,請掃描下方二維碼