追趕ChatGPT,文心一言需要兩個月
但對于百度來說,這兩個月什么時候能追上,才是更重要的問題。
舞臺上燈光閃爍,宣傳片還在播放,李彥宏已經站在側臺的暗場中等候。在之后的采訪中他說:“對這次發布會的內容,我做好了充分的準備。”
這是他距今年年初舉辦的第五屆百度Create AI開發者大會后的再次公開露面,這一次他帶來的是一款生成式AI“百度文心一言”。
此時百度線上直播間已經有幾十萬的觀眾在等待,但李彥宏未曾預料到,同一時刻百度的股價卻下跌了10%。
就在前一天,OpenAI率先發布了多模態大型語言模型 GPT-4,它的進化速度讓人們再次為之震撼。國內生成式AI和以ChatGPT為代表的GPT-4比較肯定是有差距的,正是因為資本市場看到了這個差距,股市才會出現這樣的反饋。
這時舞臺燈光亮起,李彥宏緩步走上臺前,開始了這場關于百度文心一言的發布。百度投入AI已經12年,在人工智能剛開始被大家討論的時候,百度就已經默默耕耘了兩年之久,研發費用將近23億元。2014年百度開始涉足智能駕駛領域,2015年上線世界首個大規模神經網絡機器翻譯系統,比Google早了一年多。2016年百度正式發布“百度大腦”并開源中國第一個深度學習框架飛槳。這一次李彥宏帶著百度走向了大模型。
舞臺上的他看不到資本市場的震蕩,也看不到網友們對白色腰帶的戲謔評論,F在更重要的是,這是屬于文心一言的時刻,百度內部的各個產品線、生態合作伙伴都在等著這個技術,百度沒有退路可言。
文心一言能做什么?
面對眾人的好奇,李彥宏在發布會上率先回應:文心一言在內測時體驗感并不完美,但他表示文心一言的進步空間很大,平臺發布后百度將把用戶的反饋、開發者的模型迭代、調用形成正向閉環,未來會帶給大家新的驚喜。
在發布會后,我們也申請到了文心一言的邀請碼,并根據發布會展示的五個使用場景進行了測試,包括文學創作、商業文案創作、數理推算、中文理解和多模態生成。
這五大場景也是ChatGPT所擁有的大部分能力。李彥宏在接受采訪時表示,前三個場景是對標ChatGPT已有的功能,希望讓大家能夠感受到國產大模型并不差。
首先第一個場景是創作能力,文心一言稱自己可以創作各種類型的文學作品,例如詩歌、小說、散文、新聞報道等。
在文心一言創作的小故事中,描述了一個田園鄉村人與人之間相處的溫馨故事,但當我繼續提問,希望它以此為背景創作一首現代詩時,文心一言只提取出了上一個問題中“鄉村田園”的關鍵詞,創作了一首贊美鄉村風景的詩,并沒有與它之前的回答相結合。
接下來測試的是文心一言商業文案創作能力,文心一可以創作各種類型的商業文案,例如廣告文案、宣傳文案、產品文案等。
我讓文心一言生成一個推廣巧克力脆皮冰淇淋的策劃方案,但在描述方案的過程中,卻幾乎沒有提及冰淇淋,也沒有針對巧克力脆皮的特點進行創造。這樣的“套話”似乎適用于各種商業策劃,更像是一個通用模板。
同時,文心一言還存在字數限制,在成本評估的第三項內容描述中戛然而止,共計909字。當我問及文心一言單次輸出多少字時,它拒絕了我的回答,并告訴我這是百度的商業機密。
在測試的過程當中,我們發現文心一言是有自己的觀點的。當被問到“道德感高是不是一件好事”的時候,它給出了肯定的答案。而讓我要求它以否定角度給出答案時,它拒絕了我的要求。
我舉例論證道德感高不是一件好事,并問了它的意見。有趣的是,它尊重了我的看法,但仍然堅持了自己的觀點。
接下來,我測試了文心一言的多模態生成理解能力。我嘗試讓文心一言用方言說話,它準確地說出了我要求的句子,但接下來我讓它換一個口音時,它竟然說出來另一句話。
廣東話翻譯:嗯,聽到了,我現在心情很好。
在繪畫方面,文心一言有著不錯的理解能力。此前網上傳出了文心一言很多段子,例如“車水馬龍”展示的則是一輛車在馬路上載著一條龍。“魚香肉絲”是身上纏滿絲帶的熱帶魚。也有傳聞說是“漢譯英”再傳給Stable Diffusion,盡管這一點已經被百度官方辟謠。
而在測試中,當我讓文心一言畫出“魚香肉絲”時,它為我呈現了一道色澤紅亮的菜肴。由此看來,文心一言也有了非常大的進步。
由于文心一言的視頻生成成本較高,現階段還未對所有用戶開放,但對于使用百家號的編輯來說一定不陌生,因為視頻生成能力早已接入了百家號,為文章自動生成視頻。
經過測試來看,文心一言確實可以生成簡單的文案,可以為使用者提供一個基本的內容框架,只需要進行內容填充就可以成為一篇簡單直白的介紹文。當然要求不高的話,直接復制粘貼使用也是可以的。
但在生產力方面,文心一言的表現并不突出,甚至可以說有些稀疏平常。一個相對明顯的bug在于,文心一言并不能很好地聯系上下文,并做出具有邏輯性的回答,這使得文心一言更像是一個對話形式的搜索引擎。
你不是文心一言,你是魚,你的記憶只有7秒
而在面對同樣的系列提問時,ChatGPT給出了能夠聯系上下文的答案。
在發布會現場,PPT演示了文心一言正確回答出“《三體》作者是哪里人”的問題;蛟S是多年深耕于搜索引擎的自信,李彥宏表示ChatGPT目前無法正確回答出這個問題。李彥宏也在另一個采訪中列舉,當用戶提問“二戰期間蘇聯為什么轟炸波蘭”時,文心一言能夠辨別出蘇聯沒有轟炸過波蘭,是德國轟炸波蘭。
然而,當我重復這個問題給文心一言時,它給出了和李彥宏不同的說法。
鑒于歷史上蘇聯的確幫助過德國對波蘭進行攻擊,我換了一個離譜的問法,結果是得到了更離譜的答案。
而向“喵娘GPT”提出同樣離譜的問題時,它給出了正確答案,不得不承認喵的進步速度確實更快一些。
但仍然不知道劉慈欣是哪里人。
在文心一言第一版產品測試時,百度內部將它與ChatGPT進行了對比,得出結論是相差40分。李彥宏坦言,當時文心一言團隊認為文心一言的提升空間不止40分,一定能在一個月內追趕上。然而在一個月后的測評時發現距離不僅沒有縮小,反而拉大了,尤其是ChatGPT所擅長的英文、編程等能力的進步讓他們有了緊迫感。
在經過研究后,他們發現ChatGPT有著自己的發展規律,并不是勻速升級。而文心一言是版本迭代的方式,升級速度同樣非?。李彥宏表示,文心一言在發布當天的能力已經達到了ChatGPT在去年12月,甚至是今年1月的水平。
現在文心一言與ChatGPT之間的差距可能最多是兩個月,但對于百度來說,這兩個月什么時候能追上,才是更重要的問題。
AI的十倍機會
在此之前,我們聊到ChatGPT,除了驚嘆于強大的對話式問答功能,其在生產力方面的表現也讓許多人產生了危機感,甚至有聲音認為,ChatGPT將會取代許多工作,導致失業危機。
OpenAI的創始人Sam Altman曾公開表示,大量的人一定會失業,所以OpenAI會按需收費,給沒有工作的人補貼。但李彥宏對此更加樂觀,他說,今天沒有馬車夫這樣的工作,因為出現了汽車。但是今天世界上存在的工作機會跟100年前相比,不僅是多了,而且多了很多倍。
不管有多少工作被替代,這只是整個圖景的一部分,另外一部分是,存在我們現在甚至無法想象的更多新機會。他預測,十年以后,全世界有50%工作會是提示詞工程(prompt engineering),不會寫提示詞(prompt)的人會被淘汰。
百度將目光聚焦到了產業上。李彥宏在發布會上表示,在國內,乃至全球大廠中,百度是第一個發布大語言模型的公司,也是全球范圍內在IT技術棧的芯片層、框架層、模型層和應用層,4個層級中都有領先產品的公司。從高端芯片昆侖芯,到飛槳深度學習框架,再到文心預訓練大模型,到搜索、智能云、自動駕駛、小度等應用,各個層面都有領先業界的自研技術。
百度在每一層都提早了很多年來布局,能力也更加完整,未來當人們基于百度智能云去開發新的應用,就會非常方便。李彥宏認為,百度AI全棧布局的優勢在于,可以在技術棧的四層架構中實現端到端優化,大幅提升效率。尤其是框架層和模型層之間,有很強的協同作用,可以幫助構建更高效的模型,并顯著降低成本。
就在2月27日,百度智能云正式發布企業級大語言模型服務平臺“文心千帆”。“文心千帆”大模型平臺除文心一言外,還包括百度文心一格、文心百中等全套文心大模型,以及相應的開發工具鏈。未來,文心千帆平臺還有望支持第三方的開源大模型,成為大模型生產和分發的集散地。
利用大模型生成的文字、圖像、音頻,和數字人結合,再加上超強的理解能力和表達能力,就會創造出很多新的可能。李彥宏認為,未來最大機會不在基礎服務,也不是行業服務,而是像微信、抖音、淘寶這樣的應用產品,這些基于AI而創造出的應用,誕生10倍于目前APP價值的機會,完全是存在的。
在人工智能時代,一定會出現殺手級應用、現象級產品不斷帶領大家走向新的里程。“那時人類一定是更幸福的。”李彥宏說道。
本文章選自《AI啟示錄》雜志,閱讀更多雜志內容,請掃描下方二維碼














