追趕ChatGPT，文心一言需要兩個月

作者：張曉迪

2023-03-30

“

但對于百度來說，這兩個月什么時候能追上，才是更重要的問題。

舞臺上燈光閃爍，宣傳片還在播放，李彥宏已經站在側臺的暗場中等候。在之后的采訪中他說：“對這次發布會的內容，我做好了充分的準備。”

這是他距今年年初舉辦的第五屆百度Create AI開發者大會后的再次公開露面，這一次他帶來的是一款生成式AI“百度文心一言”。

此時百度線上直播間已經有幾十萬的觀眾在等待，但李彥宏未曾預料到，同一時刻百度的股價卻下跌了10%。

就在前一天，OpenAI率先發布了多模態大型語言模型 GPT-4，它的進化速度讓人們再次為之震撼。國內生成式AI和以ChatGPT為代表的GPT-4比較肯定是有差距的，正是因為資本市場看到了這個差距，股市才會出現這樣的反饋。

這時舞臺燈光亮起，李彥宏緩步走上臺前，開始了這場關于百度文心一言的發布。百度投入AI已經12年，在人工智能剛開始被大家討論的時候，百度就已經默默耕耘了兩年之久，研發費用將近23億元。2014年百度開始涉足智能駕駛領域，2015年上線世界首個大規模神經網絡機器翻譯系統，比Google早了一年多。2016年百度正式發布“百度大腦”并開源中國第一個深度學習框架飛槳。這一次李彥宏帶著百度走向了大模型。

舞臺上的他看不到資本市場的震蕩，也看不到網友們對白色腰帶的戲謔評論�，F在更重要的是，這是屬于文心一言的時刻，百度內部的各個產品線、生態合作伙伴都在等著這個技術，百度沒有退路可言。

文心一言能做什么？

面對眾人的好奇，李彥宏在發布會上率先回應：文心一言在內測時體驗感并不完美，但他表示文心一言的進步空間很大，平臺發布后百度將把用戶的反饋、開發者的模型迭代、調用形成正向閉環，未來會帶給大家新的驚喜。

在發布會后，我們也申請到了文心一言的邀請碼，并根據發布會展示的五個使用場景進行了測試，包括文學創作、商業文案創作、數理推算、中文理解和多模態生成。

這五大場景也是ChatGPT所擁有的大部分能力。李彥宏在接受采訪時表示，前三個場景是對標ChatGPT已有的功能，希望讓大家能夠感受到國產大模型并不差。

首先第一個場景是創作能力，文心一言稱自己可以創作各種類型的文學作品，例如詩歌、小說、散文、新聞報道等。

在文心一言創作的小故事中，描述了一個田園鄉村人與人之間相處的溫馨故事，但當我繼續提問，希望它以此為背景創作一首現代詩時，文心一言只提取出了上一個問題中“鄉村田園”的關鍵詞，創作了一首贊美鄉村風景的詩，并沒有與它之前的回答相結合。

接下來測試的是文心一言商業文案創作能力，文心一可以創作各種類型的商業文案，例如廣告文案、宣傳文案、產品文案等。

我讓文心一言生成一個推廣巧克力脆皮冰淇淋的策劃方案，但在描述方案的過程中，卻幾乎沒有提及冰淇淋，也沒有針對巧克力脆皮的特點進行創造。這樣的“套話”似乎適用于各種商業策劃，更像是一個通用模板。

同時，文心一言還存在字數限制，在成本評估的第三項內容描述中戛然而止，共計909字。當我問及文心一言單次輸出多少字時，它拒絕了我的回答，并告訴我這是百度的商業機密。

在測試的過程當中，我們發現文心一言是有自己的觀點的。當被問到“道德感高是不是一件好事”的時候，它給出了肯定的答案。而讓我要求它以否定角度給出答案時，它拒絕了我的要求。

我舉例論證道德感高不是一件好事，并問了它的意見。有趣的是，它尊重了我的看法，但仍然堅持了自己的觀點。

接下來，我測試了文心一言的多模態生成理解能力。我嘗試讓文心一言用方言說話，它準確地說出了我要求的句子，但接下來我讓它換一個口音時，它竟然說出來另一句話。

廣東話翻譯：嗯，聽到了，我現在心情很好。

在繪畫方面，文心一言有著不錯的理解能力。此前網上傳出了文心一言很多段子，例如“車水馬龍”展示的則是一輛車在馬路上載著一條龍。“魚香肉絲”是身上纏滿絲帶的熱帶魚。也有傳聞說是“漢譯英”再傳給Stable Diffusion，盡管這一點已經被百度官方辟謠。

而在測試中，當我讓文心一言畫出“魚香肉絲”時，它為我呈現了一道色澤紅亮的菜肴。由此看來，文心一言也有了非常大的進步。

由于文心一言的視頻生成成本較高，現階段還未對所有用戶開放，但對于使用百家號的編輯來說一定不陌生，因為視頻生成能力早已接入了百家號，為文章自動生成視頻。

經過測試來看，文心一言確實可以生成簡單的文案，可以為使用者提供一個基本的內容框架，只需要進行內容填充就可以成為一篇簡單直白的介紹文。當然要求不高的話，直接復制粘貼使用也是可以的。

但在生產力方面，文心一言的表現并不突出，甚至可以說有些稀疏平常。一個相對明顯的bug在于，文心一言并不能很好地聯系上下文，并做出具有邏輯性的回答，這使得文心一言更像是一個對話形式的搜索引擎。

你不是文心一言，你是魚，你的記憶只有7秒

而在面對同樣的系列提問時，ChatGPT給出了能夠聯系上下文的答案。

在發布會現場，PPT演示了文心一言正確回答出“《三體》作者是哪里人”的問題�；蛟S是多年深耕于搜索引擎的自信，李彥宏表示ChatGPT目前無法正確回答出這個問題。李彥宏也在另一個采訪中列舉，當用戶提問“二戰期間蘇聯為什么轟炸波蘭”時，文心一言能夠辨別出蘇聯沒有轟炸過波蘭，是德國轟炸波蘭。

然而，當我重復這個問題給文心一言時，它給出了和李彥宏不同的說法。

鑒于歷史上蘇聯的確幫助過德國對波蘭進行攻擊，我換了一個離譜的問法，結果是得到了更離譜的答案。

而向“喵娘GPT”提出同樣離譜的問題時，它給出了正確答案，不得不承認喵的進步速度確實更快一些。

但仍然不知道劉慈欣是哪里人。

在文心一言第一版產品測試時，百度內部將它與ChatGPT進行了對比，得出結論是相差40分。李彥宏坦言，當時文心一言團隊認為文心一言的提升空間不止40分，一定能在一個月內追趕上。然而在一個月后的測評時發現距離不僅沒有縮小，反而拉大了，尤其是ChatGPT所擅長的英文、編程等能力的進步讓他們有了緊迫感。

在經過研究后，他們發現ChatGPT有著自己的發展規律，并不是勻速升級。而文心一言是版本迭代的方式，升級速度同樣非�？�。李彥宏表示，文心一言在發布當天的能力已經達到了ChatGPT在去年12月，甚至是今年1月的水平。

現在文心一言與ChatGPT之間的差距可能最多是兩個月，但對于百度來說，這兩個月什么時候能追上，才是更重要的問題。

AI的十倍機會

在此之前，我們聊到ChatGPT，除了驚嘆于強大的對話式問答功能，其在生產力方面的表現也讓許多人產生了危機感，甚至有聲音認為，ChatGPT將會取代許多工作，導致失業危機。

OpenAI的創始人Sam Altman曾公開表示，大量的人一定會失業，所以OpenAI會按需收費，給沒有工作的人補貼。但李彥宏對此更加樂觀，他說，今天沒有馬車夫這樣的工作，因為出現了汽車。但是今天世界上存在的工作機會跟100年前相比，不僅是多了，而且多了很多倍。

不管有多少工作被替代，這只是整個圖景的一部分，另外一部分是，存在我們現在甚至無法想象的更多新機會。他預測，十年以后，全世界有50%工作會是提示詞工程（prompt engineering），不會寫提示詞（prompt）的人會被淘汰。

百度將目光聚焦到了產業上。李彥宏在發布會上表示，在國內，乃至全球大廠中，百度是第一個發布大語言模型的公司，也是全球范圍內在IT技術棧的芯片層、框架層、模型層和應用層，4個層級中都有領先產品的公司。從高端芯片昆侖芯，到飛槳深度學習框架，再到文心預訓練大模型，到搜索、智能云、自動駕駛、小度等應用，各個層面都有領先業界的自研技術。

百度在每一層都提早了很多年來布局，能力也更加完整，未來當人們基于百度智能云去開發新的應用，就會非常方便。李彥宏認為，百度AI全棧布局的優勢在于，可以在技術棧的四層架構中實現端到端優化，大幅提升效率。尤其是框架層和模型層之間，有很強的協同作用，可以幫助構建更高效的模型，并顯著降低成本。

就在2月27日，百度智能云正式發布企業級大語言模型服務平臺“文心千帆”。“文心千帆”大模型平臺除文心一言外，還包括百度文心一格、文心百中等全套文心大模型，以及相應的開發工具鏈。未來，文心千帆平臺還有望支持第三方的開源大模型，成為大模型生產和分發的集散地。

利用大模型生成的文字、圖像、音頻，和數字人結合，再加上超強的理解能力和表達能力，就會創造出很多新的可能。李彥宏認為，未來最大機會不在基礎服務，也不是行業服務，而是像微信、抖音、淘寶這樣的應用產品，這些基于AI而創造出的應用，誕生10倍于目前APP價值的機會，完全是存在的。

在人工智能時代，一定會出現殺手級應用、現象級產品不斷帶領大家走向新的里程。“那時人類一定是更幸福的。”李彥宏說道。

本文章選自《AI啟示錄》雜志，閱讀更多雜志內容，請掃描下方二維碼