在线观看成人小视频_丰满少妇被猛烈进入一区二区_中文字幕成人在线_国产成人自拍网站_亚洲人成绝费网站色www_无码国产精品96久久久久_国产精品一区二区三区精品_国产在线播放一区三区四_成人精品久久av网站_在线观看日韩一区二区_欧美日韩在线亚洲一区蜜芽_韩国成人av

清華教授鄧志東:大模型評測,能不能也建個L0-L5分級?

作者:于佳卉
2023-12-29

如何駛出大模型的幻象迷航?

兩周前,Reddit上一個爆料GPT-4.5的帖子火了,其中提到GPT-4.5將具備更強的多模態能力,文本、語音、圖片以及視頻都能一并處理,還具備復雜的推理以及跨模態理解能力。

消息一出,網友就熱鬧起來了,有好事者去Sam Altman的帖子下詢問GPT-4.5是否泄露,得到了一個輕飄飄的“nah”。

網友們又轉去問ChatGPT,結果還真問出了一個模型說自己是4.5版本的回答。不過很快OpenAI的員工回應,這是大模型產生了幻覺。隨后ChatGPT官方賬號發推,配了“腦”和“霧”的表情,大概是委婉地承認大模型幻覺問題。

大模型的幻象迷航

大模型幻覺,通俗地說就是一本正經的胡說八道,看似很有道理,其實是在騙你。在過去這一年,大模型賽道風起云涌,無數國內外科技巨頭、AI創業公司涌入,形成了“千模大戰”的盛景,與此同時,幻覺現象頻出,并且由于大模型的強大,生成的幻覺有時看上去非常合理,難以分辨,已經成為大模型產品落地的攔路虎。

清華大學計算機系長聘教授、清華大學人工智能研究院視覺智能研究中心主任鄧志東在接受至頂科技采訪時表示,大模型幻覺,可以分為事實性幻覺和上下文不一致幻覺,前者是大模型生成的內容不符合常識,甚至出現了捏造或者杜撰。后者則是大模型生成的回復或下文與用戶上文的指令不一致,也就是答非所問,驢唇不對馬嘴。

事實性幻覺是目前大模型幻覺研究的熱點,這一類幻覺對用戶的影響更大,還可能產生安全問題。例如,大模型在生成醫療建議時可能會捏造錯誤的藥品劑量,在具身智能中可能會帶來時空錯亂,這些都會給用戶帶來安全風險。但是,幻覺問題是客觀存在的,它的成因涉及到數據、模型結構、預訓練、微調甚至推理各個部分。

從訓練數據的角度來看,由于互聯網上的信息是非均衡的,有的數據特別豐富,有的數據很少甚至缺失,也可能存在偏見或根本是錯誤信息,還有些數據的時效性不夠等。大模型通過互聯網采集的數據較容易出現這類缺陷。

從訓練本身來看,主流的大模型是自回歸生成式模型,沒有糾錯機制,也就是說前面發生的錯誤會傳遞到后面,導致錯上加錯,像滾雪球一樣。此外,如果問題超出了大模型的知識邊界,也可能由于大模型的對齊策略產生幻覺。

有什么方法能緩解這種幻覺?鄧志東從四個層面進行了解說。

一是提高訓練數據的質量。在預訓練和微調階段通過數據清洗減少偏見,增加多元性和均衡性。例如,針對不同質量的預訓練樣本集采用打分加權,給高質量數據集,比如程序代碼、專業論文和正式出版的書籍以更高的權重。而對于網頁上抓取的信息,通過大量清洗,篩除其錯誤和冗余數據,這方面特別需要時間和資源的投入。

二是知識增強。利用外部工具檢索,跟常識性知識源進行對比。對于專用模型,則可增加更多的專業知識庫喂養。還可以借助于數字孿生,將數字孿生系統與大模型結合起來進行交叉驗證,幫助其消除幻覺。

三是增強一致性。包括邏輯一致性、知識一致性,通過一致性來判斷是否出現了幻覺,尤其是對上下文不一致的幻覺,有較好的效果。

最后是給大模型增加電子水印。未來互聯網上AI生成的內容會越來越多,甚至超過人類產生的數據。清楚數據來源就顯得很重要,我們要知道它是由人類產生的,還是由AI大模型產生的,具體是哪個大模型,加水印是比較簡單的一個低成本鑒別方法。

另外,幻覺問題也與用戶如何跟模型交互相關。若巧妙地提問,采用一步一步拆解的策略,通過思維鏈方式將一個復雜問題分解為多個子問題,或者將一個大任務拆解成若干子任務,也能緩解幻覺問題。

揭秘大模型評測機制

如今,大模型之爭是整個科技界的焦點。市場上不乏聲稱自己產品超越GPT-3.5,甚至對標GPT-4的團隊,在各個榜單上刷臉。如何客觀評測大模型能力成為一個公眾和業界共同關注的議題。

最近,由工信部中國電子技術標準化研究院發起的國內首個官方“大模型標準符合性評測”結果揭曉,有四家大模型通過了這一評測:360智腦、百度文心一言、騰訊混元、阿里云通義千問,這也標志著大模型的官方認證進程已經開啟。

鄧志東表示,盡管業界已形成多個評測基準,如NLP領域的MMLU、BIG-Bench、C-Eval、GSM8K等,但大模型的跨領域特性使得每個細分領域都有其獨特的評測指標,例如在計算機視覺領域中的視覺目標檢測通常使用mAP進行評測,圖像與視頻分類任務則用準確率、召回率等指標進行性能評估。總體上,目前還沒有形成完整統一的跨領域多任務的評測體系,很多廠商因此鉆了空子,僅展示自己表現最好的方面。

大模型評測,需要構建一個統一、客觀的第三方評測機構,不能由企業或者研究機構自說自話。鄧志東認為,評測體系的建設應遵循定性與定量相結合、評測大模型與人類專家相結合的原則,既有客觀又有主觀。評測體系可以分為安全性、準確性、涌現能力和泛化能力四個維度,綜合評估大模型在各項任務中的表現。評測模式包括做題打分、模型間PK,還包括對模型各項單一能力的評估等。

他進一步提出了一個想法,類似于自動駕駛技術的L0-L5分級,大模型評測體系是否也可以采用這樣劃分?在這種框架下,L0至L2級可能代表的是大模型的基礎感知與生成能力,而L3級及以上則標志著模型具備更高級的理解認知與多模態生成能力,從初級認知到中級認知,L5級則是寬度接近甚至超越人類的高級認知能力。

從發展路徑上看,人工智能可分成弱人工智能-通用人工智能-強人工智能-超級人工智能這幾個演化階段。我們現在正處于通用人工智能的早期階段,當它的認知能力與完成復雜任務的寬度和人類差不多,就是強人工智能時代到了。

在這一大尺度發展路徑上,既有巨頭企業推動的基礎、基座通用大模型,也有針對垂域或特定應用場景的專用模型。畢竟大模型的價值在于實際應用和產品落地,這樣才能形成一個可持續發展的商業閉環,因此更多初創企業應轉向垂域專用模型的產業落地。在這一過程中,中國在商業模式構建、應用落地速度以及應用場景多樣性上的優勢可能也會體現出來,以此重建我們在AI大模型時代的新優勢。

從單模態到多模態,從簡單任務執行到復雜的認知功能,比如智能涌現,零樣本泛化等,通用人工智能這一年的發展超出了很多人的預期。在大模型不斷演化過程中,完善的評測體系和標準構建尤為重要,這不僅僅是技術的競合,更意味著話語權,和對未來行業趨勢的引領。

本文章選自《AI啟示錄》雜志,閱讀更多雜志內容,請掃描下方二維碼

《AI啟示錄》雜志
1区1区3区4区产品乱码芒果精品| 天天爽夜夜爽夜夜爽精品视频| 精品视频123区在线观看| 日韩美女在线观看| 中文字幕网av| 国产又黄又大又爽| 亚洲欧美一区二区三区四区| 女人床在线观看| 在线黄色av网站| 欧美一区二区三区啪啪| 免费成人av网站| 中文字幕乱码在线| 久久综合九色综合欧美狠狠| 91国偷自产一区二区使用方法| 高清无码视频直接看| 特黄特色免费视频| 一级片视频免费| 亚洲免费av网站| 最近更新的2019中文字幕 | 18视频在线观看娇喘| 亚洲性图一区二区| 青青草免费观看视频| 亚洲欧洲成人av每日更新| 午夜精品国产精品大乳美女| 亚洲天堂小视频| 五月婷婷六月色| 日韩欧美在线免费| 久久久久九九九| 久久免费精彩视频| 亚洲欧美另类久久久精品| 欧美极品少妇xxxxⅹ喷水| 欲求不满的岳中文字幕| 久久99精品视频| 亚洲图片欧美午夜| 香港日本韩国三级网站| 国产乱码精品一区二区三区忘忧草 | 欧美久久精品午夜青青大伊人| 亚洲精品20p| 狠狠色狠狠色综合系列| 色妞欧美日韩在线| 国产大学生av| 国产亚洲1区2区3区| 777午夜精品福利在线观看| 久久综合桃花网| 91美女片黄在线观看| 国产91精品视频在线观看| 中文精品在线观看| 亚洲一区二区偷拍精品| 视频一区二区三| 青青操免费在线视频| 精品国产乱码久久久久久闺蜜 | 日韩理论片中文av| 不卡视频一区二区| 波多野结衣二区三区| 亚洲韩国欧洲国产日产av| 岳毛多又紧做起爽| 不卡一二三区首页| 亚洲精品日韩激情在线电影| 欧美日韩a v| 欧美一区二区免费观在线| 国产一区二区三区免费不卡| 国产美女精品视频国产| 日韩精品免费综合视频在线播放 | 亚洲色图偷窥自拍| 992在线观看| 日韩精品一区二区三区老鸭窝| 中文字幕一区二区在线观看视频 | 午夜精品亚洲一区二区三区嫩草 | 高清在线观看日韩| 久久伦理网站| 国产麻豆日韩欧美久久| 好吊色欧美一区二区三区四区 | www.com操| 亚洲精品国产高清久久伦理二区| 国产亚洲精品久久久久久久| 青青草97国产精品免费观看无弹窗版| 国产精品高潮粉嫩av| 国产三级av片| 91精品国产乱码久久久久久蜜臀| 国产精品无码免费播放| 在线日韩精品视频| 亚洲 国产 日韩 欧美| 亚洲欧洲在线播放| 波多野结衣电车痴汉| 午夜精品免费视频| 无码国产色欲xxxx视频| 成人激情av| 久久综合色婷婷| 日韩精品免费播放| 午夜精品123| 实拍女处破www免费看| 亚洲色图15p| 亚洲天堂一区在线观看| 欧美成人亚洲成人| 精品国产区一区二| 久久综合福利| 99re这里都是精品| 美国av在线播放| 亚洲免费视频成人| 日本高清久久久| 精品美女在线播放| 日韩欧美视频在线免费观看| 日韩免费黄色av| 久久蜜桃资源一区二区老牛| 欧美中日韩一区二区三区| 国产精品毛片无遮挡高清| jizz18女人| 欧美大片一区二区三区| 91亚洲精品国偷拍自产在线观看 | 亚洲综合色激情五月| 国产视频在线观看一区二区三区| 亚洲av无码成人精品区| 欧美男女性生活在线直播观看| 久久久久久久久久91| 国产乱码精品一区二区三区卡| 91网站在线播放| 一区二区日韩在线观看| 国产精品xxx视频| 玖玖精品视频| 无码内射中文字幕岛国片| 亚洲系列中文字幕| 韩国欧美一区二区| 中国毛片在线观看| 国产高清精品一区二区三区| 8v天堂国产在线一区二区| 国内爆初菊对白视频| 午夜激情福利在线| 97免费中文视频在线观看| 日韩av中文字幕一区二区| 一区二区精品在线观看| 91精品国产高清一区二区三区蜜臀 | 国产精品福利导航| 国产精品91久久| 亚洲精品视频一区二区| 亚洲 欧美 成人| 中文字幕中文字幕在线中一区高清| 欧美一区二区三区在线视频| 天堂午夜影视日韩欧美一区二区| 天堂社区在线视频| 欧美一级大胆视频| 亚洲综合色丁香婷婷六月图片| 欧美一区免费看| 欧洲黄色一级视频| 午夜精品免费视频| 国产精品久久毛片a| 免费黄色小视频在线观看| 日韩a一级欧美一级| 制服国产精品| 日韩精品一区二区三区蜜臀 | 在线视频日韩精品| 777777国产7777777| 日韩中文字幕网站| 成人激情黄色小说| 久久午夜精品视频| 一本久道久久综合| 在线精品高清中文字幕| 成人国产视频在线观看| 久久精品亚洲a| 美女主播视频一区| 国产97在线亚洲| 亚洲精品久久7777777| 成人精品电影在线观看| 国产精品第一页在线观看| 99v久久综合狠狠综合久久| 超碰97av在线| 91在线视频成人| 欧美一区二区在线播放| 国产乱人伦偷精品视频不卡| 国产午夜在线一区二区三区| 精品久久久久久一区| 亚洲国产精品嫩草影院久久| 日韩久久中文字幕| 韩日欧美一区二区| 精品久久久影院| av一区二区在线看| 香蕉网在线视频| 在线观看中文字幕码| 中文字幕第一区二区| 日韩av在线一区| 国产欧美日韩综合精品二区| 黄色激情在线观看| 熟妇高潮一区二区高潮| 国产午夜精品理论片a级大结局| 亚洲成人av免费| 欧美α欧美αv大片| 欧美一区亚洲一区| 日韩成人av电影在线| 日本黄色www| 亚洲国产无线乱码在线观看| 日韩高清一级片| 91在线视频观看| 久久精品国产99国产| 国产欧美一区二区三区网站| 亚洲天堂成人在线| 日韩视频免费大全中文字幕| 日本男女交配视频| 美脚丝袜一区二区三区在线观看| 成人激情视频在线| 日韩精品欧美一区二区三区| 性欧美xxxx交| 日韩成人黄色av| 亚洲欧洲xxxx| 一本色道久久88精品综合| 亚洲欧美中文另类| 亚洲网站在线播放| 欧美xxxx综合视频| 97精品伊人久久久大香线蕉 | 中文字幕乱码在线观看| 欧美精品韩国精品| 天天干,天天干| 国产日韩欧美一区二区东京热| 国产精品探花视频| 四季av日韩精品一区| 在线免费av网| 国产精品51麻豆cm传媒 | 国产日本欧洲亚洲| www国产成人免费观看视频 深夜成人网| 亚洲av成人精品毛片| 黄色一级大片在线免费看国产一| 污视频网站免费观看| av中文字幕播放| 午夜小视频在线播放| 国产毛片精品视频| 91在线观看高清| 国产精品毛片高清在线完整版| 亚洲日本欧美天堂| 国产丝袜一区视频在线观看| 在线国产精品播放| 欧美不卡一区二区三区四区| 亚洲人成网站777色婷婷| 欧美在线免费视屏| 亚洲欧美成人精品| 久久视频免费在线播放| 国产91精品视频在线观看| 51国产偷自视频区视频| 欧美成人精品激情在线视频| 99热这里只有精品4| 一区二区三区免费高清视频| 在线免费观看高清视频| 国产精品国产自产拍高清av | 国产又粗又猛又爽又黄视频 | 亚洲成人你懂的| 久久久www成人免费无遮挡大片| 99精品视频一区二区| 亚洲自拍另类综合| 日韩视频一区二区在线观看| 最近2019中文字幕在线高清| 国产精品99久久99久久久二8| 成人av免费在线看| 青青青免费在线| 性高潮久久久久久| 成人免费无遮挡无码黄漫视频| 在线观看精品国产| 日日夜夜精品视频免费| 久久精品男人天堂av| 欧美日韩在线不卡| 久久久国产精品视频| 国产乱码精品一区二区三区中文| 日本高清视频免费在线观看| 日日噜噜夜夜狠狠| 欧美人与禽zozzo禽性配| 蜜桃视频在线观看www| 久久久不卡网国产精品一区| 欧美久久婷婷综合色| 97超级碰碰碰久久久| 日本一区二区在线视频| 五月天开心婷婷| 毛片基地在线观看| 久久久精品动漫| 国产精品亚洲αv天堂无码| 谁有免费的黄色网址| 国产日韩免费视频| 久久久不卡网国产精品二区| 欧美精品粉嫩高潮一区二区| 6080yy精品一区二区三区| 大荫蒂性生交片| 青青草原免费观看| 成人av在线影院| 亚洲色图欧美制服丝袜另类第一页| 97人人干人人| 中文字幕人妻一区二区| 亚洲毛片在线播放| 欧美日韩美女在线| 国产欧美婷婷中文| 人人干人人干人人| 91福利在线观看视频| 婷婷国产v国产偷v亚洲高清| 欧美一区二区.| 狠狠干狠狠操视频| 久久夜色精品| 日韩一区二区免费高清| 国产伦精品一区二区三区照片91 | 久久亚洲中文字幕无码| 探花视频在线观看| 五月激情综合网| 成人黄色片视频网站| sm捆绑调教视频| 久久免费电影网| 久久久久国产精品免费| 国产又黄又猛的视频| 蜜桃久久久久久| 亚洲精品电影网| 高清欧美精品xxxxx| 亚洲黄色精品视频| 亚洲精品在线免费观看视频| 五月天男人天堂| 99热这里只有精品1| 精品国产在天天线2019| 欧美午夜性视频| 人妻一区二区三区| 在线亚洲男人天堂| 欧美高清精品一区二区| 99久久婷婷国产综合精品电影| 久久99青青精品免费观看| 亚洲一级片免费观看| 成人一区二区三区| 欧美在线中文字幕| 青娱乐国产精品| 一本大道久久精品懂色aⅴ| 欧美欧美一区二区| 国产三级视频在线播放| 亚洲第一中文字幕| 日本激情综合网| 久久精品在线免费观看| 波多野结衣成人在线| 国产男女猛烈无遮挡| 国产亚洲人成网站在线观看| 日韩精品国产一区| 国产亚洲短视频| 久久久久久国产精品一区| 精品人妻伦一二三区久久| 久久精品国产亚洲精品2020| 亚洲一区二区三区日韩| 欧美午夜片欧美片在线观看| 婷婷精品国产一区二区三区日韩| 性欧美一区二区三区| 久久男人的天堂| 久久免费播放视频| 亚洲精品电影久久久| 一级性生活毛片| 懂色av中文一区二区三区天美 | 日本精品一区| 国产在线播放一区二区三区 | 草久视频在线观看| 国产午夜精品全部视频在线播放 | 动漫精品视频| 久久中文欧美| 91精品久久久久久| 欧美天堂在线视频| 国产久一一精品| 天天射天天操天天干| 国产精品com| 中文字幕视频在线播放| 国产精品一区专区欧美日韩| 四虎免费在线观看| 久久久国产精华液999999| 亚洲国产成人av| 国产破处视频在线观看| 欧美日韩国产成人| 亚洲av电影一区| 日韩免费在线观看av| 91精品福利在线一区二区三区| 91九色丨porny丨肉丝| 粉嫩av四季av绯色av第一区| 成人avav在线| www,av在线| 尤物九九久久国产精品的特点 | 久久久久成人网站| 国产区亚洲区欧美区| 久久精品一区二区三区不卡牛牛 | 国产无套粉嫩白浆内谢的出处| 高清久久久久久| 中文字幕66页| 亚洲欧洲xxxx| 无码人妻精品一区二| 亚洲综合色av| 久久噜噜亚洲综合| 国产美女视频免费看| 日韩成人av在线| 97人妻精品一区二区三区视频 | 欧美日韩精品一二三区| 黑鬼狂亚洲人videos| 国产成人精品久久二区二区| 国产成人在线色| 国产精品亚洲二区在线观看| 欧美人牲a欧美精品| 欧美一级特黄视频| 久久国产精品一区二区三区| 中文字幕av免费专区久久| 变态另类丨国产精品| 欧美激情视频在线观看| 国产精品亚洲第一区在线暖暖韩国 | 国产精品综合视频| 日本不卡一区二区在线观看| 中文字幕亚洲无线码在线一区| 老司机精品视频在线| 亚洲精品手机在线观看| 久久亚洲成人精品| 91网站在线播放| 亚洲一二三四五六区| 成人免费91在线看| 亚洲日本va在线观看| 欧美精品成人久久| 欧美成人蜜桃| 亚洲第一偷拍网| 日韩精品一级中文字幕精品视频免费观看 | 精品麻豆av| 精品视频在线播放免| 风间由美性色一区二区三区| 娇妻高潮浓精白浆xxⅹ|