科羅拉多大學(xué)研究人員發(fā)現(xiàn),大型語(yǔ)言模型在解決數(shù)獨(dú)謎題時(shí)表現(xiàn)不佳,即使是簡(jiǎn)化的6x6數(shù)獨(dú)也常常超出其能力范圍。更重要的是,當(dāng)要求AI展示解題過(guò)程時(shí),它們往往無(wú)法準(zhǔn)確解釋,有時(shí)會(huì)撒謊、胡言亂語(yǔ),甚至開(kāi)始談?wù)撎鞖狻Q芯勘砻鳎珹I雖然擅長(zhǎng)寫(xiě)郵件或生成圖像,但在需要邏輯推理的任務(wù)上存在明顯缺陷,且無(wú)法透明地解釋其決策過(guò)程,這對(duì)AI在日常生活中的應(yīng)用提出了謹(jǐn)慎考量的要求。