OpenAI研究科學家Alexander Wei宣布,公司一個未發布的實驗模型在國際數學奧林匹克競賽中解決了六道題目中的五道,獲得42分中的35分,達到金牌水平。該模型展現出類似人類數學家的推理能力,能夠構建復雜嚴密的論證。這標志著AI在創造性問題解決方面的重要突破,不過該技術預計數月內不會公開發布。
微軟將大語言模型分為兩類,參數較小的規模被稱為小語言模型(Small Language Models, SLMs)。微軟認為,使用高質量的數據集訓練小規模參數語言模型,以達成更高的推理能力是很重要的一個方向。為此,微軟發布了Phi系列的大語言模型。
書生·浦語基于InternLM2模型與上一代 InternLM2 相比,推理性能提高了20%。數學推理性能超過了Llama3、Gemma2-9B等