OpenAI的o1模型是首個采用強化學習策略內化思維鏈技術的LLM,在醫學領域的表現尚未明確。研究人員通過35個醫學數據集和2個新問答數據集,評估了o1在理解力、推理能力和多語言能力方面的表現。實驗結果顯示o1在多數醫學任務上表現優越,但在中文醫療代理任務中性能下降,且解碼時間較長。研究指出需要更精確的評估工具和改進用戶指導策略,以實現AI醫生目標。
OpenAI發布了新的大語言模型o1,專注于邏輯推理優化,其推理能力在多個領域超越現有模型。o1模型通過思維鏈模式訓練,提升了數學、編程、科學問題解決能力。在AIME和GPQA測試中表現優異,超越人類專家水平。o1模型使用大規模強化學習算法,強調思維鏈和強化學習的重要性。OpenAI未向用戶展示原始思維鏈,但提供摘要。o1模型目前可供ChatGPT Plus訂閱用戶使用。