蘋果與俄亥俄州立大學研究人員發布名為FS-DFM的新模型,采用少步離散流匹配技術,僅需8輪快速優化即可生成完整長文本,效果媲美需要上千步驟的擴散模型。該模型通過三步訓練法:處理不同優化預算、使用教師模型指導、調整迭代機制來實現突破。測試顯示,參數量僅1.7億至17億的FS-DFM變體在困惑度和熵值指標上均優于70-80億參數的大型擴散模型。
北京第二十六維信息技術有限公司(至頂網)版權所有. 京ICP備15039648號-7 京ICP證161336號京公網安備 11010802021500號
舉報電話:010-62641205-5060 涉未成年人舉報專線:010-62641208 舉報郵箱:jubao@zhiding.cn
網上有害信息舉報專區:https://www.12377.cn