阿里巴巴開源創新大模型訓練方法 降低AI搜索成本近90%
阿里巴巴最近推出一款突破性的大型語言模型(LLM)訓練方法ZEROSEARCH,大幅降低訓練人工智能(AI)進行信息檢索的成本。與傳統依賴成本高昂的商業搜索引擎API調用的方式不同,ZEROSEARCH通過模擬搜索行為來訓練模型,將訓練成本降低了近90%,進一步推動先進的AI搜索功能的普及。
降低開發者與企業門檻
阿里巴巴通義實驗室自然語言處理方向負責人黃非表示:「ZEROSEARCH大幅降低訓練LLM模擬搜索引擎行為的成本,使開發者和企業,尤其是中小企業,能夠在不依賴成本高昂的搜索引擎交互的情況下,獨立構建自己的強化學習(RL)框架。在不影響性能的前提下實現成本壓縮,是大規模強化學習技術邁向普及的重要里程碑。」
信息檢索對於提升LLM推理能力和回答準確性至關重要。傳統的強化學習(RL)方法需要通過高成本的API調用與搜索引擎進行數十萬次的實時交互,不僅導致高昂的訓練成本,也限制了訓練的擴展性。此外,搜索引擎返回的結果質量往往參差不齊,進一步影響了訓練效果。
低成本高效模擬搜索
為解決這些問題,阿里巴巴的ZEROSEARCH 採用了兩步模擬策略,擺脫對高成本API的依賴:
首先,研究團隊使用輕量級監督微調(lightweight supervised fine-tuning),將LLM轉化為一個能夠根據查詢生成文檔的檢索模塊,從而模擬真實搜索引擎的行為。
其次,在強化學習訓練階段,引入基於課程的學習機制(curriculum-based rollout strategy),逐步降低生成文檔質量,使模型在越來越複雜的模擬搜索場景中不斷提升適應能力。
測試結果顯示,使用ZEROSEARCH訓練的模型可以比肩甚至優於依賴真實搜索引擎API訓練的模型。例如,基於Qwen2.5-7B的檢索模塊表現與谷歌搜索相當,而基於Qwen2.5-14B的版本則超越了谷歌搜索,同時訓練成本比傳統方式降低了88%。
除了高效、低成本的訓練方法,阿里巴巴還開源了多個適用於不同規模、語言和模態的AI模型,助力全球開發者以更經濟的方式構建訂製化AI解決方案。
Artificial Analysis報告顯示Qwen3-235B-A22B綜合智能排名第五,性價比最優,遠低於行業普遍水平。
根據知名獨立AI模型與API服務評測機構Artificial Analysis發佈的報告,阿里巴巴最新推出的LLM Qwen3-235B-A22B 在涵蓋數學、編程、推理和科學等能力的綜合智能表現排名第五,並在性價比方面位居榜首,每處理一百萬個token僅需0.30美元,遠低於行業普遍水平。
立即訂閱阿里足跡,緊貼阿里巴巴集團最新發展動向,通過新聞故事及專題文章了解創新科技、電子商務及智能物流等新興議題的嶄新趨勢

分享