阿里雲發佈下一代AI創新策略路線圖

阿里雲智能董事長兼CEO吳泳銘在2025雲棲大會發表演講

阿里雲智能董事長兼CEO吳泳銘在2025雲棲大會發表演講

阿里雲今日在其年度科技盛會2025年雲棲大會上,正式發佈最新全棧人工智能(AI)創新成果,涵蓋Qwen3家族新一代大語言模型、即將推出的Wan2.5視頻生成模型、升級版智能體(Agent)開發及應用平台,以及AI基礎設施的重大升級,鞏固了阿里雲在嶄新AI時代的全球領先地位。

阿里雲智能董事長兼CEO吳泳銘表示:「未來,AI大模型將深度融合到各類設備中,像操作系統一樣運作,具備持久記憶、雲端協同能力、並能持續進化。我們始終堅持開源Qwen模型,將其打造成『AI時代的操作系統』,賦能全球開發者搭建顛覆性AI應用。」

他補充道:「同時,阿里雲將作爲全棧人工智能服務商,專注於為雲端大規模AI模型的訓練與部署提供高效穩健支撐。為彰顯對推動AI發展的長期承諾,我們將持續推進未來三年投入人民幣3,800億元於AI與雲基礎設施。」

自2023年第一代Qwen模型發佈以來,阿里巴巴基於兩大基礎模型——大型語言模型Qwen與視覺生成模型Wan——已開源超過300個AI模型。其AI模型下載總量突破6億次,衍生模型數量逾17萬個,成為全球應用最廣泛採用的開源AI系列之一。已有超過100萬家企業及個人開發者透過阿里巴巴AI開發平台Model Studio使用Qwen模型。

推出Qwen3-Max:阿里巴巴迄今最強的大語言模型

阿里巴巴正式推出迄今最大、參數量突破1萬億的Qwen3-Max旗艦級大語言模型。分為指令(Instruct)和推理(Thinking)兩大版本,該模型在廣泛基準測試中展現出色效能,尤以代碼生成與智能體能力方面的表現最為出眾。在指令模式下,SWE-Bench(大語言模型處理現實世界軟件問題的權威評估基準)對該模型的評分為69.6分,與部份頂尖閉源模型不相伯仲;在Tau2-Bench(對話智能體的評估基準)的評測中亦表現卓越,展現非凡的工具使用能力,此乃構建行動型智能體不可或缺的基礎能力。

Qwen3-Max在各項基準測試中展現出色效能

Qwen3-Max在各項基準測試中展現出色效能

會上還發佈了涵蓋視覺語言與多模態處理的一系列Qwen3模型:

  • Qwen3-VL: Qwen家族中迄今最強的視覺語言模型,其混合專家(MoE)架構支持包括邊緣設備及高性能雲環境的靈活部署。作為視覺智能體,Qwen3-VL可操作電腦與移動界面,其首創的視覺編程能透過圖像/視頻直接生成代碼,將設計圖輕易轉化為功能性應用程式。其空間理解能力支持3D定位,進一步強化方向與距離感知,為具身AI與現實世界空間導航奠定關鍵基礎。Qwen3-VL-235B-A22B 提供指令型(非推理型)與推理型兩種版本,在頂尖視覺感知與多模態推理基準測試中均表現優秀。
  • Qwen3-Omni:原生端到端多語言全模態模型,能處理文本、圖像、音頻、視頻輸入,並以文本及自然語音實時流式回應。Qwen3-Omni採用創新的「思考者-表達者」混合專家架構,以及預訓練達2,000萬小時的音頻數據,在理解音訊輸入(最長30分鐘)與視頻對話任務中表現超卓,且不減其高效的文本及圖像處理能力。該模型還實現超低延遲實時多模態交互,適用於智能座艙、智能眼鏡及手機上,是理想的直觀免提交互解決方案。Qwen3-Omni-30B-A3B已於Hugging Face及阿里雲的ModelScope社區開源,用戶亦可於Qwen Chat網頁應用程式體驗Qwen3-Omni-Flash,此應用程式設有多種Qwen模型供用戶試用。

此外,Qwen3-CoderQwen3-Image-Edit均已進行重大升級。新版Qwen3-Coder實現更快的推理速度與強化代碼安全性,而Qwen3-Image-Edit則新增支持多圖編輯功能,顯著提升視覺一致性。

阿里巴巴同時推出Fun(通義百聆)一系列具備先進多語言語音辨識與合成能力的語音大模型。該系列包含Fun-ASR——針對企業場景部署優化的端到端自動語音識別(ASR)模型,以及Fun-CosyVoice——高質量表現力語音合成模型,專為生成多種語言的自然語音輸出而設計。

預覽Wan2.5:多媒體內容創作再進階

阿里巴巴同時在雲棲大會上預覽了4Wan2.5模型,包括最新的視頻生成模型、圖像生成模型及圖像編輯模型。視頻生成模型原生支持高保真音頻生成,將時長從5秒延長至10秒,使敘事更完整連貫,同時提升畫質。該系列模型採用原生整合的多模態架構,透過文本、音頻、視覺數據的聯合訓練,實現對齊多模態生成,確保音畫同步,並提升指令理解能力,做到緊貼遵循用戶提示。

全新開發框架強化智能體高效部署

為提升AI Agent規模化部署的效率,阿里雲AI開發平台Model Studio現新增開發框架。新框架包含為企業專業開發者而設的高代碼開發框架Model Studio-ADK(智能體開發套件),可將複雜業務需求變為可執行的智能體邏輯,驅使快速構建具自主決策、動態反思與迭代任務執行能力的先進AI智能體。值得一提的是,用戶使用其功能強大的工具包,僅需1小時即可創建DeepResearch或Agentic Agent(RAG)項目。Model Studio同步升級了其低代碼開發平台Model Studio-ADP(智能體開發平台),讓編程基礎較低的用戶也能輕鬆創建輕量級AI智能體。

為解決多源數據處理、算力限制與跨環境部署等企業痛點,Model Studio智能體推出了多項企業級能力:透過模型上下文協議(MCP)工具連接、RAG多模態融合、動態推理調度及沙盒服務,協助企業加速AI智能體的落地應用。

目前,用戶可透過Model Studio存取調用超過200個行業領先模型,包括阿里巴巴自研的Qwen與Wan系列模型。目前已有過80萬個智能體在Model Studio上創建,應用覆蓋內容創作、智能營銷到智能家居管理及生產優化等多元場景。過去12個月,該平台的模型調用量增長了15倍,反映市場對强勁、可擴展的AI解決方案需求日益增長。 

創新AI平台支援企業與創作者

繼7月首次亮相後,阿里雲對AgentBay推行重大升級,這款為企業、開發者及AI合作夥伴打造的多模態雲端操作環境及專家智能體平台上,已新增包括自進化引擎、自定義鏡像及內建安全合規管控機制等功能,協助智能體從單一模型輔助工具轉型為可端到端完成任務的複合人形多模態工作者。

企業對AI驅動成長的需求日增,有見及此,阿里雲同步推出瓴羊AgentOne一站式企業AI應用平台,協助企業從被動回應轉型為主動智能。基於Qwen模型及與阿里巴巴生態深度融合,瓴羊AgentOne提供端到端智能體開發工作空間,可連接現有系統並加速價值實現。瓴羊AgentOne以涵蓋營銷、分析、客服、營運等場景化解決方案,連結售前、銷售及售後的完整價值鏈,為家居優化、電商等行業提供可量化及可應用於生產的成果。

此外,阿里巴巴面向消費者的AI應用平台夸克(Quark推出了一站式AI圖像與視頻創作平台造點,整合業界領先AI模型,如阿里巴巴旗艦視頻生成模型通義萬相,為創作者提供專業高效體驗。除了基於通義萬相支援的文生視頻及圖生視頻功能外,造點還提供AI圖像生成與編輯功能,並備有多種頂尖模型可供選擇。創作者可直接訪問網站 zaodian.quark.cn 或通過夸克桌面版的AI生圖入口體驗平台服務。

新世代AI基礎設施為代理式AI奠定關鍵基礎

阿里雲在雲棲大會上亦發佈了一套專為支持新興代理式AI生態而設計的全面及創新基礎設施升級方案:

  • 存儲:阿里雲新增「向量儲存桶」以強化其對象儲存服務(OSS)。這項由AI驅動的功能可實現低成本及大規模向量數據儲存與檢索,以優化RAG與AI應用程式。它整合OSS中的原始與向量數據管理,透過標準API存取,簡化可擴展的RAG平台開發與多媒體資產整理。此功能讓企業能集中管理原始與向量數據,降低複雜性並加速RAG應用部署,從而降低AI開發成本。
  • 網絡:阿里雲推出最新高效能、專為人工智慧模型設計的HPN8.0網路架構。此創新技術可支持模型訓練、推理與強化學習(RL)等混合算力负载,同時支持超大規模部署。該架構提供800 Gbps網路吞吐量,為前代容量的兩倍。
  • 安全:另一關鍵更新是為其雲安全中心威脅分析及響應(CTDR)解決方案新增由AI驅動的代理式功能。此雲原生安全強化措施提升了偵測、分析與处置能力,提供一個更智能且主動的威脅防禦措施。5款由Qwen驅動的AI智能體,實現從告警研判到執行的自動化安全運營,具備智能分析、事件關聯與可行動報告,用於端到端威脅管理。新功能有效將事件自动調查成功率從59%提升至74%,並處理70%自動響應行動無需人工干預。
  • 容器:阿里雲已升級其容器計算服務(ACS),透過優化調度與容器鏡像緩存加速技術,強化其自動擴縮容能力,增强彈性伸縮能力,支持每分鐘擴縮容15,000pod,以應對大量的高併發Agent請求。此外,ACS容器沙盒技術透過用戶空間與執行環境隔離,提供強隔離保障,防止跨智能體漏洞與數據洩漏。
  • 數據庫:阿里雲升級其PolarDB數據庫,以優化 Data+AI負載,引入由Compute Express Link(CXL)技術驅動的硬件創新,透過高效能記憶體與內存互聯,降低72.3%延遲,並將記憶體擴展能力提升16倍,為Data+AI負載奠定了堅實基礎。升級版PolarDB亦引入新型Lakebase架構,具備混合儲存負載,包括數據湖、數據庫與元數據,用以儲存流行開放數據格式如Lance、Iceberg及Apache Hudi;並降低儲存成本,實現高效多模態數據儲存與管理。
  • PAI:阿里雲人工智能平台PAI透過協同優化技術推動大模型開發,向代理式AI時代邁進。其創新的MoE訓練加速技術使Qwen系列訓練加速比提升3倍以上,同時升級後的DiT訓練引擎將Wan系列單樣本訓練耗時縮短28.1%。推理層的優化令推理吞吐量(TPS)提升71%,時延(TPOT)降低70.6%,基礎設施擴容速度提升97.6%。

立即訂閱阿里足跡,緊貼阿里巴巴集團最新發展動向,通過新聞故事及專題文章了解創新科技、電子商務及智能物流等新興議題的嶄新趨勢。

阿里雲 雲棲大會2025