中國最大預訓練AI模型「文匯」面世 實現AI作詩賦詞

超大規模新型預訓練模型「文匯」具備一定的認知能力,能夠學習文本、圖片甚至影片等不同內容載體之間的概念,繼而完成作詩賦詞、看圖生文等AI創作任務。

超大規模新型預訓練模型「文匯」具備一定的認知能力,能夠學習文本、圖片甚至影片等不同內容載體之間的概念,繼而完成作詩賦詞、看圖生文等AI創作任務。

阿里巴巴集團、清華大學、中國人民大學、中國科學院等一眾科研智庫研究團隊,近日聯合發佈面向認知智能而開發的超大規模新型預訓練模型文匯,不僅能夠提升人工智能(AI)的理解能力,也具備一定的認知能力,能夠學習文本、圖片甚至影片等不同內容載體之間的概念,繼而完成作詩賦詞、看圖生文等AI創作任務。

與傳統AI訓練需要人工標註數據不同,識別認知智能的預訓練語言模型提供一種全新的學習思路。首先,AI能夠自動學習大量語言文字和圖像數據,記下和理解資訊內容及人類語言表述的規律後,繼而學習專業領域知識,讓AI同時掌握常識和專業知識。展望未來,這個模型將會應用於文本理解、人機交互、視覺問答等場景。

最新發佈的「文匯」是目前中國規模最大的預訓練模型,規模達到113億參數量,採用阿里巴巴集團自行研發的高性能分佈式框架,也突破「多模態理解」與「多模態生成」兩大難題,可以理解文本圖像資訊,並且完成創造性任務。目前,「文匯」已經支持基於認知推理的多種自然語言及跨模態應用任務,部分應用即將上線。

「文匯」模型能夠完成多種圖文生成任務,比如輸入下圖,在阿里巴巴的商品場景下微調的模型將會給出以下描述:

「旗袍是一種古典的風格,它不僅能夠彰顯出女性優雅氣質,而且還具有很好的修飾身形。這款旗袍採用了經典的圓領設計,穿著舒適自在,同時又能夠展現出女性柔美的頸部線條,讓你更加的迷人。精緻的繡花工藝,使得整件衣服看起來更加的精緻,也更加的突顯出女性的魅力。」

又例如,只要輸入詩歌題目、朝代以及作者,「文匯」就能自動生成仿古詩詞:

詠科舉(此詩為作者屢試不中,名落孫山所作)

金榜無名誓不歸,只求大第是何年。

若教九品並孔目,學取天人第一流。

經天緯地才難用,萬卷詩書濟世遊。

未到翰林先一日,十年共話九仙樓。

詠科舉(此詩為作者高中狀元,春風得意所作)

青雲路上狀元郎,一步登天入翰林。

黃金榜上詞臣貴,笑看人間進士郎。

掖庭宰相垂簾喜,尚書省郎入試忙。

榮登榜首魁星閃,不忘當年萬戶郎。

去年初發佈的2020年達摩院10大科技趨勢中便曾提及,AI正在從感知智能向認知智能演進,在聽、說、看的領域達到甚至超越人類水準,而多模態的預訓練模型正是實現感知智能跨越至認知智能的關鍵基礎。

達摩院智能計算實驗室負責人周靖人說:「預訓練語言模型是過去70多年以來最具創新的自然語言模型之一,其模型設計難度也遠高於傳統模型,達摩院研究團隊將持續攻克算法及系統工程難題,加速人工智能走向認知智能。」

作為中國最早投入認知智能研究的科技公司之一,阿里巴巴集團已經有30多個研究成果被國際頂級會議收錄,過往獲得世界人工智能大會至尊獎項—卓越人工智能引領者獎項(Super AI Leader,簡稱SAIL),與清華大學聯合獲得國家科學技術進步獎二等獎。而阿里巴巴集團旗下的圖神經網絡框架「Graph Learn」已經面向全球開源,可減少模型的算力、存儲資源消耗,同時縮短算法開發上線的周期。

【延伸閱讀】
以科技把脈未來 達摩院發佈2021十大科技趨勢(2021年1月)
阿里雲推多項人工智能解決方案助體育賽事數碼化(2020年9月)

 

AI 人工智能 文匯 認知智能 達摩院