阿里雲音視頻AI助手「通義聽悟」能力升級 上線問答助手與一鍵AI改寫

通義聽悟上線音視頻問答助手「小悟」,可以根據紀錄內容,回答用戶提問的相關話題。

阿里雲工作學習人工智能(AI)助手「通義聽悟」發佈多項新功能,包括上線音視頻問答助手,基於紀錄內容回答用戶查詢,並可一鍵跳轉回顧原文。用戶還可以針對超長網課、會議等音視頻內容提問,利用AI能力總結知識點、將口語化表達潤色成書面表達,並製作可視化腦圖等。

音視頻承載訊息密集,但查找、回顧與提煉信息十分耗時。阿里雲「通義聽悟」產品負責人楊帆表示:「作為一款工作學習AI助手,『通義聽悟』希望能夠讓高知識附加值的音視頻被輕鬆閱讀、整理和分享。」

「通義聽悟」此次推出的音視頻問答助手「小悟」可以根據紀錄內容,回答用戶提問的相關話題。「小悟」支持單個紀錄,多個紀錄和多種語言自由問答,並提供原文位置,用戶可以一鍵跳轉回顧。用戶還可以請「小悟」整理金句、梳理結論、整理會議紀要。

此外,根據用戶需求,「通義聽悟」還上線了一鍵AI改寫以及生成思維導圖的功能。一鍵AI改寫可以將口語化表達的內容在保持原意的基礎上,快速轉化成更具邏輯性、規範性和可讀性的書面格式,尤其適合整理會議和採訪內容。而腦圖則是通過AI以邏輯的方式可視化內容,還可以導出多種格式,方便保存和分享,還能幫助激發用戶靈感,拓展思維。

今次「通義聽悟」新功能發佈,背後是一系列的技術提升。作為AI音視頻產品,「通義聽悟」通過優化複雜多語言理解和多模態檢索、長篇內容建模理解、個性化指令生成和動態意圖檢索增強,提升了精準內容定位、高效問題引導、訂製化摘要與高質量答案回覆等綜合能力,從而提升用戶體驗。

依託「通義千問」大模型,於去年6月升級的「通義聽悟」專注音視頻實時文本轉寫,並能精準、高效地理解和分析多媒體內容,助力個人與企業提升工作和學習效率。「通義聽悟」音頻語言目前支持識別普通話、粵語、英語和日語,翻譯支持中文、英文和日語,韓語預計於4月初上線。支持轉寫單個文檔時長最高達6小時。

「通義聽悟」目前累積服務用戶數量超過百萬,來自各行各業,包括學生、教師、白領、媒體、金融分析師等。活躍用戶日均轉寫音視頻3次以上,平均每天處理字符數約20億字。企業和開發者可以通過「通義聽悟」API集成其AI能力,應用場景包括企業辦公、在線教育、金融服務和新聞媒體等。

「通義聽悟」融合了10多項AI能力,包括轉寫、翻譯、發言人角色分離、全文摘要、章節速覽、發言總結、PPT提取等,並支持標重點、記筆記,大幅提高從音視頻提取知識的效率。

立即訂閱阿里足跡,緊貼阿里巴巴集團最新發展動向,通過新聞故事及專題文章了解創新科技、電子商務及智能物流等新興議題的嶄新趨勢。

通義聽悟 阿里雲