【財新網(wǎng)】繼4月發(fā)布對標ChatGPT的大模型“通義千問”之后,阿里再次發(fā)布融合大模型能力的新產品。6月1日,阿里云在廣州舉辦峰會,宣布聚焦音視頻內容的“通義聽悟”正式上線,并對外開放公測。
阿里稱,該產品有兩大功能,一是通過語音識別模型,對音頻進行速記轉寫,方便檢索,二是通過接入通義千問大模型的理解與摘要能力,可以整理轉寫的內容,快速總結全文及每個發(fā)言人觀點,整理關注重點和待辦事項。阿里云CTO(首席技術官)周靖人稱,這款產品瞄準的是音視頻內容場景,比如開會、上課、訪談、培訓、面試、看視頻、聽播客等。