【財(cái)新網(wǎng)】繼4月發(fā)布對標(biāo)ChatGPT的大模型“通義千問”之后,阿里再次發(fā)布融合大模型能力的新產(chǎn)品。6月1日,阿里云在廣州舉辦峰會(huì),宣布聚焦音視頻內(nèi)容的“通義聽悟”正式上線,并對外開放公測。
阿里稱,該產(chǎn)品有兩大功能,一是通過語音識(shí)別模型,對音頻進(jìn)行速記轉(zhuǎn)寫,方便檢索,二是通過接入通義千問大模型的理解與摘要能力,可以整理轉(zhuǎn)寫的內(nèi)容,快速總結(jié)全文及每個(gè)發(fā)言人觀點(diǎn),整理關(guān)注重點(diǎn)和待辦事項(xiàng)。阿里云CTO(首席技術(shù)官)周靖人稱,這款產(chǎn)品瞄準(zhǔn)的是音視頻內(nèi)容場景,比如開會(huì)、上課、訪談、培訓(xùn)、面試、看視頻、聽播客等。