【財(cái)新網(wǎng)】繼4月發(fā)布對(duì)標(biāo)ChatGPT的大模型“通義千問(wèn)”之后,阿里再次發(fā)布融合大模型能力的新產(chǎn)品。6月1日,阿里云在廣州舉辦峰會(huì),宣布聚焦音視頻內(nèi)容的“通義聽(tīng)悟”正式上線,并對(duì)外開(kāi)放公測(cè)。
阿里稱,該產(chǎn)品有兩大功能,一是通過(guò)語(yǔ)音識(shí)別模型,對(duì)音頻進(jìn)行速記轉(zhuǎn)寫(xiě),方便檢索,二是通過(guò)接入通義千問(wèn)大模型的理解與摘要能力,可以整理轉(zhuǎn)寫(xiě)的內(nèi)容,快速總結(jié)全文及每個(gè)發(fā)言人觀點(diǎn),整理關(guān)注重點(diǎn)和待辦事項(xiàng)。阿里云CTO(首席技術(shù)官)周靖人稱,這款產(chǎn)品瞄準(zhǔn)的是音視頻內(nèi)容場(chǎng)景,比如開(kāi)會(huì)、上課、訪談、培訓(xùn)、面試、看視頻、聽(tīng)播客等。