- 相關(guān)報(bào)道
- 【財(cái)新周刊】封面報(bào)道|DeepSeek爆火 撼動(dòng)AI投資和算力競(jìng)爭(zhēng)底層邏輯
- 【財(cái)新周刊】封面報(bào)道|誰能接住DeepSeek潑天流量?互聯(lián)網(wǎng)算力、應(yīng)用、服務(wù)新一輪激戰(zhàn)
- Meta承認(rèn)內(nèi)容審查過度 將借鑒X“社區(qū)筆記”機(jī)制
- GPT周報(bào)|Meta發(fā)布新開源模型和頭顯設(shè)備等;百度升級(jí)千帆大模型;字節(jié)跳動(dòng)發(fā)布豆包視頻生成大模型
- DeepSeek效應(yīng)幾何 量化基金何成中國(guó)AI大模型孵化器
- 大模型時(shí)代來臨,能直接用DeepSeek看病嗎?
- 英偉達(dá)多款新品劍指AI推理時(shí)代 黃仁勛盛贊DeepSeek帶來應(yīng)用潮
【財(cái)新網(wǎng)】Llama系列開源大模型再升級(jí),但具體表現(xiàn)受質(zhì)疑。自發(fā)布Llama3系列開源模型后,F(xiàn)acebook的母公司Meta在當(dāng)?shù)貢r(shí)間4月5日發(fā)布第一批Llama 4系列模型,包括大中小三個(gè)模型,首次使用了DeepSeek也在使用的混合專家架構(gòu)(MoE)。
本次發(fā)布的模型為Scout(偵察兵)、Maverick(獨(dú)行俠)和Behemoth(巨獸)。Llama 4 Scout擁有170億活躍參數(shù)和16個(gè)專家,為多模態(tài)模型,總參數(shù)為1090億。Meta稱其性能超過了所有前幾代的Llama模型,并且能夠在一塊NVIDIA H100 GPU上運(yùn)行。此外,Llama 4 Scout提供了1000萬上下文窗口,Meta稱,在眾多廣泛報(bào)告的基準(zhǔn)測(cè)試中,Llama 4 Scout表現(xiàn)優(yōu)于Gemma 3、Gemini 2.0 Flash-Lite和Mistral 3.1。