【財新網(wǎng)】開源大模型的推手Meta發(fā)新一代模型。北京時間4月19日凌晨,美國社交巨頭Meta(NASDAQ: META)宣布推出Llama 3開源模型系列,將陸續(xù)登陸亞馬遜AWS、Databricks、谷歌云、Hugging Face等大模型平臺。Meta稱,還會在接下來數(shù)月的時間提供更強的長文本能力、多種尺寸、多語言的模型,目標是打造最好的基座模型。
具體來看,此次發(fā)布的包括80億、700億參數(shù)的兩個預訓練語言模型,根據(jù)Meta的數(shù)據(jù),在考察常識能力、學科知識、代碼能力、數(shù)學能力的數(shù)據(jù)集榜單中,80億參數(shù)的版本全面領先谷歌的輕量開源模型Gemma 7B–it,和歐洲大模型公司Mistral的開源模型Mistral 7B Instruct;700億參數(shù)版本的整體得分小幅領先谷歌閉源模型Gemini Pro 1.5和Anthropic的閉源模型Claude 3 Sonnect。