【財新網(wǎng)】阿里開源大模型再迭代。6月7日,阿里云在開源社區(qū)上線了Qwen2系列模型,包含5億、15億、70億、570億、720億,五個參數(shù)版本的模型,其中Qwen2-72B模型在多個測評榜單的成績超過了Meta 4月發(fā)布的Llama3-70B模型,Qwen2-57B則為阿里云第二款混合專家模型(MoE),MoE架構(gòu)在相同算力資源下性能更強(qiáng),被認(rèn)為是大模型技術(shù)趨勢。
阿里云提供的數(shù)據(jù)顯示,在考察常識能力、邏輯推理、數(shù)學(xué)能力的多個測評榜單中,Llama3-70B、法國大模型公司Mistral AI旗下的Mixtral-8x22B、阿里云2月發(fā)布的Qwen1.5-110B此前位于第一梯隊,榜單得分各有勝負(fù),此次發(fā)布的Qwen2-72B得分則全面領(lǐng)先上述三款模型。