【財新網】年初DeepSeek模型出圈讓大模型創(chuàng)業(yè)公司重回技術競賽。7月11日晚間,大模型創(chuàng)業(yè)公司月之暗面發(fā)布了首個開源的基座大模型Kimi K2,對標DeepSeek-V3、OpenAI的GPT-4.1等模型。截至發(fā)稿時,該模型已經是全球最大的AI開源社區(qū)HuggingFace熱度第一的模型,發(fā)布三天就已經獲得1.93萬次下載,為近期熱度最高的開源基座模型。
該模型也在海外技術圈內引發(fā)了討論,例如大模型訓練、推理服務商Together AI的首席科學家Tri Dao就在社交媒體上稱其試用該模型的體驗已經與業(yè)內最前沿的模型相當。多模態(tài)模型公司Stability AI的創(chuàng)始人Emad Mostaque也發(fā)文指出,Kimi K2訓練所需的算力已經與DeepSeek相當,這證明了模型能力并不只能通過增加算力提升。