- 相關(guān)報(bào)道
- 【財(cái)新周刊】財(cái)新周刊|特斯拉迎來(lái)“ChatGPT時(shí)刻”?
- 【財(cái)新周刊】財(cái)新周刊|ChatGPT倒逼教育
- 阿里發(fā)布新一代開(kāi)源模型Qwen3 部署門(mén)檻大幅降低
- 微信集成騰訊元寶AI功能 可解析公眾號(hào)文章和圖文
- GPT周報(bào)|OpenAI有意收購(gòu)谷歌Chrome瀏覽器;百度發(fā)布文心大模型4.5 Turbo;智譜大模型降價(jià)
- GPT周報(bào)|何立峰會(huì)見(jiàn)英偉達(dá)創(chuàng)始人黃仁勛;OpenAI更新大模型;字節(jié)跳動(dòng)發(fā)布首款推理模型
【財(cái)新網(wǎng)】
小米首個(gè)推理大模型開(kāi)源
4月30日,小米開(kāi)源首個(gè)推理大模型“Xiaomi MiMo”,由預(yù)訓(xùn)練和后訓(xùn)練階段中數(shù)據(jù)和算法等多層面的創(chuàng)新聯(lián)合驅(qū)動(dòng)提升推理能力,小米方面介紹,在數(shù)學(xué)推理(AIME 24-25)和 代碼競(jìng)賽(LiveCodeBench v5)公開(kāi)測(cè)評(píng)集上,MiMo 用 7B 的參數(shù)規(guī)模,超越了 OpenAI 的閉源推理模型 o1-mini 和阿里 Qwen 更大規(guī)模的開(kāi)源推理模型 QwQ-32B-Preview。
4月29日,騰訊宣布成立大語(yǔ)言模型部和多模態(tài)模型部,分別負(fù)責(zé)大語(yǔ)言模型和多模態(tài)模型的前沿技術(shù)研發(fā),同時(shí)騰訊大模型團(tuán)隊(duì)原有的數(shù)據(jù)平臺(tái)部將專注于大模型數(shù)據(jù)的建設(shè),原有的機(jī)器學(xué)習(xí)平臺(tái)部聚焦機(jī)器學(xué)習(xí)和大數(shù)據(jù)融合平臺(tái)建設(shè),這兩個(gè)部門(mén)為AI模型的訓(xùn)練、推理提供底座。騰訊向財(cái)新稱,此次調(diào)整有利于整合資源,優(yōu)化研發(fā)流程,提升騰訊在AI領(lǐng)域的長(zhǎng)期技術(shù)作戰(zhàn)能力。