【財新網(wǎng)】
馬斯克旗下xAI發(fā)布大模型Grok-1.5
3月29日,埃隆·馬斯克創(chuàng)立的xAI公司發(fā)布新的AI大模型Grok-1.5。Grok-1.5能處理的上下文長度從Grok-1的8192 token提升到12.8萬個token,與GPT-4一樣能夠處理更長、更復(fù)雜的提示詞;在處理編程和數(shù)學(xué)相關(guān)任務(wù)方面,推理能力大幅提升,全面超越Grok-1、Claude 2等大模型,HumanEval基準(zhǔn)測試達(dá)到74.1%,超過GPT-4。另外,Grok-1.5 采用分布式訓(xùn)練架構(gòu),基于JAX、Rust和Kubernetes的訓(xùn)練框架,而不是用通用的Python語言與Pytorch框架。xAI表示,將很快提供Grok-1.5給早期測試人員,在未來幾天內(nèi)將推出幾項(xiàng)新功能。