【財新網(wǎng)】百度不希望在基座模型的競爭中落后。3月15日,百度正式發(fā)布新一代預(yù)訓(xùn)練模型“文心大模型4.5”和首個推理模型X1,百度稱前者在多項測試中表現(xiàn)優(yōu)于OpenAI在2月發(fā)布的GPT-4.5,而API調(diào)用價格是GPT-4.5的1%;后者性能對標(biāo)DeepSeek-R1,API調(diào)用價格為R1的一半。
OpenAI在2024年9月推出o1模型前,GPT-3.5、GPT-4等模型都是預(yù)訓(xùn)練模型,即主要的計算都發(fā)生在模型的預(yù)訓(xùn)練過程中,而o1通過在后訓(xùn)練的階段采用強化學(xué)習(xí)、思維鏈技術(shù)能力增強,能更精準(zhǔn)地拆解用戶意圖,并執(zhí)行復(fù)雜的邏輯推理任務(wù),這一能力也通常被稱為“深度思考”或“慢思考”,類似于o1的模型也被稱為推理模型。