【財(cái)新網(wǎng)】官宣5天的開源周,DeepSeek在第六天“放大招”。3月1日,DeepSeek公布了其V3、R1兩個(gè)模型官方推理服務(wù)的整體系統(tǒng)概覽,和上線后的成本及理論營(yíng)收情況。DeepSeek稱,其提供V3、R1兩個(gè)模型推理服務(wù)的GPU租賃成本約為8.71萬美元/天,而一天理論收入為56.20萬美元,成本利潤(rùn)率為545%。
具體來看,DeepSeek官方的推理服務(wù)采用波峰、波谷定價(jià),白天用戶推理需求較高,DeepSeek用所有的GPU節(jié)點(diǎn)提供推理服務(wù);而夜間推理負(fù)荷低,DeepSeek就減少推理節(jié)點(diǎn),以用于研究和訓(xùn)練。DeepSeek稱,在北京時(shí)間2月27日中午12點(diǎn),至2月28日中午12點(diǎn)的24小時(shí)內(nèi),DeepSeek V3和R1推理服務(wù)占用節(jié)點(diǎn)總和,峰值占用為278個(gè)節(jié)點(diǎn),平均占用226.75個(gè)節(jié)點(diǎn)(每個(gè)節(jié)點(diǎn)為 8 個(gè) H800 GPU),假定 GPU租賃成本為2美元/小時(shí),總成本為87,072美元/天。