12月1日,DeepSeek正式發(fā)布兩款新模型——DeepSeek-V3.2與DeepSeek-V3.2-Speciale,在多項(xiàng)智能體評(píng)測(cè)中均達(dá)到當(dāng)前開源模型的最高水平,大幅縮小了開源模型與閉源模型的差距。
DeepSeek稱,標(biāo)準(zhǔn)版DeepSeek-V3.2適合日常使用,例如問答和通用智能體任務(wù)場(chǎng)景。在公開的推理類基準(zhǔn)測(cè)試中,其性能已達(dá)到GPT-5水平,僅略低于Gemini-3.0-Pro,同時(shí)輸出長(zhǎng)度顯著縮短,降低了計(jì)算開銷與用戶等待時(shí)間。
值得注意的是,V3.2并沒有針對(duì)這些測(cè)試集的工具進(jìn)行特殊訓(xùn)練,這意味著V3.2在真實(shí)應(yīng)用場(chǎng)景中能夠展現(xiàn)出較強(qiáng)的泛化性。
不同于過往版本在思考模式下無法調(diào)用工具的局限,DeepSeek-V3.2還是首個(gè)將思考融入工具使用的模型,同時(shí)支持思考模式與非思考模式的工具調(diào)用。
長(zhǎng)思考增強(qiáng)版DeepSeek-V3.2-Speciale進(jìn)一步結(jié)合了DeepSeek-Math-V2的定理證明能力,具備指令跟隨、數(shù)學(xué)證明與邏輯驗(yàn)證能力,在主流推理基準(zhǔn)測(cè)試中的表現(xiàn)可媲美Gemini-3.0-Pro。
據(jù)悉,該模型還成功斬獲IMO 2025(國(guó)際數(shù)學(xué)奧林匹克)、CMO 2025(中國(guó)數(shù)學(xué)奧林匹克)、ICPC World Finals 2025(國(guó)際大學(xué)生程序設(shè)計(jì)競(jìng)賽全球總決賽)及IOI 2025(國(guó)際信息學(xué)奧林匹克)金牌。其中,ICPC與IOI成績(jī)分別達(dá)到了人類選手第二名與第十名的水平。
目前,DeepSeek官方網(wǎng)頁(yè)端、App和API均已更新為正式版DeepSeek-V3.2。Speciale版本目前僅以臨時(shí)API服務(wù)形式開放,以供社區(qū)評(píng)測(cè)與研究。
- QQ:61149512
