-->
DeepSeek發(fā)布兩款新模型,推理能力比肩GPT-5
目前,DeepSeek官方網(wǎng)頁端、App和API均已更新為正式版DeepSeek-V3.2。Speciale版本目前僅以臨時API服務(wù)形式開放,以供社區(qū)評測與研究。
2025-12-04 08:40:43
來源:中國電子報、電子信息產(chǎn)業(yè)網(wǎng) 陳存??

12月1日,DeepSeek正式發(fā)布兩款新模型——DeepSeek-V3.2與DeepSeek-V3.2-Speciale,在多項智能體評測中均達到當(dāng)前開源模型的最高水平,大幅縮小了開源模型與閉源模型的差距。

DeepSeek稱,標(biāo)準(zhǔn)版DeepSeek-V3.2適合日常使用,例如問答和通用智能體任務(wù)場景。在公開的推理類基準(zhǔn)測試中,其性能已達到GPT-5水平,僅略低于Gemini-3.0-Pro,同時輸出長度顯著縮短,降低了計算開銷與用戶等待時間。

值得注意的是,V3.2并沒有針對這些測試集的工具進行特殊訓(xùn)練,這意味著V3.2在真實應(yīng)用場景中能夠展現(xiàn)出較強的泛化性。

不同于過往版本在思考模式下無法調(diào)用工具的局限,DeepSeek-V3.2還是首個將思考融入工具使用的模型,同時支持思考模式與非思考模式的工具調(diào)用。

長思考增強版DeepSeek-V3.2-Speciale進一步結(jié)合了DeepSeek-Math-V2的定理證明能力,具備指令跟隨、數(shù)學(xué)證明與邏輯驗證能力,在主流推理基準(zhǔn)測試中的表現(xiàn)可媲美Gemini-3.0-Pro。

據(jù)悉,該模型還成功斬獲IMO 2025(國際數(shù)學(xué)奧林匹克)、CMO 2025(中國數(shù)學(xué)奧林匹克)、ICPC World Finals 2025(國際大學(xué)生程序設(shè)計競賽全球總決賽)及IOI 2025(國際信息學(xué)奧林匹克)金牌。其中,ICPC與IOI成績分別達到了人類選手第二名與第十名的水平。

目前,DeepSeek官方網(wǎng)頁端、App和API均已更新為正式版DeepSeek-V3.2。Speciale版本目前僅以臨時API服務(wù)形式開放,以供社區(qū)評測與研究。

最新文章
1
開年炸場,最頂?shù)碾娨晛砹?!時代旗艦海信UX2026款定檔3月5日
2
集成灶:短期內(nèi)脫困不現(xiàn)實,企業(yè)正放下執(zhí)念積極自救
3
無邊界的連接與去中心化網(wǎng)絡(luò):星鏈重塑全球通信規(guī)則的野心與挑戰(zhàn)
4
2026年1月中國電視市場整機出貨量391萬臺,同比下降11.5%
5
松下電視加速撤退
6
入主格力6年高瓴首次減持:透露了什么端倪?
7
硬件級防窺時代到來 三星Galaxy S26 Ultra“隱私屏幕”解析
8
傳音預(yù)熱超薄模塊化智能手機,將亮相MWC 2026
9
MWC 2026在即,高通解鎖6G與AI深度融合的技術(shù)密碼!
10
魅族天貓旗艦店所有手機都下架了:一個時代終結(jié) 機圈再無小而美
11
2025營收突破400億,惠科即將IPO上會,LCD面板三強之爭再添變數(shù)?
12
打破流量壁壘,快手生活服務(wù)推出「全域流量」新模式快手內(nèi)部文檔請勿外傳
13
快手3月上新季發(fā)布商達政策 全域資源助推商家煥新好生意
14
快手磁力金牛大促投放指南來襲,助力商家高效破局
15
全球統(tǒng)一6G標(biāo)準(zhǔn)迎來關(guān)鍵進展
16
春節(jié)AI大戰(zhàn)落幕,45億砸出了什么?
17
TCL聯(lián)手索尼,創(chuàng)維聯(lián)手松下,中國電視品牌全球布局提速
18
歐睿數(shù)據(jù)出爐,中國家電規(guī)模坐標(biāo)再抬升
19
2026年以舊換新開局向好,1月全國家電以舊換新681.3萬臺
20
vivo X300 Ultra最新消息!或?qū)⑿略?00mm定焦增距鏡頭
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512