-->
DeepSeek發(fā)布兩款新模型,推理能力比肩GPT-5
目前,DeepSeek官方網(wǎng)頁端、App和API均已更新為正式版DeepSeek-V3.2。Speciale版本目前僅以臨時API服務形式開放,以供社區(qū)評測與研究。
2025-12-04 08:40:43
來源:中國電子報、電子信息產(chǎn)業(yè)網(wǎng) 陳存??

12月1日,DeepSeek正式發(fā)布兩款新模型——DeepSeek-V3.2與DeepSeek-V3.2-Speciale,在多項智能體評測中均達到當前開源模型的最高水平,大幅縮小了開源模型與閉源模型的差距。

DeepSeek稱,標準版DeepSeek-V3.2適合日常使用,例如問答和通用智能體任務場景。在公開的推理類基準測試中,其性能已達到GPT-5水平,僅略低于Gemini-3.0-Pro,同時輸出長度顯著縮短,降低了計算開銷與用戶等待時間。

值得注意的是,V3.2并沒有針對這些測試集的工具進行特殊訓練,這意味著V3.2在真實應用場景中能夠展現(xiàn)出較強的泛化性。

不同于過往版本在思考模式下無法調(diào)用工具的局限,DeepSeek-V3.2還是首個將思考融入工具使用的模型,同時支持思考模式與非思考模式的工具調(diào)用。

長思考增強版DeepSeek-V3.2-Speciale進一步結(jié)合了DeepSeek-Math-V2的定理證明能力,具備指令跟隨、數(shù)學證明與邏輯驗證能力,在主流推理基準測試中的表現(xiàn)可媲美Gemini-3.0-Pro。

據(jù)悉,該模型還成功斬獲IMO 2025(國際數(shù)學奧林匹克)、CMO 2025(中國數(shù)學奧林匹克)、ICPC World Finals 2025(國際大學生程序設(shè)計競賽全球總決賽)及IOI 2025(國際信息學奧林匹克)金牌。其中,ICPC與IOI成績分別達到了人類選手第二名與第十名的水平。

目前,DeepSeek官方網(wǎng)頁端、App和API均已更新為正式版DeepSeek-V3.2。Speciale版本目前僅以臨時API服務形式開放,以供社區(qū)評測與研究。

最新文章
1
CES 2026,TCL 聯(lián)合德國萊茵TüV共同發(fā)布顯示產(chǎn)品感知立體色域白皮書,推動色彩評價標準再升級
2
動力電池將迎來“數(shù)字身份證”,新能源車廢舊動力電池回收利用新規(guī)來了
3
展望2026丨半導體產(chǎn)業(yè)十大看點
4
電視消費趨勢觀察:百寸大屏加速滲透,游戲電視引領(lǐng)場景
5
2026年空調(diào)行業(yè)的四大看點
6
2026年,中國家電零售市場的“內(nèi)需答卷”如何寫就?
7
繼京東之后 美團也殺入賣車賽道 切入新模式大不同
8
紅魔11 Air搭載驍龍8至尊版+自研雙芯 手機也能玩PC大作
9
榮耀Magic8保時捷版獨占24G至尊版內(nèi)存:行業(yè)唯一 無敵了
10
全球唯一!海信電視工廠摘得制造業(yè)“奧斯卡”——全球首座電視行業(yè)“燈塔工廠”誕生!
11
方太智慧廚房專家戰(zhàn)略持續(xù)深化 “智慧廚房新物種”重磅來襲
12
2025年電動兩輪車市場“前高后低”,雅迪份額第一,誰領(lǐng)增長?
13
MediaTek發(fā)布天璣9500s和天璣8500,為旗艦細分市場注入新動力
14
“國補”東風息止,凈水行業(yè)承壓但已筑牢根基
15
2025全球智能手機出貨量增2% 蘋果20%份額登頂領(lǐng)跑市場
16
紅魔11Air官宣:搭載悟空屏,極窄邊框與電競黑科技強勢來襲
17
天璣 9500e加持,小米 REDMI Turbo 5 Pro跑分曝光!
18
1月面板市場價格穩(wěn)定,2026年電視面板增長重心轉(zhuǎn)向大尺寸
19
如何應對貿(mào)易戰(zhàn)?看這三家吸塵器出口企業(yè)的“非標準化”答案
20
蘋果全新MacBook Pro將在本月上架:首發(fā)M5 Max芯片
關(guān)于我們

微信掃一掃,加關(guān)注

商務合作
  • QQ:61149512