DeepSeek下的自研大模型如何做?一個字“卷”!
從人類科技發(fā)展歷史看,今天只是AI的第一天。想要總結(jié)deepseek的創(chuàng)新路徑為時甚早,試圖復制deepseek的成功為時更早。
2025-02-17 11:01:35
來源:通信世界全媒體 包建羽??

通信世界網(wǎng)消息(CWW)當前,DeepSeek掀起的“模型熱”還在持續(xù)升溫。

正如通信世界全媒體年初所預測的,2025年大模型乃至智能體將迎來進一步繁榮,行業(yè)大模型將深度融入核心業(yè)務與應用、AI終端以及智能體將加速落地。具體到如何實現(xiàn),DeepSeek仿佛一陣“及時雨”,憑借低成本、高效能以及廣泛的應用場景,為行業(yè)實踐提供了良好的技術(shù)支撐與應用基礎(chǔ)。

可喜之余,對于渴望在未來大模型領(lǐng)域闖出一片天的企業(yè)來說,結(jié)合自身的業(yè)務需求與數(shù)據(jù)特點,在充分發(fā)揮DeepSeek優(yōu)勢之上,“卷”出更具有獨特競爭力的自研大模型乃至智能體,似乎更值得深思。

前期“卷”接入

實現(xiàn)“共進共生”

最直觀來看,目前DeepSeek掀起的“模型熱”主要表現(xiàn)為DeepSeek的“接入熱”。

其中既包括英偉達、亞馬遜以及微軟等國外科技巨頭,也包括極具市場潛力的中國本土企業(yè),從底層的軟硬件設(shè)計研發(fā)企業(yè)到互聯(lián)網(wǎng)大廠、運營商、垂直領(lǐng)域AI公司再到中小型初創(chuàng)企業(yè),選擇DeepSeek似乎已成為當下算力成本飆升與商業(yè)化路徑尚未明晰的必然抉擇。

自DeepSeek開放API以來,其生態(tài)版圖快速擴張。據(jù)不完全統(tǒng)計,目前全球已有超過200家企業(yè)宣布接入DeepSeek。就目前來看,接入方式主要分為三類:一是API直接調(diào)用,即企業(yè)直接調(diào)用DeepSeek的云端API,快速集成其通用能力,如文本生成、代碼編寫等。二是模型微調(diào),即企業(yè)基于DeepSeek基座模型,注入私有數(shù)據(jù)進行領(lǐng)域適配,從而實現(xiàn)自身模型優(yōu)化。三是開源共建,這主要體現(xiàn)在底層架構(gòu)與設(shè)計層面,企業(yè)針對DeepSeek開放的部分模型權(quán)重,借助社區(qū)協(xié)作進行自身優(yōu)化。

總體來看,接入是方式,優(yōu)化是目的。隨著企業(yè)對接入方式的逐漸深入,我們可以發(fā)現(xiàn),企業(yè)自研模型與DeepSeek的接入部署,逐漸呈現(xiàn)出全面化、智能化、差異化的特點,兩者結(jié)合的模式也逐漸呈現(xiàn)“共生進化”特征。

針對功能補充類,調(diào)用API逐漸深入到應用場景接入,例如三大運營商在云能力率先接入的基礎(chǔ)上,已逐漸拓展至to B端、to C端的特色場景與產(chǎn)品服務;多家車企探索將DeepSeek接入智能座艙,實現(xiàn)語音助手功能升級、AI多語義指令識別等。

針對模型部署開發(fā)類,私有化部署與產(chǎn)品成為保障安全的選擇,多家企業(yè)如中國電信、聯(lián)想、新華三、浪潮等均推出了DeepSeek智算一體機,實現(xiàn)一體化開箱即用的私有化部署。與此同時,DeepSeek模型私有化部署服務也涵蓋安裝部署、系統(tǒng)調(diào)優(yōu)和運行維護,可提供適配多種算力的部署包及支持,幫助企業(yè)在自有業(yè)務場景中構(gòu)建安全可靠的智能環(huán)境。

針對技術(shù)融合類,單向的知識蒸餾訓練,即單純接入DeepSeek,可提煉其模型能力至自研模型,降低自身部署成本;多向的模型聯(lián)合訓練,即企業(yè)自研大模型與DeepSeek大模型進行深度聯(lián)合訓練,可以促進聯(lián)合創(chuàng)新,為企業(yè)帶來更廣闊的發(fā)展空間。

中期“卷”經(jīng)驗

挖掘價值站穩(wěn)市場

接入與優(yōu)化滿足當前初步部署應用的需求,但也不可否認,DeepSeek的崛起為自研通用大模型以及行業(yè)大模型帶來了沖擊。

在技術(shù)競爭方面,DeepSeek的低成本訓練模式和高效推理能力是其優(yōu)勢所在,也為自研大模型帶來了新的技術(shù)競爭壓力。就拿DeepSeek V3來說,其訓練成本僅為557.6萬美元,使用 2048 張 H800 GPU 卡,相比同等規(guī)模的模型(如GPT-4、GPT-4o、Llama 3.1),訓練成本大幅降低。這迫使大模型研發(fā)者不得不重新審視技術(shù)路線,加大在降低訓練成本和提升推理效率方面的研發(fā)投入。

在應用場景拓展方面,DeepSeek-R1在科研、數(shù)據(jù)分析、代碼生成等復雜場景表現(xiàn)出色,DeepSeek-V3適合內(nèi)容創(chuàng)作、長文本生成等場景??陀^來看,這兩類大模型已較為廣泛地覆蓋了當下通用大模型的應用場景,行業(yè)開始出現(xiàn)了新的選擇,即對已入局者以及仍觀望者亮出了新挑戰(zhàn)。

在市場格局重塑方面,DeepSeek的開源和低成本特性,吸引了大量合作伙伴,包括云服務廠商、算力企業(yè)等,改變了通用大模型的市場格局。對于行業(yè)大模型來說,強調(diào)其自身價值之前,似乎必須先證明自己模型對行業(yè)專屬數(shù)據(jù)與場景的理解,比直接調(diào)教通用模型懂得更多。

基于此,對于企業(yè)自研大模型來說,想要在市場繼續(xù)站穩(wěn)腳跟,正視挑戰(zhàn)與機遇,揚長避短、提升差異化競爭力迫在眉睫。

面向低成本、低算力部署趨勢,大模型行業(yè)應借鑒經(jīng)驗,與自身結(jié)合的基礎(chǔ)上更傾向于研發(fā)和應用能夠在低成本、低算力條件下運行的技術(shù)和模型,以降低使用門檻、擴大應用范圍。

面向當下訓練需求逐漸轉(zhuǎn)向推理需求,充分挖掘數(shù)據(jù)價值有望使部分企業(yè)脫穎而出。對此,企業(yè)應重視數(shù)據(jù)質(zhì)量的提升,解決數(shù)據(jù)孤島問題,加強數(shù)據(jù)的整合和共享,借助日漸先進的數(shù)據(jù)處理技術(shù)和算法,充分挖掘數(shù)據(jù)的價值,為大模型優(yōu)化提供有力支持。

證明自研大模型存在的必要,企業(yè)仍需挖掘自身的差異化優(yōu)勢,結(jié)合自身所在行業(yè)的特點和資源,找到獨特的應用場景和價值點,實現(xiàn)差異化競爭。例如,猿輔導的猿力大模型在與DeepSeek融合后找準了教育場景下的個性化學習體驗,通過定制化學習方案,并自動調(diào)整學習節(jié)奏,使孩子逐漸找到學習自信。

后期“卷”效用

兼顧效率與商業(yè)化

隨著大模型出現(xiàn)并滲透進日常生活,大模型競爭也進入2.0階段,從長遠來看,大模型已由傳統(tǒng)的技術(shù)競賽轉(zhuǎn)向商業(yè)化效率競爭。

就行業(yè)啟示來看,低成本推理成為剛需。隨著市場競爭的加劇,算力成本曲線已然成為決定市場格局的關(guān)鍵因素。數(shù)據(jù)閉環(huán)能力成為新價值。不同于單純追求數(shù)據(jù)量,當下更為數(shù)據(jù)的內(nèi)容質(zhì)量以及應用質(zhì)量。

從效率角度出發(fā),企業(yè)應全方位提升模型的研發(fā)、訓練與應用效率。首先,在研發(fā)環(huán)節(jié),企業(yè)可以嘗試在算法和架構(gòu)設(shè)計下功夫,同時借助自動化代碼生成工具,減少人工編寫代碼的時間和錯誤。其次,在訓練過程中,合理利用分布式計算技術(shù),優(yōu)化訓練算法值得探索。最后,進入應用階段,注重推理效率提升,借助模型壓縮等先進技術(shù)與經(jīng)驗,提高推理速度。

從商業(yè)化角度出發(fā),企業(yè)應精準定位市場需求,制定合理的商業(yè)模式。一方面,企業(yè)可以針對特定行業(yè)的需求,開發(fā)定制化的大模型解決方案。另一方面,企業(yè)可以將大模型作為基礎(chǔ)平臺,開發(fā)一系列的應用產(chǎn)品和服務。

以運營商為例,憑借其自身龐大的用戶數(shù)據(jù)資源,可以充分發(fā)揮自身的網(wǎng)絡(luò)和服務優(yōu)勢,優(yōu)化迭代一系列to C端的應用產(chǎn)品和服務。例如:基于自然語言處理大模型優(yōu)化智能客服系統(tǒng)、5G新通話應用以及AI智能助手等,并且根據(jù)用戶的使用習慣和歷史數(shù)據(jù),為用戶提供個性化的服務推薦,從而增強用戶黏性,挖掘存量市場。

總而言之,大模型2.0時代已經(jīng)來臨,低成本推理、差異化競爭、數(shù)據(jù)價值挖掘以及產(chǎn)業(yè)鏈定位,構(gòu)成了這個時代大模型企業(yè)發(fā)展的關(guān)鍵拼圖。企業(yè)有待將這些要素緊密結(jié)合,積極調(diào)整戰(zhàn)略,以適應時代的變化,在市場競爭的洪流中穩(wěn)步前行,不斷發(fā)展壯大。

最新文章
1
2025慕尼黑光伏展上,華寶新能新一代家庭綠電系統(tǒng)如何贏得全球矚目?
2
全域出擊,引爆618,磁力金牛618活動玩法來襲,預熱會場即將上線
3
快手電商商家大會達人分論壇探索私域新增量,多種方式加速新達人成長
4
快手本地生活“五一”假期GMV同比增長108%,新線城市消費力爆發(fā)
5
2025年一季度電視銷售額規(guī)模同比增長3.4%,高端品質(zhì)化提速
6
分拆安得智聯(lián)“赴港”,美的在下一盤什么棋?
7
不卷了?美的海信攜手 友商變伙伴!
8
中國客廳最貴智能設(shè)備!閨蜜機銷量大漲超42%
9
國內(nèi)監(jiān)控攝像頭第一季度銷量如何 小米成電商霸主 銷量、銷額雙第一!
10
史無前例!曝折疊屏iPhone首發(fā)三星全新面板:折痕幾乎不可見
11
把家打造成超級玩家基地!Vidda貼貼壁紙電視和C3系列投影發(fā)布
12
100英寸電視銷量暴增150%,成為電視行驅(qū)動換新的主力軍
13
realme概念機搭載10000毫安時電池,充電寶可能要退役了?!
14
內(nèi)銷承壓之下,小家電企業(yè)押注出海能翻盤嗎?
15
技術(shù)、國補雙軌并行,智能馬桶行業(yè)迎來結(jié)構(gòu)性增長黃金期
16
蘋果高管:10年后你可能不需要iPhone了
17
聯(lián)想moto razr 60 Ultra國行今天發(fā)布:首款驍龍8至尊版小折疊
18
全球最薄驍龍8至尊版旗艦!三星Galaxy S25 Edge官宣
19
快手電商在鄭州舉辦新商培訓會,助力服裝檔口商家開拓新渠道
20
快手電商上線618蓄水期開播助推政策,助力商家達人在五一假期收獲經(jīng)營增長
關(guān)于我們

微信掃一掃,加關(guān)注

商務合作
  • QQ:61149512