-->
BAT卷價格,云卷大模型
為何?進(jìn)入2024年以來,大模型競爭主要集中于場景化應(yīng)用,比如月之暗面的長文本,再比如網(wǎng)絡(luò)運(yùn)維領(lǐng)域的GPT產(chǎn)品等。
2024-05-27 09:43:16
來源:天極網(wǎng)??

【天極網(wǎng)企業(yè)頻道】這兩年的阿里云表現(xiàn)頗為躁動:先是在政務(wù)云市場“失利”之后,為鞏固企業(yè)市場,選擇一輪又一輪的云降價;后是在“百模大戰(zhàn)”,大模型廠商各顯神通的背景下,又一次選擇降價策略,掀起新一輪大模型降價潮:

5月21日,阿里云宣布,通義千問GPT-4級主力模型Qwen-Long的API輸入價格降至0.0005元/千Tokens,直降97%。

緊接著,百度發(fā)文稱,文心大模型兩款主力模型ENIRE?Speed和ENIRE?Lite全面免費(fèi)。阿里稱,大幅降低大模型推理價格,就是希望加速AI應(yīng)用的爆發(fā)。?

大模型進(jìn)入普惠時代?

雖然,阿里云將大模型降價推向高潮,但并不是大模型降價的“首創(chuàng)”。

5月13日,OpenAI舉行新品發(fā)布會,并帶來一款名為GPT-4o的人工智能模型。OpenAI表示,GPT-4o在多模態(tài)方面能力強(qiáng)大,且用戶可以免費(fèi)使用。哪怕大模型再燒錢,OpenAI也很執(zhí)著于降價。?

同樣不在乎錢的還有火山引擎,其推出的豆包大模型,大幅低于行業(yè)價格。據(jù)悉,豆包通用模型pro-32k的推理輸入價格為0.0008元/千Tokens。按當(dāng)時來講,比行業(yè)便宜99.3%。這波大模型降價潮,將席卷哪些廠商尚未可知,可以肯定的是,云大廠將無一幸免。?

為何?進(jìn)入2024年以來,大模型競爭主要集中于場景化應(yīng)用,比如月之暗面的長文本,再比如網(wǎng)絡(luò)運(yùn)維領(lǐng)域的GPT產(chǎn)品等。

大模型廠商在各自賽道跑馬圈地,殊不知當(dāng)以阿里云、百度智能云、火山引擎為代表的大模型布局場景接近尾聲之時,最有效的競爭策略便是“降價”。

在此背景下,百模大戰(zhàn)格局將面臨全新洗牌,市場不再需要如此之多的玩家,這一點(diǎn)像極了滴滴與優(yōu)步的競爭策略,通過燒錢入場,進(jìn)而收獲市場。

而這一輪的重新洗牌之后,對于用戶或企業(yè)而言,最大的好處在于,大模型也正在進(jìn)入普惠時代,用戶開始低價享受技術(shù)帶來的革新。

大模型為何能降價?

一個非常有意思的事情是,當(dāng)大家還在“糾結(jié)”于大模型訓(xùn)練與推理燒錢的時候,大模型已經(jīng)開始降價了。

相關(guān)數(shù)據(jù)顯示,飛槳平臺在萬卡集群訓(xùn)練出來的文心大模型4.0版本,推理成本預(yù)計是文心大模型3.5版本的8至10倍。其燒錢程度可見一斑。?

事實(shí)上,將大模型交付用戶使用之后,如果沒有大版本更新,那么主要消耗的是推理成本。有觀點(diǎn)認(rèn)為決定大模型推理成本的有三個因素:大模型的網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)規(guī)模;大模型的推理部署,比如并行推理、量化、部署方式等;芯片和集群等硬件也將影響大模型的推理成本。

所以,只要參數(shù)規(guī)模小、大模型推理部署簡單,以及硬件成本低,大模型降價并不是全無可能。與此同時,頭部通用大模型廠商正在積極地開展“成本瘦身”運(yùn)動:

微軟新公布的GPT-3支持的AI超級計算機(jī)在AI模型訓(xùn)練效率上實(shí)現(xiàn)了顯著突破,相較其他平臺,其訓(xùn)練效率提升了高達(dá)16倍。這一顯著地提升不僅大幅減少了時間成本,還有效降低了潛在的風(fēng)險成本,使得AI模型的研發(fā)和應(yīng)用變得更加高效和可行。?

盤古大模型在其2.0版本中,已經(jīng)前瞻性地采用了稀疏+稠密的創(chuàng)新架構(gòu),旨在降低模型的訓(xùn)練成本。這種架構(gòu)通過優(yōu)化計算資源的使用,提高了訓(xùn)練過程的效率,為AI模型的開發(fā)和應(yīng)用提供了更為經(jīng)濟(jì)且高效的解決方案。

而文心一言在推出僅一個月后,通過技術(shù)革新,成功將其大模型的推理性能提升了近10倍。這一卓越的性能提升不僅帶來了更快速的推理速度,還顯著降低了推理成本,僅為原來的十分之一。?

賽迪顧問人工智能與大數(shù)據(jù)研究中心常務(wù)副總經(jīng)理鄒德寶解釋道,價格的差異首先源于各家大模型在技術(shù)實(shí)力、應(yīng)用場景和訓(xùn)練成本等方面的不同。技術(shù)領(lǐng)先、功能強(qiáng)大的模型往往定價較高,而功能相對簡單或訓(xùn)練成本較低的模型則定價較低。

此外,市場競爭的激烈程度也是影響定價的重要因素。為了吸引更多客戶,一些模型廠商選擇降價策略,從而在市場中占據(jù)更有利的位置。

大廠賠錢搶市場,小廠路在何方?

在競爭日趨白熱化的大模型市場中,大廠憑借其雄厚的資本、深厚的技術(shù)積累以及規(guī)?;?jīng)營的優(yōu)勢,占據(jù)了主導(dǎo)地位。

火山引擎總裁譚待在訪談中明確指出,降低成本是推動大模型迅速進(jìn)入“價值創(chuàng)造階段”的核心動力,并且大規(guī)模地使用不僅能夠優(yōu)化模型,還能顯著減少模型推理的單位成本。?

當(dāng)前,大廠為搶占市場份額不惜以賠錢的代價進(jìn)行競爭,這無疑給小規(guī)模模型提供商帶來了巨大的生存壓力。

據(jù)統(tǒng)計,截至2024年4月底,大模型相關(guān)項(xiàng)目的中標(biāo)公告已累計近200個,遠(yuǎn)超過2023年的總數(shù)。面對大廠的強(qiáng)勢擠壓,初創(chuàng)企業(yè)的生存空間被嚴(yán)重壓縮。

價格戰(zhàn)雖然能在短期內(nèi)帶來市場份額的擴(kuò)張,但長期來看,它可能壓縮企業(yè)的利潤空間,影響行業(yè)的健康發(fā)展。

對于實(shí)力雄厚的大企業(yè)來說,價格戰(zhàn)是鞏固市場地位、實(shí)現(xiàn)規(guī)模效益的機(jī)遇;然而,對于規(guī)模較小、實(shí)力較弱的模型提供商而言,它們面臨的生存壓力將日益加劇。

寫在最后

原以為在大模型部署的前期階段,廠商還是集中于探索場景化應(yīng)用于技術(shù)突破,價格戰(zhàn)將是后期采用的策略。

然而,在OpenAI、字節(jié)跳動、阿里云、百度云的加碼下,大模型也迎來新一輪降價。?

在如此激烈的競爭中,中小大模型企業(yè)需要尋找自己的發(fā)展道路。在數(shù)據(jù)、算法、算力等方面均不如頭部企業(yè)的情況下,差異化發(fā)展成為了關(guān)鍵。

它們可以選擇深耕某一細(xì)分領(lǐng)域的行業(yè)大模型,或者加速應(yīng)用的落地,通過獨(dú)特的價值和創(chuàng)新能力,為自己贏得一席之地。這些都是中小大模型企業(yè)當(dāng)前迫切需要解決的問題。

最新文章
1
中國代工企業(yè)或無緣美國最大規(guī)模退稅,海爾為何受益?
2
快手電商舉辦618商家大會 千億流量扶持優(yōu)質(zhì)供給
3
全球南方成為出海熱土,AI視頻生成技術(shù)正為全球視聽產(chǎn)業(yè)注入新動能
4
"贏戰(zhàn)2026"快手電商超級雙選會啟動,超千位商家達(dá)人齊聚杭州
5
快手15位主播獲得中國演出行業(yè)協(xié)會優(yōu)質(zhì)主播稱號
6
寶石Gem、李斯丹妮嘗試簪花造型,快手聯(lián)合美團(tuán)將春日會員營銷玩出“花”
7
2026 北京車展 | 奕斯偉計算攜車載芯片方案亮相 自研RISC-V內(nèi)核構(gòu)筑車規(guī)級安全底座
8
對話陳靖可:有了海信冰箱這臺“制冰神機(jī)”,深夜看世界杯終于有了最佳“搭子”
9
進(jìn)化·跨界·出?!?026中國Ai機(jī)器人產(chǎn)業(yè)領(lǐng)袖峰會暨第六屆清潔電器產(chǎn)業(yè)升級與評測峰會圓滿落幕
10
政策東風(fēng)與情緒需求共振,熱水器行業(yè)如何借勢破局?
11
超級直播神器登場!華為隨行WiFi X戶外直播從此告別卡頓
12
直指電競旗艦定位,一加 Ace 6 至尊版官宣搭載165Hz高刷屏
13
智能體:重塑ICT產(chǎn)業(yè)生態(tài)
14
2026年第一季度面板出貨同比下降2.7%,超大尺寸增長明顯
15
日立本土白電業(yè)務(wù)將易主 日本家電巨頭集體“轉(zhuǎn)向”
16
中國顯示器線上銷量排名出爐:AOC奪冠 HKC、小米進(jìn)前三
17
OpenAI正式發(fā)布GPT-5.5:運(yùn)算速度更快 Token成本大降
18
空調(diào)鋁強(qiáng)化研究工作組發(fā)“說明”,釋出三個信號
19
CCBN2026觀察:GPMI電視已近百萬,中國“超級接口”加速擴(kuò)張
20
5月空調(diào)內(nèi)銷再降8.6%,冰封之下如何破局?
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512