-->
快手發(fā)布多模態(tài)大模型Keye-VL-1.5 8B性能領(lǐng)先、視頻理解能力更強
近日,快手正式發(fā)布多模態(tài)大語言模型Keye-VL-1.5-8B。
2025-09-11 16:03:07
來源:丁科技網(wǎng)??

近日,快手正式發(fā)布多模態(tài)大語言模型Keye-VL-1.5-8B。與之前的版本相比,Keye-VL-1.5的綜合性能實現(xiàn)顯著提升,尤其在基礎(chǔ)視覺理解能力方面,包括視覺元素識別、推理能力以及對時序信息的理—表現(xiàn)尤為突出。Keye-VL-1.5在同等規(guī)模的模型中表現(xiàn)出色,甚至超越了一些閉源模型如GPT-4o。

創(chuàng)新性提出慢快編碼策略 兼顧性能與成本

為了在短視頻理解任務中同時實現(xiàn)高準確性與高效率。Keye-VL-1.5 創(chuàng)新性地提出了慢快編碼策略 (slow-fast),該策略設置慢通路處理快速變化幀(低幀數(shù)-高分辨率),快通路處理靜態(tài)幀(高幀數(shù)-低分辨率),從而在節(jié)省計算資源的同時保留關(guān)鍵信息。

漸進式四階段預訓練方法 大幅增強視頻理解能力

Keye-VL-1.5采用四階段漸進式訓練流水線,以系統(tǒng)化方式提升模型性能。首先,在視覺編碼器預訓練階段,使用SigLIP-400M權(quán)重初始化ViT,并通過SigLIP對比損失持續(xù)預訓練以適應內(nèi)部數(shù)據(jù)分布。第一階段重點優(yōu)化投影MLP層,實現(xiàn)跨模態(tài)特征的穩(wěn)固對齊;第二階段解凍全部參數(shù)進行端到端多任務預訓練,顯著增強基礎(chǔ)視覺理解能力;第三階段進行退火訓練,利用高質(zhì)量數(shù)據(jù)微調(diào)模型,彌補上一階段中高質(zhì)量樣本接觸不足的問題,同時將序列長度擴展至128K、調(diào)整RoPE逆頻率配置,并引入長視頻、長文本和大尺度圖像等長上下文數(shù)據(jù)。

最終,通過同質(zhì)-異質(zhì)融合技術(shù)對不同數(shù)據(jù)混合比例下的模型權(quán)重進行平均,減少固定數(shù)據(jù)比例帶來的內(nèi)在偏差,在保持多樣化能力的同時提升模型的魯棒性。

構(gòu)建一套完整的后訓練流程 全面提升推理能力與人類偏好對齊

Keye-VL-1.5構(gòu)建了一套系統(tǒng)化的后訓練流程,包含四個核心階段:監(jiān)督微調(diào)與多偏好優(yōu)化、長鏈思維冷啟動、迭代通用強化學習以及對齊強化學習。該流程進一步融合了由快手Keye團隊提出的五步自動化數(shù)據(jù)構(gòu)建流水線,并依托GSPO算法對通用強化學習與對齊階段進行迭代優(yōu)化,顯著增強了模型的推理能力,同時更好地與人類偏好實現(xiàn)對齊。

在多項權(quán)威評測中,Keye-VL-1.5-8B表現(xiàn)突出,在MMMUval、OpenCompass等大型多模態(tài)評測中達到同類規(guī)模最佳成績,在Video-MMMU視頻理解評測中取得66分,展現(xiàn)出領(lǐng)先的視頻語義理解與技術(shù)落地潛力。

此外,Keye-VL-1.5-8B目前已在Hugging Face、GitHub等平臺開源,相關(guān)技術(shù)報告同步發(fā)布,推動多模態(tài)大模型技術(shù)共享與生態(tài)共建。

快手Keye團隊表示,該模型依托快手在短視頻領(lǐng)域的深厚積累,在視頻時序理解、場景推理與指令跟隨等關(guān)鍵能力方面優(yōu)勢顯著。未來,Keye-VL將持續(xù)推進多模態(tài)大模型在視頻語義理解與生成領(lǐng)域的探索與應用。

項目主頁與技術(shù)報告:https://arxiv.org/pdf/2509.01563

Github:https://github.com/Kwai-Keye/Keye

Model:https://huggingface.co/Kwai-Keye/Keye-VL-1.5-8B

最新文章
1
蘋果iOS/iPadOS 26.3 開發(fā)者預覽版 Beta 2 發(fā)布
2
小米 17 Max浮出水面 驍龍 8E5 +8000mAh+3D超聲波
3
Counterpoint:存儲市場陷“超級牛市”,2026年Q1/Q2價格預計續(xù)漲
4
iQOO Z11 Turbo更多配置釋出!2億大底主攝+第五代驍龍8
5
AI巨頭并購“去中國化”,中國為何仍要審查?
6
AI時代終端大變局丨“玩具總動員”照進現(xiàn)實
7
AI+創(chuàng)新技術(shù)驅(qū)動,2026年智能電視行業(yè)競爭加劇
8
蘋果官宣聯(lián)手谷歌升級iPhone AI:馬斯克第一時間發(fā)聲怒批
9
1499元起 vivo Y500i開啟預售:7200mAh電池 6年耐用
10
主打長續(xù)航超耐用!OPPO A6c 新品1月15日見
11
2026年保3000萬臺!1/3都是Mini LED電視,四大品牌強力控盤
12
CES2026大贏家!全新一代海信RGB-Mini LED電視UX狂攬17項國際大獎
13
2026 年家電以舊換新“國補”全國已啟動,僅限6類家電
14
2026空調(diào)價格上行 告別惡性價格戰(zhàn)
15
空調(diào)行業(yè)服務戰(zhàn)邁入 “全生命周期” 時代
16
搶券易、補貼實!新一輪國補能否點燃春節(jié)家電消費熱潮?
17
2025年海信電視出貨量中國第一!三星、索尼等外資品牌長期墊底
18
1000億美元豪賭!美光宣布打造全球最先進的存儲芯片工廠
19
存儲漲價與AI浪潮交織,2026年全球高科技產(chǎn)業(yè)走向何方?
20
美菱凍鮮生·宋雅冰箱首發(fā)亮相 打造新鮮與國風融合新范式
關(guān)于我們

微信掃一掃,加關(guān)注

商務合作
  • QQ:61149512