-->
亞馬遜云科技成功助力TII訓(xùn)練400億參數(shù)規(guī)模的大語言模型Falcon 40B
6月7日,亞馬遜云科技宣布,位于阿聯(lián)酋首都阿布扎比的全球領(lǐng)先科研中心TII(Technology Innovation Institute)在亞馬遜云科技上訓(xùn)練了其性能卓越的開源模型Falcon 40B。Falcon 40B是擁有400 億參數(shù)的大語言模型(LLM),在Apache 2.0許可下提供,并在Hugging Face的開源大語言模型排行榜上位列榜首。該排行榜在多個基準測試中跟蹤、排名和
2023-06-08 10:15:49
來源:丁科技網(wǎng)??

6月7日,亞馬遜云科技宣布,位于阿聯(lián)酋首都阿布扎比的全球領(lǐng)先科研中心TII(Technology Innovation Institute)在亞馬遜云科技上訓(xùn)練了其性能卓越的開源模型Falcon 40B。Falcon 40B是擁有400 億參數(shù)的大語言模型(LLM),在Apache 2.0許可下提供,并在Hugging Face的開源大語言模型排行榜上位列榜首。該排行榜在多個基準測試中跟蹤、排名和評估大語言模型,最終評選出最佳模型。客戶現(xiàn)在可以將Falcon 40B部署在Amazon SageMaker JumpStart上,這是一個機器學(xué)習中心,提供預(yù)訓(xùn)練模型,使客戶無需從頭構(gòu)建自己的模型即可獲得Falcon 40B最先進的準確性和行業(yè)領(lǐng)先的性能。要開始使用Amazon SageMaker JumpStart,請訪問aws.amazon.com/sagemaker/jumpstart。

大語言模型是機器學(xué)習(ML)模型的一個分支,專注于語言領(lǐng)域,可以支持各類生成式AI應(yīng)用,包括文本處理、總結(jié)摘要和會話問答。雖然這些大語言模型具有改變行業(yè)的潛力,但構(gòu)建、訓(xùn)練和部署大語言模型可能需要數(shù)周甚至數(shù)月的時間,并耗資數(shù)千萬美元,這將許多公司拒之門外。為了在整個開發(fā)過程中實現(xiàn)更好的性能和成本效益,包括Stability AI、AI21 Labs、Hugging Face和LG AI在內(nèi)的眾多客戶使用亞馬遜云科技端到端的機器學(xué)習服務(wù)Amazon SageMaker來構(gòu)建、訓(xùn)練和部署他們的大語言模型。

這也正是TII使用Amazon SageMaker構(gòu)建其Falcon 40B模型的原因。得益于SageMaker是一項完全托管的服務(wù),TII可以專注于開發(fā)自定義的訓(xùn)練機制和優(yōu)化功能,而無需管理其機器學(xué)習基礎(chǔ)設(shè)施。為了最大限度地降低訓(xùn)練成本并縮短上市時間,TII采取了多項優(yōu)化措施,包括編寫自定義矩陣乘法以加快訓(xùn)練速度。在整個訓(xùn)練過程中,亞馬遜云科技還與TII密切合作以利用SageMaker增強可用性,確保訓(xùn)練順利進行,減少對開發(fā)人員的干擾。

TII于2023年5月在Apache 2.0許可下發(fā)布了其Falcon 40B模型。自發(fā)布以來,F(xiàn)alcon 40B 在各種基準測試中的表現(xiàn)都優(yōu)于當下的同類模型,展示了無需專門微調(diào)的卓越性能。為了讓客戶更輕松地訪問該模型,亞馬遜云科技讓Falcon 40B可以通過Amazon SageMaker Jumpstart部署。現(xiàn)在,各個行業(yè)、各種規(guī)模的客戶都可以快速輕松地部署自己的Falcon 40B模型,并對其進行定制以滿足他們的特定需求,如翻譯、問答、信息總結(jié)、圖像識別等應(yīng)用程序。

“Falcon 40B的開源版本使機構(gòu)能夠利用其卓越性能來推動AI賦能的解決方案的發(fā)展。這是我們致力于促進 AI 創(chuàng)新的重要里程碑,也體現(xiàn)阿聯(lián)酋深遠的科學(xué)貢獻?!盩II跨AI研究中心執(zhí)行總監(jiān)兼LLM項目負責人表示,“通過將Falcon大語言模型開源,我們希望將這一先進的技術(shù)能力普惠化,為全球研究人員和組織賦能。下一步,我們即將推出新模型,為人工智能和先進技術(shù)領(lǐng)域的進一步發(fā)展做出貢獻?!?/p>

最新文章
1
1月面板市場價格穩(wěn)定,2026年電視面板增長重心轉(zhuǎn)向大尺寸
2
如何應(yīng)對貿(mào)易戰(zhàn)?看這三家吸塵器出口企業(yè)的“非標準化”答案
3
蘋果全新MacBook Pro將在本月上架:首發(fā)M5 Max芯片
4
美國宣布對特定半導(dǎo)體等加征25%關(guān)稅:主要針對英偉達H200、AMD MI325X等賣中國
5
力壓蘋果!華為手機2025年重返中國第一背后:還沒完全發(fā)力 仍有上漲空間
6
這家面板巨頭2025營收破1000億,兩大信號顯現(xiàn)
7
當ESG成為“必答題”,誰走在了行業(yè)前列?
8
10年包修,會不會“卷”成空調(diào)行業(yè)的標配?
9
存儲芯片大漲 華為逆勢降價!MatePad Edge 512GB官降500:5999元吃上國補
10
IFI美國專利授權(quán)榜發(fā)布:京東方全球第13名 TOP20唯一中國顯示企業(yè)
11
2025利潤大降27.5%,電視業(yè)務(wù)疲軟,LG電子“賺錢”方向何在?
12
蘋果iOS/iPadOS 26.3 開發(fā)者預(yù)覽版 Beta 2 發(fā)布
13
小米 17 Max浮出水面 驍龍 8E5 +8000mAh+3D超聲波
14
Counterpoint:存儲市場陷“超級牛市”,2026年Q1/Q2價格預(yù)計續(xù)漲
15
iQOO Z11 Turbo更多配置釋出!2億大底主攝+第五代驍龍8
16
AI巨頭并購“去中國化”,中國為何仍要審查?
17
AI時代終端大變局丨“玩具總動員”照進現(xiàn)實
18
AI+創(chuàng)新技術(shù)驅(qū)動,2026年智能電視行業(yè)競爭加劇
19
蘋果官宣聯(lián)手谷歌升級iPhone AI:馬斯克第一時間發(fā)聲怒批
20
1499元起 vivo Y500i開啟預(yù)售:7200mAh電池 6年耐用
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512