用AI摳圖 谷歌新應(yīng)用讓你成為各大視頻的“主角”
編 | 白鴿智東西3月2日消息,據(jù)Tech Crunch報(bào)道,今日,谷歌為You Tube添加了一項(xiàng)新的AI功能。即通過(guò)構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò),讓用戶拍攝視頻時(shí)可自動(dòng)更換視頻背景(摳圖)。據(jù)悉,摳圖是一門應(yīng)用了幾十年的特效技術(shù),不過(guò)做起來(lái)很費(fèi)時(shí)間,也很復(fù)雜。如在拍電影時(shí),導(dǎo)演會(huì)讓演員在綠幕前表演,之后使用計(jì)算機(jī)的數(shù)字特效更換綠屏。此前,因計(jì)算機(jī)在一秒內(nèi)至少需要計(jì)算30次,所以在移動(dòng)設(shè)備上想要更換普通的
2018-03-04 08:30:15
來(lái)源:智東西??

編 | 白鴿

智東西3月2日消息,據(jù)Tech Crunch報(bào)道,今日,谷歌為You Tube添加了一項(xiàng)新的AI功能。即通過(guò)構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò),讓用戶拍攝視頻時(shí)可自動(dòng)更換視頻背景(摳圖)。

123

據(jù)悉,摳圖是一門應(yīng)用了幾十年的特效技術(shù),不過(guò)做起來(lái)很費(fèi)時(shí)間,也很復(fù)雜。如在拍電影時(shí),導(dǎo)演會(huì)讓演員在綠幕前表演,之后使用計(jì)算機(jī)的數(shù)字特效更換綠屏。此前,因計(jì)算機(jī)在一秒內(nèi)至少需要計(jì)算30次,所以在移動(dòng)設(shè)備上想要更換普通的RGB圖像,也不是很容易。如此可見(jiàn)想要更換視頻背景的難度。

谷歌工程師們則認(rèn)為這是一個(gè)挑戰(zhàn),并為此建立了一個(gè)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),使其通過(guò)數(shù)千張被標(biāo)記的圖片進(jìn)行訓(xùn)練。

image5

通過(guò)訓(xùn)練,該神經(jīng)網(wǎng)絡(luò)可以分辨臉部特征,如眼睛、頭發(fā)、眼鏡、嘴等部位的特點(diǎn),并將這些特征與其它東西區(qū)分開(kāi)來(lái)。為了做到這一點(diǎn),谷歌工程師對(duì)其進(jìn)行了一系列的優(yōu)化,從而降低了需要壓縮的數(shù)據(jù)量。此外,它還將先前的計(jì)算結(jié)果作為下一步的計(jì)算基礎(chǔ),盡管它看起來(lái)有點(diǎn)作弊,但卻可以進(jìn)一步降低移動(dòng)設(shè)備的負(fù)荷。

在研發(fā)該功能中,其具體的任務(wù)是制作一個(gè)二進(jìn)制蒙版,以計(jì)算從前景到背景進(jìn)行分離的每一幀視頻所用的時(shí)間。其中,實(shí)現(xiàn)計(jì)算跨幀蒙版的時(shí)間的一致性是關(guān)鍵點(diǎn)。目前的方法是利用LSTM或 GRU進(jìn)行計(jì)算,但對(duì)于移動(dòng)設(shè)備來(lái)說(shuō),這樣操作是非常昂貴的。而谷歌研究人員則通過(guò)將之前計(jì)算掩碼作為之后計(jì)算掩碼的基礎(chǔ)進(jìn)行計(jì)算,從而保持時(shí)間上的一致性,如下圖所示:

image7

(原始幀(左)在其三個(gè)顏色通道中分開(kāi),并與之前的蒙版連接,并被用作神經(jīng)網(wǎng)絡(luò)的輸入來(lái)預(yù)測(cè)當(dāng)前幀的蒙版(右))

而在視頻分割過(guò)程中,還要實(shí)現(xiàn)幀到幀的時(shí)間連續(xù)性,同時(shí)也要考慮到諸如在拍攝視頻過(guò)程中突然出現(xiàn)其他人物,以至于造成時(shí)間上不連續(xù)等問(wèn)題。為訓(xùn)練其模型適應(yīng)這些問(wèn)題,谷歌研究人員通過(guò)以下幾點(diǎn)對(duì)其進(jìn)行優(yōu)化:

1、清空之前的蒙版,訓(xùn)練神經(jīng)網(wǎng)絡(luò)在第一幀和第一個(gè)場(chǎng)景人物之間正常工作,并且模擬出了某人出現(xiàn)在相機(jī)中的場(chǎng)景。

2、將其轉(zhuǎn)換為真正的背景蒙版,通過(guò)轉(zhuǎn)換訓(xùn)練,可使神經(jīng)網(wǎng)絡(luò)將其調(diào)整到前一幀蒙版之前。

3、轉(zhuǎn)換圖像。該功能實(shí)現(xiàn)了在相機(jī)中進(jìn)行平滑流暢且快速的圖像轉(zhuǎn)化。

這樣做的結(jié)果就是其神經(jīng)網(wǎng)絡(luò)在移動(dòng)設(shè)備上運(yùn)行的速度非???,如在iPhone 7上實(shí)現(xiàn)了運(yùn)行速度100+ FBS,在Pixel 2上實(shí)現(xiàn)了40+ FBS,并且其更換背景的準(zhǔn)確性非常高。

刪除或替換背景工具對(duì)用戶來(lái)說(shuō)很具有吸引力,所以該功能的推出對(duì)于很多人來(lái)說(shuō)都是一個(gè)好消息。想要體驗(yàn)該功能嗎?遺憾的是,它目前只能讓 YouTube Stories用戶使用該功能。

原文來(lái)自:Tech Crunch、Google Blog

原創(chuàng)文章
最新文章
1
引領(lǐng)全球,中國(guó)Mini LED電視驚艷全球的底氣是產(chǎn)業(yè)鏈優(yōu)勢(shì)
2
洗碗機(jī)終端地位進(jìn)階:從品需到“新剛需”
3
高通回應(yīng)定名第五代驍龍8至尊版:乍一看跳過(guò)了幾代 其實(shí)不然
4
TCL華星近300億布局8.6代OLED產(chǎn)線,與京東方維信諾“三打一”?
5
智聯(lián)萬(wàn)物 AI賦未來(lái)! 2025電博會(huì)即將開(kāi)幕!
6
BOE(京東方)攜新能源領(lǐng)域新品亮相2025服貿(mào)會(huì) 引領(lǐng)綠色轉(zhuǎn)型新動(dòng)能
7
海爾松下引領(lǐng)四筒洗衣機(jī)“爭(zhēng)奪戰(zhàn)”,分區(qū)洗護(hù)誰(shuí)執(zhí)牛耳?
8
庫(kù)克獻(xiàn)出奇招!iPhone Air是在為蘋果折疊屏手機(jī)鋪路?
9
AI時(shí)代終端大變局I端側(cè)AI成物聯(lián)終端進(jìn)化“芯”引擎
10
IFA 2025:中國(guó)電視走向全世界,智能Ai成行業(yè)主旋律
11
空調(diào)價(jià)格進(jìn)入一個(gè)變盤階段
12
17999元起!華為Mate XTs三折疊今天首銷:10.1英寸+麒麟9030
13
iPhone Air在華發(fā)售延期!蘋果回應(yīng):力爭(zhēng)盡快在中國(guó)推出
14
華帝股份半年報(bào)公布:整體毛利率水平攀升至43.54%,同比提升2.86%
15
IFA、RE+雙展亮劍全球:華寶新能重構(gòu)“從戶外到戶用”綠電生態(tài)
16
快手發(fā)布多模態(tài)大模型Keye-VL-1.5 8B性能領(lǐng)先、視頻理解能力更強(qiáng)
17
快手“我的哇賽時(shí)刻”公益影像展覽舉行,科技向善為鄉(xiāng)村學(xué)生架起夢(mèng)想橋梁
18
2025年中德可持續(xù)發(fā)展論壇舉行,快手推動(dòng)女性在經(jīng)濟(jì)轉(zhuǎn)型中穩(wěn)步發(fā)展
19
智媒融合 賦能未來(lái) ——CCNS & ISBT 2025在烏魯木齊隆重召開(kāi)
20
萬(wàn)和電氣上半年業(yè)務(wù)結(jié)構(gòu)生變:廚電扛大旗,生活熱水承壓前行
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512