AI“讀唇術(shù)”,靠什么讓“失語者”重新“開口”?
[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術(shù)”?,F(xiàn)在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術(shù)從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內(nèi)容。近日,不同于運用機器視覺技術(shù)識別說話人的
原創(chuàng)
2020-04-06 07:30:49
來源:釘科技??

[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術(shù)”?,F(xiàn)在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。

之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術(shù)從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內(nèi)容。近日,不同于運用機器視覺技術(shù)識別說話人的唇部動作的的技術(shù),一種僅靠檢測喉嚨運動的“讀唇術(shù)”據(jù)說也被研發(fā)出來了。

圖片 1.png

據(jù)《itmedia》網(wǎng)站消息,近日,東京大學(xué)和索尼計算機科學(xué)研究所共同研發(fā)出的AI系統(tǒng)“Derma”,通過將傳感器貼合在喉嚨周圍的皮膚上,就能成功實現(xiàn)從口形(無聲說話)到語音的轉(zhuǎn)化。

研究靈感最初來源于視聽障礙者的觸診唇讀法,他們會用手指觸摸說話者的嘴唇和下巴周圍,以此讀取說話內(nèi)容。也就是說,他們通過觸摸障礙者嘴唇周圍的皮膚得知他們的說話內(nèi)容。

AI系統(tǒng)“Derma”應(yīng)用時,在下顎皮膚的兩個位置安裝加速度計和角速度傳感器,輔之機器學(xué)習(xí),通過隨著說話發(fā)生的下顎運動和舌肌運動引起的從下顎到喉嚨的皮膚顫動,進行無聲“語音識別”。(釘科技編譯,消息來源: https://www.itmedia.co.jp/news/articles/2003/18/news046.html)

最新文章
1
第二屆健康顯示大會在京隆重召開:以標(biāo)準(zhǔn)領(lǐng)航 共筑健康顯示新生態(tài)
2
美國對華AI芯片供應(yīng)政策急轉(zhuǎn)彎!
3
黃仁勛答記者問實錄,事關(guān)H20、中美競爭、對華合作......
4
全線回暖,618大促疊加“國補”助力家電行業(yè)6月熱銷
5
銷量增速超140%,擦窗機器人如何撬動清潔電器市場?
6
華為新一代三折疊來了!Mate XT 2入網(wǎng):支持衛(wèi)星通信
7
30億元/臺!全球首臺頂級光刻機出貨 支持后2nm工藝:中國廠商不可能買到
8
蘋果首款折疊iPhone來襲:搭載三星無折痕技術(shù),預(yù)計起售價1800美元起!
9
全系搭載A19系列芯片!蘋果iPhone 17系列爆料:或有全新橙色背板
10
2025 CIC中國智慧生活大會“生活美學(xué)創(chuàng)新發(fā)展論壇”隆重召開
11
2025 CIC中國智慧生活大會“AI+智能硬件融合發(fā)展論壇”成功召開
12
高溫刺激空調(diào)銷量走高,美的格力小米“各顯神通”引領(lǐng)變革
13
2025 CIC中國智慧生活大會在北京開幕
14
《2024中國電子視像行業(yè)統(tǒng)計年鑒》在2025 CIC中國智慧生活大會現(xiàn)場隆重出版
15
聯(lián)通打響手機eSIM“第一槍”:距離全面普及還有多遠(yuǎn)?
16
工業(yè)智能體落地仍有三道“檻”
17
預(yù)計2025年8K電視面板規(guī)模50億美元,推動8K電視迎來普及時刻
18
蘋果最薄 iPhone 17 Air 被曝獨享鈦合金中框
19
Mate/Pura 70系列賣爆!華為手機Q2重奪中國出貨量第一:小米在前五中唯一增長
20
電視市場變天!85英寸+電視爆火 75英寸及以下全面失寵
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512