回到家,你不用擔(dān)心找不到開關(guān),揮揮手就能開燈,還可以打開窗戶、電視或音響;駕車時(shí),你用不著騰出手去拿手機(jī),敲敲指頭就可以接電話。隨著手勢(shì)識(shí)別等交互技術(shù)的發(fā)展,在不久的將來,這些都將成為現(xiàn)實(shí)。
手勢(shì)識(shí)別,簡(jiǎn)單地說是一個(gè)用手、臂等姿態(tài)運(yùn)動(dòng)實(shí)現(xiàn)操控的過程,它的目的是讓使用者在不借助任何輔助設(shè)備的情況下,自然、便捷、舒適地與智能設(shè)備進(jìn)行交互。這一過程看似簡(jiǎn)單,實(shí)現(xiàn)起來卻要解決一系列復(fù)雜的科學(xué)和工程技術(shù)結(jié)合難題。
不久前,計(jì)算機(jī)視覺公司未動(dòng)科技發(fā)布了一款3D手勢(shì)交互平臺(tái)——黎曼平臺(tái)。該平臺(tái)利用人工智能技術(shù),基于對(duì)深度圖的處理實(shí)現(xiàn)了對(duì)手勢(shì)的識(shí)別。未動(dòng)科技創(chuàng)始人孫錚表示,未動(dòng)科技的3D手勢(shì)識(shí)別是基于深度攝像頭的深度感知,經(jīng)過計(jì)算機(jī)視覺與人工智能算法處理,識(shí)別出手部的三維姿態(tài)與位置。
3D手勢(shì)識(shí)別并非近一兩年才興起的技術(shù),此前不少公司已經(jīng)開始了這方面的探索。比如,微軟和英特爾推出了面向消費(fèi)者的動(dòng)作識(shí)別解決方案,但它們都是基于PC端的設(shè)計(jì)。黎曼平臺(tái)則考慮到了移動(dòng)端的功耗與運(yùn)算性能等限制性條件,經(jīng)過深度算法裁剪與工程優(yōu)化,使得3D手勢(shì)識(shí)別能夠流暢精準(zhǔn)地運(yùn)行到手機(jī)等移動(dòng)設(shè)備上,成為全球首款支持智能手機(jī)的手勢(shì)識(shí)別平臺(tái)。
孫錚說,傳統(tǒng)的手勢(shì)識(shí)別對(duì)每一幀的手勢(shì)圖像進(jìn)行獨(dú)立分析,而未動(dòng)科技采用新的深度學(xué)習(xí)算法,把手勢(shì)動(dòng)作當(dāng)作一個(gè)時(shí)間序列來處理,從而大幅提高了識(shí)別精度與運(yùn)算效率。
從技術(shù)指標(biāo)上看,黎曼平臺(tái)可以實(shí)現(xiàn)對(duì)手部23個(gè)關(guān)節(jié)點(diǎn)識(shí)別以及26個(gè)自由度的追蹤。相應(yīng)延遲在毫秒級(jí),在移動(dòng)設(shè)備上最高幀率接近60,有低功耗、高精度、抗遮擋的特點(diǎn),可以支持預(yù)定義3D手勢(shì)。
德國(guó)PMD公司是全球唯一將深度傳感器成功植入手機(jī)的技術(shù)提供商。近日,該公司宣布將選擇黎曼平臺(tái)作為中間件,為客戶提供非接觸式的交互方案,共同推出完整的手勢(shì)識(shí)別軟硬件一體方案,推進(jìn)自然人機(jī)交互發(fā)展。
新的交互方式帶來新的交互體驗(yàn),甚至?xí)悄芙换ジ锩逆I盤、鼠標(biāo)到觸摸屏,交互方式一直向著人性化的方向發(fā)展。除了應(yīng)用在智能手機(jī)上外,3D手勢(shì)在識(shí)別機(jī)器人、無人機(jī)、虛擬現(xiàn)實(shí)、智能家居等領(lǐng)域還有廣泛的應(yīng)用。
以虛擬現(xiàn)實(shí)為例,在交互端,相比聲控、眼動(dòng)、手柄等識(shí)別方式,手勢(shì)識(shí)別靈活性更高、實(shí)用性更強(qiáng)。此外,從沉浸感來說,用戶在虛擬現(xiàn)實(shí)中看到自己的雙手,并且自然舒適地操作,一定程度上提升了用戶的體驗(yàn)。
專家表示,在人工智能的大背景下,原有的按鍵、觸摸屏等交互方式可能會(huì)被顛覆,新型交互方式必將涌現(xiàn),而3D手勢(shì)識(shí)別是人機(jī)交互發(fā)展的重要趨勢(shì)之一。智能交互模式也將帶動(dòng)產(chǎn)品升級(jí)創(chuàng)新,下一代智能設(shè)備的交互和操作方式對(duì)用戶將更加自然和友好。