人機(jī)交互技術(shù):給文化生活帶來(lái)無(wú)盡可能

來(lái)源:投影時(shí)代 更新日期:2013-04-15 作者:pjtime資訊組

    3月初,三星電子在紐約發(fā)布了最新的GALAXY S4智能手機(jī),其中一項(xiàng)名為Eye Scrolling(眼球控制)的技術(shù)頗為搶眼。這項(xiàng)技術(shù)可以通過(guò)手機(jī)的前置攝像頭來(lái)跟蹤用戶的視線,從而對(duì)手機(jī)進(jìn)行簡(jiǎn)單的操作。

    動(dòng)動(dòng)眼球,手機(jī)屏幕就能自動(dòng)翻頁(yè);手指懸空,網(wǎng)頁(yè)瀏覽也能操作自如;動(dòng)動(dòng)嘴皮,眼鏡還能即時(shí)拍照……這不是什么科幻電影里面的場(chǎng)景,而是正在走進(jìn)我們生活的技術(shù)創(chuàng)新。

    語(yǔ)音技術(shù)全面走入生活

    在近年來(lái)不斷涌現(xiàn)的人機(jī)交互技術(shù)創(chuàng)新中,除了多點(diǎn)觸控之外,最為人們熟知的應(yīng)該要算語(yǔ)音技術(shù)了,這還得感謝iPhone的推廣。2012年,蘋(píng)果在iPhone上推出了一項(xiàng)名為Siri的語(yǔ)音技術(shù),在原有的Voice Control(語(yǔ)音控制)功能上加入了在線云服務(wù)功能,將語(yǔ)音識(shí)別技術(shù)全面推向了云時(shí)代。其實(shí)Siri并非語(yǔ)音交互技術(shù)的首創(chuàng),早在iPhone面世之前,索尼愛(ài)立信就推出Track ID技術(shù),可以通過(guò)錄制音樂(lè)片段自動(dòng)在網(wǎng)絡(luò)上搜索并下載原曲。

    今時(shí)今日的語(yǔ)音交互技術(shù)可不只限于音樂(lè)搜索那么簡(jiǎn)單。蘋(píng)果iPhone上的Siri利用云端服務(wù)器的智能化“學(xué)習(xí)”功能,不斷搜集不同用戶的喜好并自動(dòng)優(yōu)化,在人機(jī)互動(dòng)方面的聰明勁兒曾經(jīng)讓不少用戶樂(lè)此不疲地“調(diào)戲”它!罢Z(yǔ)音最大的優(yōu)勢(shì)是,它是人類最自然的交互方式。”機(jī)器學(xué)習(xí)技術(shù)專家、百度多媒體部副總監(jiān)余凱說(shuō),以語(yǔ)音搜索為例,基于自然語(yǔ)言的搜索請(qǐng)求將會(huì)成為移動(dòng)互聯(lián)時(shí)代的主流搜索方式之一!叭缃竦恼Z(yǔ)音搜索不同于傳統(tǒng)搜索模式,不是基于無(wú)關(guān)聯(lián)的幾個(gè)關(guān)鍵詞來(lái)反饋結(jié)果,而是能夠理解用戶指令,完成一項(xiàng)完整的任務(wù)。”

    正是因?yàn)樵谡Z(yǔ)音交互技術(shù)上取得了這種智能化、云端化的突破,在經(jīng)過(guò)了20多年的醞釀準(zhǔn)備之后,目前語(yǔ)音交互技術(shù)已經(jīng)開(kāi)始通過(guò)智能手機(jī)、平板電腦等不同終端平臺(tái)大規(guī)模進(jìn)入到普通人的生活。以智能手機(jī)為例,目前提供語(yǔ)音交互的應(yīng)用已經(jīng)十分豐富,語(yǔ)音搜索、語(yǔ)音輸入法、語(yǔ)音導(dǎo)航軟件、語(yǔ)音社交軟件等大量相關(guān)應(yīng)用不斷涌現(xiàn)。在這方面,中國(guó)的技術(shù)水平相當(dāng)靠前。目前在中文語(yǔ)音交互技術(shù)領(lǐng)域,去年才被中國(guó)移動(dòng)注資的科大訊飛已經(jīng)占據(jù)了70%以上的市場(chǎng)份額!皣(guó)內(nèi)正在形成持續(xù)的語(yǔ)音產(chǎn)業(yè)價(jià)值鏈,國(guó)內(nèi)語(yǔ)音技術(shù)的市場(chǎng)應(yīng)用正在大踏步前進(jìn)!笨拼笥嶏w董事長(zhǎng)劉慶峰表示,目前中國(guó)在中英文語(yǔ)音產(chǎn)業(yè)方面的技術(shù)能力已完全和美國(guó)等世界一流國(guó)家同步。

    “語(yǔ)音技術(shù)是一門交叉學(xué)科,它的突飛猛進(jìn)還得仰仗著數(shù)字信號(hào)處理、人工智能、大數(shù)據(jù)合成等各種領(lǐng)域技術(shù)的突破。”UC優(yōu)視的CEO俞永福表示,機(jī)器要能夠準(zhǔn)確識(shí)別語(yǔ)音并像人一樣通過(guò)理解判斷作出回應(yīng),需要基于大量的“學(xué)習(xí)”,才能與人一樣根據(jù)過(guò)去的經(jīng)驗(yàn)進(jìn)行判斷預(yù)測(cè)。這種“學(xué)習(xí)”有兩種方法:通過(guò)在數(shù)據(jù)中找尋類似事例來(lái)提供解決方案,或是通過(guò)歸納出許多數(shù)據(jù)樣本的共性來(lái)對(duì)這件事情作出判斷,這也是語(yǔ)音技術(shù)發(fā)展的難點(diǎn)。所幸的是,近年來(lái)大數(shù)據(jù)和云計(jì)算的高速發(fā)展大大提高了機(jī)器對(duì)數(shù)據(jù)的處理能力,為機(jī)器學(xué)習(xí)提供了大量“素材”,并且提高了它的學(xué)習(xí)速度。俞永福預(yù)測(cè),在云計(jì)算和大數(shù)據(jù)的有力推動(dòng)下,未來(lái)幾年語(yǔ)音交互技術(shù)將會(huì)取得爆炸性的發(fā)展。

    體感交互逐步走向成熟

    在語(yǔ)音交互走紅的同時(shí),另一類創(chuàng)新的交互方式也在逐漸走向成熟,那就是體感式交互技術(shù)。3月初,三星電子在紐約發(fā)布了最新的GALAXY S4智能手機(jī),作為蘋(píng)果的最強(qiáng)勁對(duì)手,這一次三星居然沒(méi)有在硬件配置等方面大做文章,反而將軟件應(yīng)用和人機(jī)交互技術(shù)的創(chuàng)新作為主要賣點(diǎn),而在三星羅列的眾多“足以自傲”的技術(shù)中,一項(xiàng)名為Eye Scrolling(眼球控制)的技術(shù)頗為搶眼,這項(xiàng)技術(shù)可以通過(guò)手機(jī)的前置攝像頭來(lái)跟蹤用戶的視線,從而對(duì)手機(jī)進(jìn)行簡(jiǎn)單的操作。這聽(tīng)起來(lái)實(shí)在有些不可思議。

    據(jù)現(xiàn)場(chǎng)體驗(yàn)了該項(xiàng)技術(shù)的媒體報(bào)道,就實(shí)用效果而言,目前三星眼球控制技術(shù)的成熟度還不是太高,具體表現(xiàn)在對(duì)用戶眼球動(dòng)作的辨識(shí)度不夠,導(dǎo)致操作的反應(yīng)不夠流暢,另外也缺乏足夠的第三方應(yīng)用支持,只能在三星自家的瀏覽器等專屬應(yīng)用上實(shí)現(xiàn)操控效果,但這無(wú)疑為人機(jī)交互提供了一種全新的發(fā)展方向。

    當(dāng)然,對(duì)于眼球控制技術(shù)的實(shí)用性,目前業(yè)界還有不少爭(zhēng)議。不少專家認(rèn)為眼球控制技術(shù)的難點(diǎn)在于機(jī)器如何對(duì)人類眼睛動(dòng)作的真實(shí)意圖進(jìn)行有效識(shí)別,“有時(shí)候人們眨眼或者轉(zhuǎn)動(dòng)眼球都是無(wú)意識(shí)的,但機(jī)器不見(jiàn)得能夠分辨得出來(lái),這樣就可能會(huì)造成比較多的誤操作!盧eational智能實(shí)驗(yàn)室的技術(shù)員劉毅直言,就目前手機(jī)攝像頭的捕捉能力和手機(jī)的智能計(jì)算能力,眼球控制的精準(zhǔn)性恐怕很難保證!暗@個(gè)技術(shù)的前景十分可觀,因?yàn)槿绻墒炝说脑,就意味著那些四肢有殘障或者喪失語(yǔ)言能力的殘疾人也能方便地使用移動(dòng)智能設(shè)備了!

    相對(duì)于眼球控制技術(shù)的不成熟,同樣屬于體感交互技術(shù)之一的肢體動(dòng)作捕捉技術(shù)卻已經(jīng)開(kāi)始普及。這方面,家用娛樂(lè)設(shè)備廠商可謂急先鋒。最早在這方面有所建樹(shù)的是日本的任天堂公司,其2006年發(fā)布的Wii游戲機(jī)雖然沒(méi)有高清的畫(huà)面,但是卻在手柄上大做文章,支持感應(yīng)人體動(dòng)作來(lái)進(jìn)行操控,從而讓對(duì)著電視屏幕打網(wǎng)球成為了一種可能;其后微軟推出的Xbox 360游戲機(jī)的體感設(shè)備套裝——Kinect更是大獲成功,因?yàn)樗B傳統(tǒng)的游戲手柄也不需要了,玩家只需要對(duì)著Kinect套裝里配置的攝像頭動(dòng)手動(dòng)腳就能夠?qū)崿F(xiàn)對(duì)游戲的操控,這后面有著先進(jìn)的動(dòng)作捕捉技術(shù)的支持。

    多模人機(jī)交互時(shí)代即將到來(lái)

    語(yǔ)音交互、體感交互等眾多新興技術(shù)的涌現(xiàn)證明,一個(gè)全新的交互時(shí)代即將到來(lái)。

    就創(chuàng)新方向而言,目前交互技術(shù)的革命主要集中在三個(gè)方面,除了前面提到的語(yǔ)音和體感之外,還有穿戴式設(shè)備,這里面最為著名的要數(shù)谷歌公司即將推出的Google Glass(谷歌眼鏡)。這款產(chǎn)品其實(shí)是多種交互方式的集合體,在已經(jīng)曝光的功能預(yù)告片中,我們看到它集手勢(shì)、語(yǔ)音、觸摸等多種觸控方式于一體。之所以會(huì)有這樣的設(shè)計(jì),主要是因?yàn)闊o(wú)論是眼球捕捉還是語(yǔ)音識(shí)別,目前都還無(wú)法實(shí)現(xiàn)精確和快捷的輸入,為了彌補(bǔ)這一缺陷,谷歌甚至還專門申請(qǐng)了手套控制專利,希望通過(guò)各種不同操控方式的結(jié)合來(lái)滿足更廣泛的需求。

    和谷歌有著類似想法的公司不在少數(shù)。目前加拿大、日本、美國(guó)的眾多創(chuàng)新公司都在聚焦可穿戴智能設(shè)備的研發(fā),而要讓這些設(shè)備能夠?qū)崿F(xiàn)和現(xiàn)有智能終端同樣的使用效率,操控方式就必須有所突破。“打個(gè)比方吧,智能手表的概念現(xiàn)在很熱,但是手表類產(chǎn)品不管是出于攜帶方便還是美觀的原因,屏幕都沒(méi)辦法設(shè)計(jì)得很大,這種情況下,多點(diǎn)觸控就顯得沒(méi)那么實(shí)用了,反而語(yǔ)音、手勢(shì)捕捉之類的才能更好地搭配這類設(shè)備!眲⒁惚硎。

    微軟亞洲研究院語(yǔ)音專家宋謌平認(rèn)為,未來(lái)最理想的人機(jī)交互方式應(yīng)該是多模態(tài)的,是許多不同交互方式的無(wú)縫結(jié)合,用戶在不同的環(huán)境下,選擇他最喜歡、最習(xí)慣并且效果最好的方式,更自然地與機(jī)器交互。據(jù)了解,目前微軟已經(jīng)啟動(dòng)了一項(xiàng)名為NUI(自然用戶界面)的研究項(xiàng)目,希望借助新型的傳感器、更強(qiáng)大的計(jì)算能力以及大數(shù)據(jù)和機(jī)器學(xué)習(xí),讓人類能夠通過(guò)語(yǔ)音、手勢(shì)和觸摸等更加多元化的方式與計(jì)算系統(tǒng)進(jìn)行互動(dòng)。

    在追求交互方式多元化的同時(shí),人性化、精準(zhǔn)化也是交互技術(shù)下一輪創(chuàng)新的重要方向。2012年,一家名為L(zhǎng)eap Motion的公司格外火爆,該公司宣稱推出的自有體感操控技術(shù)要比微軟的Kinect精確100倍以上,而且零延遲。用戶無(wú)需使用鍵盤和鼠標(biāo),甚至不需要使用觸摸屏,只要隔空動(dòng)動(dòng)手指,PC或者平板電腦屏幕上就會(huì)發(fā)生相應(yīng)的反應(yīng)!拔以诰W(wǎng)上看過(guò)這個(gè)公司的視頻,真的很牛,看起來(lái)就像那些科幻電影里的一樣。”在媒體工作的錢珊珊表示,她個(gè)人對(duì)于這款號(hào)稱將在今年5月13日開(kāi)售的產(chǎn)品十分感興趣,“如果有條件的話,一定要買一套回來(lái)試試!

廣告聯(lián)系:010-82755684 | 010-82755685 手機(jī)版:m.pjtime.com官方微博:weibo.com/pjtime官方微信:pjtime
Copyright (C) 2007 by PjTime.com,投影時(shí)代網(wǎng) 版權(quán)所有 關(guān)于投影時(shí)代 | 聯(lián)系我們 | 歡迎來(lái)稿 | 網(wǎng)站地圖
返回首頁(yè) 網(wǎng)友評(píng)論 返回頂部 建議反饋
快速評(píng)論
驗(yàn)證碼: 看不清?點(diǎn)一下
發(fā)表評(píng)論