玩過微信的朋友肯定知道語音識別技術(shù)的魅力在哪,現(xiàn)在,就連智能電視也支持語音操作了。不同于智能手機的操作風(fēng)格,智能電視的語音技術(shù)隨著品牌的不同,其可操作性、識別度都有一定的差距。今天,投影時代網(wǎng)就將以國內(nèi)知名彩電品牌三星和長虹為例,和大家一起了解一下語音識別技術(shù)。感興趣的朋友不妨關(guān)注。
語音識別技術(shù),也被稱為自動語音識別Automatic Speech Recognition,(ASR),其目標(biāo)是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。與說話人識別及說話人確認(rèn)不同,后者嘗試識別或確認(rèn)發(fā)出語音的說話人而非其中所包含的詞匯內(nèi)容。
語音技術(shù)帶來的改變
語音技術(shù)撬動世界的那個引爆點究竟在哪里?語音電視似乎正在逼近這個答案。語音識別控制這種人機交流的演示,靠的是由科大訊飛公司今年新推出的語音對講軟件,它除了打電話、發(fā)信息以外,還具有信息查詢和導(dǎo)航等多項功能,這一技術(shù)已經(jīng)處于國際領(lǐng)先水平。而在這背后,得益于訊飛公司擁有一支屬于自己的研發(fā)團隊。1999年,這支創(chuàng)新團隊成立時,研發(fā)技術(shù)并不占優(yōu)勢,但是他們把突破口放在了具體應(yīng)用方面,以產(chǎn)業(yè)化來引領(lǐng)創(chuàng)新發(fā)展。
這種創(chuàng)新氛圍吸引了越來越多的語音高精尖人才加入,成就了科大訊飛既擁有國際領(lǐng)先的尖端技術(shù),又有走進(jìn)千家萬戶的各種語音技術(shù)應(yīng)用。如今,科大訊飛的語音技術(shù)和產(chǎn)品在國內(nèi)主流語音應(yīng)用市場占有率已超過80%。包括長虹、創(chuàng)維、三星等幾乎所有中外品牌發(fā)布的智能電視新品上均應(yīng)用了科大訊飛的語音技術(shù)。電視機在操作體驗方面得以提升。
三星語音功能簡析
三星與2012年在美國上市的智能電視的高端機型上均采用了新的輸入方式來代替遙控器。電視機殼的上部中央內(nèi)置有攝像頭及麥克風(fēng),由此可支持通過手部動作進(jìn)行的手勢輸入及語音輸入。三星將這種新功能稱為“Smart Interaction”。此時,三星的高端智能電視開始支持語音識別技術(shù)了,也就是說,用戶說出語音指令,電視機就會按照指令進(jìn)行操作。
三星語音識別功能
國內(nèi)啟動語音操作時,只需要按住語音鍵,對著電視機說出自己想要了解的資源(保持電視在聯(lián)網(wǎng)狀態(tài)),電視系統(tǒng)就會馬上出現(xiàn)相應(yīng)的操作結(jié)果。而三星,在啟動語音功能時,需要人說出可作為觸發(fā)源的語言。用戶需要說出“Hi TV”后,三星智能電視屏幕下方就會顯示出麥克風(fēng)的圖標(biāo)及操作菜單。此時可直接說出想要觀看的頻道號,或切換頻道,也能調(diào)節(jié)音量。還能在休眠狀態(tài)下以語音方式開啟電視。
長虹語音功能簡析
一、Ciri簡述
Ciri是科大訊飛集團和長虹共同研發(fā)的一個作用于智能電視人機交互式體驗的智能語音系統(tǒng)。在智能電視中以一個虛擬精靈的形式存在,消費者購買智能電視之后將不止獲得一臺電視,還將獲得一個可愛而且實用的家庭成員。Ciri支持四川、湖南、廣東等地方的方言,可以實現(xiàn)查看天氣預(yù)報、查找新聞、點播電影、電視劇、綜藝節(jié)目、在線音樂、搜索資料等功能,通過云端服務(wù)器實現(xiàn)語義理解,提供擬人化交流。
二、技術(shù)支撐
Ciri語音交互系統(tǒng)由擁有國際領(lǐng)先語音交互技術(shù)的研發(fā)機構(gòu)研發(fā),采用目前領(lǐng)先的語音技術(shù)作為支撐,通過語音云、語音識別、語音合成三項主要技術(shù)再配以友好用戶體驗與智能語音控制兩大技術(shù)達(dá)到與智能電視進(jìn)行人機交互的目的。
●語音云(VoiceCloudComputing)
語音技術(shù)和云計算技術(shù)相結(jié)合形成的語音搜索和語音轉(zhuǎn)寫技術(shù),是采用云計算的方式來執(zhí)行語音操作。在云計算技術(shù)背景下,語音的文字轉(zhuǎn)換、語義理解,辨別等操作完全在“云”(服務(wù)器)端執(zhí)行,在后臺配備有強大的服務(wù)器群進(jìn)行無間隙的“云”支持。
●語音識別(VoiceRecognition)
解決的問題是讓計算機能夠“聽懂”人類的語音,將語音轉(zhuǎn)化成文字,相當(dāng)于給智能電視安裝上“耳朵”,使其具備“能聽”的功能。
●語音合成(VoiceSynthesis)
又稱文語轉(zhuǎn)換技術(shù),解決的主要問題是如何將文字信息轉(zhuǎn)化為可聽的聲音信息,相當(dāng)于給智能電視安裝上“嘴巴”,使其具備“能說”的功能,也即讓機器像人一樣開口說話。
●智能語音交互場景及用戶友好體驗(Voiceinteraction&Friendlyexperience)
通過多項用戶研究,結(jié)合每一個操作步驟與用戶使用場景進(jìn)行最人性化的交互設(shè)計,使整個交互體驗友好而充滿樂趣:
Ciri是虛擬化的卡通精靈形象;Ciri可以是你的朋友、你的家人、你的私人助手、你的.....;Ciri提供多種語音庫(用戶可以在智能電視平臺中選擇不同地方方言的語音庫進(jìn)行交流)供用戶根據(jù)各自喜好進(jìn)行選擇切換;Ciri與你對話的內(nèi)容采用語音合成技術(shù)模擬真人發(fā)音,使整個交互體驗更加友好而且人性化。
長虹語音功能
中文智能語音操作系統(tǒng)-Ciri是由長虹-訊飛語音應(yīng)用技術(shù)聯(lián)合實驗室開發(fā)完成,長虹作為世界品牌500強,是集研發(fā)、設(shè)計、制造、銷售于一體的多元化、綜合型的跨國企業(yè)集團,是全球極具競爭力和影響力的消費類電子產(chǎn)品與服務(wù)的領(lǐng)先廠商。多年來,長虹持續(xù)發(fā)力,成功實現(xiàn)了由傳統(tǒng)家電企業(yè)向3C融合的智能家電企業(yè)的轉(zhuǎn)型,也在一定范圍內(nèi)帶動了行業(yè)的發(fā)展。
目前,語音功能已成為智能電視應(yīng)用功能中的標(biāo)配,它根據(jù)對用戶說出的語音進(jìn)行判斷識別,通過系統(tǒng)識別找出用戶所要的語音資源,在此基礎(chǔ)上為用戶推薦推送個性化服務(wù)。用戶更容易看到自己喜歡的內(nèi)容,節(jié)約時間成本。