首頁 收藏 QQ群
 網(wǎng)站導(dǎo)航

ZNDS智能電視網(wǎng) 推薦當(dāng)貝市場

TV應(yīng)用下載 / 資源分享區(qū)

軟件下載 | 游戲 | 討論 | 電視計算器

綜合交流 / 評測 / 活動區(qū)

交流區(qū) | 測硬件 | 網(wǎng)站活動 | Z幣中心

新手入門 / 進(jìn)階 / 社區(qū)互助

新手 | 你問我答 | 免費刷機(jī)救磚 | ROM固件

查看: 13598|回復(fù): 1
上一主題 下一主題
[分享]

智能電視發(fā)展超出預(yù)期,人機(jī)交互在未來可期

[復(fù)制鏈接]
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2017-11-28 21:07 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式 | 來自浙江
無論是傳統(tǒng)電視還是智能電視,要解決的問題都是一樣的,即“如何讓用戶方便地獲取內(nèi)容”。這里有兩個關(guān)鍵點:“方便”和“內(nèi)容”。在方便性上,傳統(tǒng)電視和互聯(lián)網(wǎng)電視差不多,都是基于遙控器進(jìn)行人機(jī)交互;“內(nèi)容”是傳統(tǒng)電視和互聯(lián)網(wǎng)電視最大的不同點,這個無需贅述。而人工智能技術(shù)的長足發(fā)展,正在這兩個關(guān)鍵點上都大大提升了用戶使用體驗。

關(guān)鍵詞:人工智能 人機(jī)交互 深度學(xué)習(xí) 遠(yuǎn)場語音 NLP 自然語言處理 ASR 語音識別

  “人工智能(AI)”的概念 1956年就已經(jīng)出現(xiàn)了,但是受限于當(dāng)時計算機(jī)的運算能力和算法理論,并沒有應(yīng)用于實際生活,了解的人自然不多。隨著 GPU 能力和深度學(xué)習(xí)理論的發(fā)展,人工智能技術(shù)終于從實驗室理論進(jìn)入到產(chǎn)品化階段,在各個領(lǐng)域開始突飛猛進(jìn)?;ヂ?lián)網(wǎng)電視就是其中之一。

  在討論電視應(yīng)用人工智能技術(shù)之前,需要理清一些基本概念:所謂人工智能是指人造機(jī)器表現(xiàn)出來的智能。 這種智能可能模擬人的思考,也可能完全異于人,目前階段研究的核心主要還是“像人一樣自我學(xué)習(xí)”。機(jī)器學(xué)習(xí)是人工智能的一個分支,深度學(xué)習(xí)又是機(jī)器學(xué)習(xí)的一個分支。完全異于人思考方式的研究,還是個天馬行空的哲學(xué)問題。

  無論是傳統(tǒng)電視還是互聯(lián)網(wǎng)電視,要解決的問題都是一樣的,即“如何讓用戶方便地獲取內(nèi)容”。這里有兩個關(guān)鍵點:“方便”和“內(nèi)容”。在方便這點上,傳統(tǒng)電視和互聯(lián)網(wǎng)電視差不多,都是基于遙控器人機(jī)交互;“內(nèi)容”是傳統(tǒng)電視和互聯(lián)網(wǎng)電視最大的不同點,這個無需贅述。而人工智能技術(shù)的長足發(fā)展,在這兩個關(guān)鍵點上都大大提升了用戶體驗。

  先說方便,由于人工智能技術(shù)在自然語言處理(NLP)領(lǐng)域已經(jīng)能夠達(dá)到 90% 的意圖識別率,所以直接使用自然語言控制電視獲取內(nèi)容成為可能。這里要強(qiáng)調(diào)的是“自然語言”,類似“給我來點跟《教父》一樣水準(zhǔn)的歐洲黑幫電影”這樣的語言才是自然語言,而不是某些品牌廠商經(jīng)常使用的“音量增加百分之二十”這樣的“機(jī)器語言”。對自然語言的理解和反饋是衡量一臺電視機(jī)人工智能水平的關(guān)鍵指標(biāo)之一。

  前幾年用語音遙控的電視并不能叫做人工智能電視,最主要的原因就是只能識別固定的指令,而人工智能電視不僅能夠理解自然語言,而且能夠聯(lián)機(jī)自我學(xué)習(xí),舉一反三理解更多用戶的意圖,越用越準(zhǔn)確。

  人類在對話過程中,會自動帶著上下文。比如用戶在第一次對話中問:“有什么好看的電影”,接下來他可能會問“不要好萊塢的”或者“只看今年的”,這種對話方式都是基于上下文的對話,我們叫做多輪對話。是否支持多輪對話也是衡量一臺電視人工智能水平的關(guān)鍵指標(biāo)。

  除了語義理解,方便性還體現(xiàn)在遠(yuǎn)場收聲能力。它可以讓用戶不再需要拿著遙控器“按住說話”,而是在客廳的任意位置呼喚電視和它對話。典型的場景是:“暴風(fēng)大耳朵,最近有什么好看的片子推薦?”、“魚香肉絲怎么做?”、“明早七點提醒我去機(jī)場”。

智能電視發(fā)展超出預(yù)期,人機(jī)交互在未來可期

  遠(yuǎn)場收聲是通過麥克風(fēng)陣列實現(xiàn)的,麥克風(fēng)陣列以前一直是實驗室的研究對象,直到亞馬遜推出 Echo 智能音箱,終于實現(xiàn)了規(guī)模產(chǎn)品化。麥克風(fēng)陣列最少需要兩顆麥克風(fēng),目前市面上有 4Mic、6Mic 甚至 8Mic 方案。陣列可以從背景噪音中感知用戶說話的特殊波形,通過波束成形技術(shù)準(zhǔn)確地向用戶所在位置的方向定向收聲,忽略其他方向的雜音。廠商會根據(jù)設(shè)備的特性選擇不同的麥克風(fēng)陣列,一般來說電視用的是線性麥克風(fēng),智能音箱采用的是環(huán)形麥克風(fēng)。

智能電視發(fā)展超出預(yù)期,人機(jī)交互在未來可期

  筆者一直關(guān)注亞馬遜 Echo 的發(fā)展,在實際體驗過程中發(fā)現(xiàn),純粹的語音交互目前還存在比較大的缺陷,反而是把遠(yuǎn)場語音應(yīng)用于電視后體驗會更好。舉個例子,用戶面對一個完全沒有顯示的智能音箱,基本上不知道該怎么說才能操作;而面對有大屏的電視,用戶的緊張感會減輕很多,因為屏幕時時刻刻在提醒用戶當(dāng)前可以說什么樣的話來操作電視。谷歌把這種交互方式叫做“視覺反饋”,并把這種反饋交互模式應(yīng)用于今年十月份剛發(fā)布的最新的“Google Assistant for Android TV”系統(tǒng),目前暴風(fēng) AI 電視的交互也是類似的模式。

智能電視發(fā)展超出預(yù)期,人機(jī)交互在未來可期

  與此同時,亞馬遜也意識到這個問題,并很快推出了帶有屏幕的“Echo Show”作為補(bǔ)充。

  目前最新的技術(shù)已經(jīng)不僅能夠識別人聲,而且能夠區(qū)分不同人的聲紋,實現(xiàn)更加高級的操作,比如購物、支付和個性化推薦。國外的亞馬遜和谷歌,國內(nèi)的訊飛、若琪都擁有該項技術(shù)。

  自然語言理解能力和遠(yuǎn)場語音處理能力最終會讓電視機(jī)用戶擺脫遙控器,在人機(jī)交互上產(chǎn)生巨大的飛躍,這種飛躍不亞于當(dāng)年蘋果推出沒有鍵盤只有觸摸屏的 iPhone 手機(jī)。

  再說內(nèi)容,除了自然語言理解,人工智能在個性化內(nèi)容推薦上的應(yīng)用其實更廣泛。 AI 可以從大量用戶對話和用戶行為中抽象整理出用戶的“話外音”,了解用戶的喜好習(xí)慣,然后根據(jù)這些特征主動推薦用戶可能喜歡的內(nèi)容給他。

  有時候,系統(tǒng)會推薦給某個用戶從來沒有接觸過的內(nèi)容類型,用戶會驚呼“原來這個這么好看”,他可能自己都沒有意識到這種內(nèi)容會對自己的胃口。這種智能推薦已經(jīng)在互聯(lián)網(wǎng)產(chǎn)品中大量應(yīng)用,典型的就是今日頭條。

  傳統(tǒng)的個性化內(nèi)容推薦主要是基于標(biāo)簽體系。首先運營人員要對所有的內(nèi)容“打標(biāo)簽”,比如“恐怖”、“熱血”、“二次元”、“都市”等等,工作量極其巨大,而且準(zhǔn)確與否完全依賴于運營人員的水平;然后系統(tǒng)再根據(jù)用戶行為對用戶進(jìn)行畫像,抽取標(biāo)簽進(jìn)行匹配。這個過程中誕生了各種專業(yè)的推薦算法,技術(shù)人員隨時調(diào)整各項參數(shù)優(yōu)化算法,提高打開率。

  基于 AI 的個性化推薦系統(tǒng)和傳統(tǒng)推薦系統(tǒng)有區(qū)別也有聯(lián)系,區(qū)別最大的地方就是標(biāo)簽體系。AI 推薦系統(tǒng)里的“標(biāo)簽”實際上是系統(tǒng)自動從內(nèi)容和行為日志等記錄里自動提取的,不需要運營人員的參與。例如從電影的元數(shù)據(jù)(主演導(dǎo)演簡介等)里分詞提取屬性標(biāo)簽,從用戶的微博、豆瓣評論里分詞提取用戶的屬性標(biāo)簽,然后依托 GPU 芯片進(jìn)行大規(guī)模的矩陣運算,把高維度的向量數(shù)據(jù)逐步降維,最后簡化到三維空間,根據(jù)三維空間里的聚集情況給出推薦。原理類似于傳統(tǒng)推薦系統(tǒng)里的“協(xié)同過濾”。簡單講,就是假設(shè)一個人喜歡某個電影,那么他的好朋友也有可能喜歡那個電影。

  “千人千面”的個性化推薦反過來又推進(jìn)了電視界面的變化。 傳統(tǒng)電視用“節(jié)目排播表”概念來編制頻道,用戶愛看不看錯過了就等下次;互聯(lián)網(wǎng)電視則完全基于點播模式,海量內(nèi)容給你隨便看自己找不到別怪我;基于AI 的智能電視則是把傳統(tǒng)的“人找內(nèi)容”變成了“內(nèi)容找人”,AI 把你可能喜歡的菜端到你面前,先嘗后買。

  “嘗”就是給用戶預(yù)覽完整影片中的精彩橋段,用短片引導(dǎo)用戶看長片,降低了用戶的選擇難度節(jié)省了用戶的時間。

智能電視發(fā)展超出預(yù)期,人機(jī)交互在未來可期

  請注意,精彩橋段可不僅僅是電影的宣傳 VCR,如何挑選橋段也是一門學(xué)問,可以另起一篇了。

更大的可能性

  人工智能在電視應(yīng)用的場景不僅僅是人機(jī)交互和影視內(nèi)容推薦,它可以用來做任何內(nèi)容服務(wù)的推薦。前面講到使用遠(yuǎn)場語音改變了電視的人機(jī)交互模式,所以電視界面不再受傳統(tǒng)電視的樹狀菜單結(jié)構(gòu)束縛,可以容納更多的內(nèi)容服務(wù),并且用戶可以直達(dá)服務(wù)。

  具備人工智能特點的電視,典型的使用方法是這樣的:

  ●“幫我找個八十年代的經(jīng)典文藝片看看”;
  ●“隨便放點周杰倫的歌”;
  ●“再買點上次買過的那種三元牛奶”,“對”,“再買兩盒”;
  ●“去大鴨梨怎么走”,“對,就是最近的那家”;
  ●“半小時后提醒我關(guān)火”;
  ●“晚安(關(guān)閉家里的智能電器設(shè)備,并且讓電視機(jī)休眠)”。

  可以看到,應(yīng)用人工智能技術(shù)的電視機(jī)已經(jīng)大大超越了傳統(tǒng)電視機(jī)的使用方法和使用范圍。電視機(jī)可以幫用戶挑選內(nèi)容,挑選服務(wù),幫用戶控制智能家電,提醒用戶備忘,甚至幫用戶下單購買日常用品等等。上述這些不是設(shè)想的場景,而是已經(jīng)成為現(xiàn)實的場景。

  電視還是電視,但電視機(jī)已經(jīng)早已不是電視機(jī),它已成為家庭助手的一個大屏終端。而這個“家庭助手”的大腦,就是人工智能。

智能電視的未來發(fā)展將會超出我們的想象,智能電視網(wǎng)會持續(xù)關(guān)注,想了解更多內(nèi)容可以搜索關(guān)鍵詞查詢。


上一篇:中國移動加入電視行業(yè),會迅速占領(lǐng)全國營業(yè)廳嗎?
下一篇:HDMI FORUM發(fā)布HDMI規(guī)格2.1版 支持10K分辨率和動態(tài)HDR
沙發(fā)
發(fā)表于 2017-11-28 21:09 | 只看該作者 | 未知
感謝分享
回復(fù) 支持 反對

使用道具 舉報

您需要登錄后才可以回帖 登錄 | 立即注冊

本版積分規(guī)則

Archiver|新帖|標(biāo)簽|軟件|Sitemap|ZNDS智能電視網(wǎng) ( 蘇ICP備2023012627號 )

網(wǎng)絡(luò)信息服務(wù)信用承諾書 | 增值電信業(yè)務(wù)經(jīng)營許可證:蘇B2-20221768 丨 蘇公網(wǎng)安備 32011402011373號

GMT+8, 2025-1-27 22:08 , Processed in 0.072857 second(s), 15 queries , Redis On.

Powered by Discuz!

監(jiān)督舉報:report#znds.com (請將#替換為@)

© 2007-2025 ZNDS.Com

快速回復(fù) 返回頂部 返回列表