首頁 收藏 QQ群
 網(wǎng)站導(dǎo)航

ZNDS智能電視網(wǎng) 推薦當(dāng)貝市場

TV應(yīng)用下載 / 資源分享區(qū)

軟件下載 | 游戲 | 討論 | 電視計算器

綜合交流 / 評測 / 活動區(qū)

交流區(qū) | 測硬件 | 網(wǎng)站活動 | Z幣中心

新手入門 / 進階 / 社區(qū)互助

新手 | 你問我答 | 免費刷機救磚 | ROM固件

查看: 11843|回復(fù): 1
上一主題 下一主題
[分享]

人工的智能語音進化史三部曲

[復(fù)制鏈接]
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2017-12-15 18:29 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式 | 來自河南
      關(guān)于人工智能誕生沒有統(tǒng)一說法,有部分學(xué)者以1950年“人工智能之父”馬文·明斯基建造世界上第一臺神經(jīng)網(wǎng)絡(luò)計算機為起點。且以當(dāng)年語音交互起始到現(xiàn)在,大致經(jīng)歷三段演化和推進。讓我們一起回顧整個過程,來看一下人工智能語音發(fā)生的幾次技術(shù)躍進。

  人工智能語音1.0:一問一答

  現(xiàn)在,工智能語音技術(shù)在數(shù)碼、電子、工業(yè)制造領(lǐng)域被廣泛應(yīng)用并且成為全民熱議的話題,可是在發(fā)展之初它還有很多稚嫩的地方。關(guān)于人工智能時代的討論有很多,但在消費層面上,真正大范圍進入用戶試用階段的人工智能語音應(yīng)用大概在2010年之后。這個階段的人工智能語音技術(shù)形成了以語音交互為主的感知狀態(tài),我們暫且稱之為第一階段。

  這時的人工智能語音應(yīng)用通過算法的演變和大量數(shù)據(jù)的輸入,在技術(shù)層面實現(xiàn)自然語音識別和語義理解,針對對話內(nèi)容進行數(shù)據(jù)匹配,然后調(diào)取相關(guān)話題,從而實現(xiàn)簡單內(nèi)容的單向一問一答。第一階段在自我學(xué)習(xí)、邏輯推力方面有很大欠缺,不能針對同一對話內(nèi)容展開深入交互,橫向拓展和縱向發(fā)展都不能滿足用戶需求。例如你問今天天氣如何?他調(diào)取今天的天氣數(shù)據(jù)。接著你問明天的天氣如何?他調(diào)取明天的天氣預(yù)報。今天天氣和明天天氣只是各自獨立的對答,不能連接貫通,形成邏輯。

人工的智能語音進化史三部曲

  關(guān)于人工智能語音技術(shù)的研究,國外企業(yè)投入較早,且發(fā)展也比較全面。像Nuance,曾經(jīng)在語音識別方面功績卓著,到現(xiàn)在為止仍然是全球最大的語音技術(shù)公司,專利數(shù)量和市場份額都遙遙領(lǐng)先。之后包括亞馬遜、蘋果和谷歌,都在深度挖掘智能語音,推出自己的語音助手。據(jù)不完全統(tǒng)計,目前全球?qū)I(yè)做人工智能語音的公司有上千家之多,后起之秀越來越多,涉及的領(lǐng)域越來越廣。如總部位于奧地利維也納的Cortical.io,主要提供新型自然語言理解(NLU)解決方案。由艾倫人工智能研究所和亞馬遜Alexa基金等機構(gòu)資助KITT.AI公司,開發(fā)可定制熱詞檢測器(hotword detector)和對話引擎ChatFlow。舊金山的MindMeld公司可提供對話式人工智能平臺等等。

  人工智能語音2.0:有問有答

  早在2000年,比爾蓋茨曾經(jīng)提出“未來10年是語音的時代”。我們目前所說的智能語音,學(xué)術(shù)界稱為“自然語言處理”(來自百度)。業(yè)內(nèi)人士認(rèn)為,智能語音技術(shù)將會成為人類主流的人機交互方式之一,計算機技術(shù)與人工智能領(lǐng)域的發(fā)展為智能語音交互發(fā)展帶來了希望。

  人工智能語音交互的更深層階段——對話,即有問有答,包含上下文邏輯。舉個例子或許更好理解,如果一門課程上一年沒開設(shè),對于“這門課程去年有多少同學(xué)沒通過”這樣的問題,機器是回答“都沒通過”還是“去年沒開這門課”?同時機器還需要提前存儲“去年沒開這門課”的信息,想想我們從小時候啥也不懂到現(xiàn)在懂得的知識和信息,這是難以想象的數(shù)據(jù)量。再比如說“我想聽周杰倫的歌”,機器只會將周杰倫的歌顯示出來,并不能直接播放。就是說假如你要做一件事情,需要給機器一個明確的指令,否則,會讓人很煩躁,因為你要一直說下去。

人工的智能語音進化史三部曲

  當(dāng)然,“對話”層面,仍然停留在“人機對話”階段,機器仍然停留在被動接受人類輸入大量數(shù)據(jù)階段,相比“問答”層面,只不過信息流、數(shù)據(jù)存儲量更大,機器仍然不能更深層次理解人的意思,無法實現(xiàn)自學(xué)習(xí)、自成長,與機器的語音交流還不能像人一樣自然。

  人工智能語音3.0:自然交互

  人工智能進入第三階段,最大的進展就是交互的進展。不僅僅有問有答,不僅僅包含上下文邏輯了,人工智能硬件能夠更多地融合各種環(huán)境信息,作出不同決策或推薦。也就說,在交互的過程中,機器有了更多的主動性,能夠為人提供更多、更好的幫助,讓人們的生活更便捷,更安全,更有趣。

  有兩個比較典型的應(yīng)用場景,一個是智能汽車,一個是智能家居。

  2010年,谷歌秘密研究的無人汽車項目被《紐約時報》記者曝光,當(dāng)時引起了不小的震動。無人汽車即無人駕駛汽車,也叫智能汽車,主要是通過車載傳感系統(tǒng)感知道路環(huán)境,并依靠車內(nèi)的人工智能系統(tǒng)自動規(guī)劃行車路線,到達預(yù)定目的地。

人工的智能語音進化史三部曲

  谷歌無人駕駛汽車在開放道路上行駛時,會對來往車輛、行人,路面環(huán)境信息進行識別與分析,為系統(tǒng)的決策判斷提供依據(jù)。系統(tǒng)經(jīng)過長期的“學(xué)習(xí)”后,人工智能具備的策略神經(jīng)元將變得更加熟練高效,并形成類似于人的“感覺”,能及時處理駕駛過程中的突發(fā)情況。

  2016年1月,美國國家公路安全交通管理局(NHTSA)在其網(wǎng)站上發(fā)布了公開信,表示根據(jù)聯(lián)邦政府現(xiàn)行法律規(guī)定,谷歌的無人駕駛汽車采用的人工智能系統(tǒng)可以被視為“司機”。這被視為是人工智能發(fā)展里程碑的事件,也標(biāo)志著“智能”可以像“人工”一樣感知、判斷、推理并做出決策,可以實現(xiàn)主動控制,也能更好地人機交互與協(xié)同。

  在智能家居領(lǐng)域,人工智能的發(fā)展方向同樣是人機交互、操作簡單、通過大數(shù)據(jù)能夠進行自主判斷決策。長虹前不久推出了人工智能電視新品Q5K,主打語義理解和模糊搜片。不需要絕對明確的指令,人工智能電視能識別和理解用戶的語義。比如當(dāng)用戶說“太暗了”時,電視能理解那是什么意思并知道該怎么做,而不是非得等用戶說出“調(diào)高亮度”。再比如,最近熱播的一部電視劇《那年花開月正圓》,名字太長很多人記不住,但只要你說“我想看花開月圓”,長虹人工智能電視也能找到這部片。如果連這幾個字都記不住,說“我想看陳曉的電視劇”,它也會根據(jù)熱播影視數(shù)據(jù)推薦出這部片來。甚至于說到“我想看陳妍希老公的電視劇”,這臺電視也能理解,你所說的八成就是這部由陳曉主演、最近熱播的《那年花開月正圓》,并為你播放出來。

人工的智能語音進化史三部曲

  這就相當(dāng)于機器真正有了“大腦”,從而可以感知,交互,理解和決策。因此,也就能夠更好地為人類服務(wù)了。


      以上就是人工的智能語音進化史三部曲的全部內(nèi)容,智能電視用戶可以安裝第三方軟件當(dāng)貝市場www.dangbei.com)搜索更多應(yīng)用軟件安裝使用哦~
人工的智能語音進化史三部曲

上一篇:亂燉家電:2017年家電圈什么詞最熱?
下一篇:還不知道買什么盒子好?記住這四點準(zhǔn)沒錯
沙發(fā)
發(fā)表于 2017-12-15 18:58 | 只看該作者 | 來自浙江
感謝樓主分享
回復(fù) 支持 反對

使用道具 舉報

您需要登錄后才可以回帖 登錄 | 立即注冊

本版積分規(guī)則

Archiver|新帖|標(biāo)簽|軟件|Sitemap|ZNDS智能電視網(wǎng) ( 蘇ICP備2023012627號 )

網(wǎng)絡(luò)信息服務(wù)信用承諾書 | 增值電信業(yè)務(wù)經(jīng)營許可證:蘇B2-20221768 丨 蘇公網(wǎng)安備 32011402011373號

GMT+8, 2024-12-26 14:49 , Processed in 0.070353 second(s), 14 queries , Redis On.

Powered by Discuz!

監(jiān)督舉報:report#znds.com (請將#替換為@)

© 2007-2024 ZNDS.Com

快速回復(fù) 返回頂部 返回列表