關(guān)于人工智能誕生沒(méi)有統(tǒng)一說(shuō)法,有部分學(xué)者以1950年“人工智能之父”馬文·明斯基建造世界上第一臺(tái)神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)為起點(diǎn)。且以當(dāng)年語(yǔ)音交互起始到現(xiàn)在,大致經(jīng)歷三段演化和推進(jìn)。讓我們一起回顧整個(gè)過(guò)程,來(lái)看一下人工智能語(yǔ)音發(fā)生的幾次技術(shù)躍進(jìn)。 人工智能語(yǔ)音1.0:一問(wèn)一答 現(xiàn)在,工智能語(yǔ)音技術(shù)在數(shù)碼、電子、工業(yè)制造領(lǐng)域被廣泛應(yīng)用并且成為全民熱議的話題,可是在發(fā)展之初它還有很多稚嫩的地方。關(guān)于人工智能時(shí)代的討論有很多,但在消費(fèi)層面上,真正大范圍進(jìn)入用戶試用階段的人工智能語(yǔ)音應(yīng)用大概在2010年之后。這個(gè)階段的人工智能語(yǔ)音技術(shù)形成了以語(yǔ)音交互為主的感知狀態(tài),我們暫且稱之為第一階段。 這時(shí)的人工智能語(yǔ)音應(yīng)用通過(guò)算法的演變和大量數(shù)據(jù)的輸入,在技術(shù)層面實(shí)現(xiàn)自然語(yǔ)音識(shí)別和語(yǔ)義理解,針對(duì)對(duì)話內(nèi)容進(jìn)行數(shù)據(jù)匹配,然后調(diào)取相關(guān)話題,從而實(shí)現(xiàn)簡(jiǎn)單內(nèi)容的單向一問(wèn)一答。第一階段在自我學(xué)習(xí)、邏輯推力方面有很大欠缺,不能針對(duì)同一對(duì)話內(nèi)容展開(kāi)深入交互,橫向拓展和縱向發(fā)展都不能滿足用戶需求。例如你問(wèn)今天天氣如何?他調(diào)取今天的天氣數(shù)據(jù)。接著你問(wèn)明天的天氣如何?他調(diào)取明天的天氣預(yù)報(bào)。今天天氣和明天天氣只是各自獨(dú)立的對(duì)答,不能連接貫通,形成邏輯。
20171206132246101001.jpg (24.83 KB, 下載次數(shù): 6)
下載附件
保存到相冊(cè)
2017-12-15 18:25 上傳
關(guān)于人工智能語(yǔ)音技術(shù)的研究,國(guó)外企業(yè)投入較早,且發(fā)展也比較全面。像Nuance,曾經(jīng)在語(yǔ)音識(shí)別方面功績(jī)卓著,到現(xiàn)在為止仍然是全球最大的語(yǔ)音技術(shù)公司,專利數(shù)量和市場(chǎng)份額都遙遙領(lǐng)先。之后包括亞馬遜、蘋果和谷歌,都在深度挖掘智能語(yǔ)音,推出自己的語(yǔ)音助手。據(jù)不完全統(tǒng)計(jì),目前全球?qū)I(yè)做人工智能語(yǔ)音的公司有上千家之多,后起之秀越來(lái)越多,涉及的領(lǐng)域越來(lái)越廣。如總部位于奧地利維也納的Cortical.io,主要提供新型自然語(yǔ)言理解(NLU)解決方案。由艾倫人工智能研究所和亞馬遜Alexa基金等機(jī)構(gòu)資助KITT.AI公司,開(kāi)發(fā)可定制熱詞檢測(cè)器(hotword detector)和對(duì)話引擎ChatFlow。舊金山的MindMeld公司可提供對(duì)話式人工智能平臺(tái)等等。 人工智能語(yǔ)音2.0:有問(wèn)有答 早在2000年,比爾蓋茨曾經(jīng)提出“未來(lái)10年是語(yǔ)音的時(shí)代”。我們目前所說(shuō)的智能語(yǔ)音,學(xué)術(shù)界稱為“自然語(yǔ)言處理”(來(lái)自百度)。業(yè)內(nèi)人士認(rèn)為,智能語(yǔ)音技術(shù)將會(huì)成為人類主流的人機(jī)交互方式之一,計(jì)算機(jī)技術(shù)與人工智能領(lǐng)域的發(fā)展為智能語(yǔ)音交互發(fā)展帶來(lái)了希望。 人工智能語(yǔ)音交互的更深層階段——對(duì)話,即有問(wèn)有答,包含上下文邏輯。舉個(gè)例子或許更好理解,如果一門課程上一年沒(méi)開(kāi)設(shè),對(duì)于“這門課程去年有多少同學(xué)沒(méi)通過(guò)”這樣的問(wèn)題,機(jī)器是回答“都沒(méi)通過(guò)”還是“去年沒(méi)開(kāi)這門課”?同時(shí)機(jī)器還需要提前存儲(chǔ)“去年沒(méi)開(kāi)這門課”的信息,想想我們從小時(shí)候啥也不懂到現(xiàn)在懂得的知識(shí)和信息,這是難以想象的數(shù)據(jù)量。再比如說(shuō)“我想聽(tīng)周杰倫的歌”,機(jī)器只會(huì)將周杰倫的歌顯示出來(lái),并不能直接播放。就是說(shuō)假如你要做一件事情,需要給機(jī)器一個(gè)明確的指令,否則,會(huì)讓人很煩躁,因?yàn)槟阋恢闭f(shuō)下去。
20171206132246445002.jpg (29.93 KB, 下載次數(shù): 6)
下載附件
保存到相冊(cè)
2017-12-15 18:25 上傳
當(dāng)然,“對(duì)話”層面,仍然停留在“人機(jī)對(duì)話”階段,機(jī)器仍然停留在被動(dòng)接受人類輸入大量數(shù)據(jù)階段,相比“問(wèn)答”層面,只不過(guò)信息流、數(shù)據(jù)存儲(chǔ)量更大,機(jī)器仍然不能更深層次理解人的意思,無(wú)法實(shí)現(xiàn)自學(xué)習(xí)、自成長(zhǎng),與機(jī)器的語(yǔ)音交流還不能像人一樣自然。 人工智能語(yǔ)音3.0:自然交互 人工智能進(jìn)入第三階段,最大的進(jìn)展就是交互的進(jìn)展。不僅僅有問(wèn)有答,不僅僅包含上下文邏輯了,人工智能硬件能夠更多地融合各種環(huán)境信息,作出不同決策或推薦。也就說(shuō),在交互的過(guò)程中,機(jī)器有了更多的主動(dòng)性,能夠?yàn)槿颂峁└?、更好的幫助,讓人們的生活更便捷,更安全,更有趣?/font> 有兩個(gè)比較典型的應(yīng)用場(chǎng)景,一個(gè)是智能汽車,一個(gè)是智能家居。 2010年,谷歌秘密研究的無(wú)人汽車項(xiàng)目被《紐約時(shí)報(bào)》記者曝光,當(dāng)時(shí)引起了不小的震動(dòng)。無(wú)人汽車即無(wú)人駕駛汽車,也叫智能汽車,主要是通過(guò)車載傳感系統(tǒng)感知道路環(huán)境,并依靠車內(nèi)的人工智能系統(tǒng)自動(dòng)規(guī)劃行車路線,到達(dá)預(yù)定目的地。
20171206132246426003.jpg (26.45 KB, 下載次數(shù): 5)
下載附件
保存到相冊(cè)
2017-12-15 18:25 上傳
谷歌無(wú)人駕駛汽車在開(kāi)放道路上行駛時(shí),會(huì)對(duì)來(lái)往車輛、行人,路面環(huán)境信息進(jìn)行識(shí)別與分析,為系統(tǒng)的決策判斷提供依據(jù)。系統(tǒng)經(jīng)過(guò)長(zhǎng)期的“學(xué)習(xí)”后,人工智能具備的策略神經(jīng)元將變得更加熟練高效,并形成類似于人的“感覺(jué)”,能及時(shí)處理駕駛過(guò)程中的突發(fā)情況。 2016年1月,美國(guó)國(guó)家公路安全交通管理局(NHTSA)在其網(wǎng)站上發(fā)布了公開(kāi)信,表示根據(jù)聯(lián)邦政府現(xiàn)行法律規(guī)定,谷歌的無(wú)人駕駛汽車采用的人工智能系統(tǒng)可以被視為“司機(jī)”。這被視為是人工智能發(fā)展里程碑的事件,也標(biāo)志著“智能”可以像“人工”一樣感知、判斷、推理并做出決策,可以實(shí)現(xiàn)主動(dòng)控制,也能更好地人機(jī)交互與協(xié)同。 在智能家居領(lǐng)域,人工智能的發(fā)展方向同樣是人機(jī)交互、操作簡(jiǎn)單、通過(guò)大數(shù)據(jù)能夠進(jìn)行自主判斷決策。長(zhǎng)虹前不久推出了人工智能電視新品Q5K,主打語(yǔ)義理解和模糊搜片。不需要絕對(duì)明確的指令,人工智能電視能識(shí)別和理解用戶的語(yǔ)義。比如當(dāng)用戶說(shuō)“太暗了”時(shí),電視能理解那是什么意思并知道該怎么做,而不是非得等用戶說(shuō)出“調(diào)高亮度”。再比如,最近熱播的一部電視劇《那年花開(kāi)月正圓》,名字太長(zhǎng)很多人記不住,但只要你說(shuō)“我想看花開(kāi)月圓”,長(zhǎng)虹人工智能電視也能找到這部片。如果連這幾個(gè)字都記不住,說(shuō)“我想看陳曉的電視劇”,它也會(huì)根據(jù)熱播影視數(shù)據(jù)推薦出這部片來(lái)。甚至于說(shuō)到“我想看陳妍希老公的電視劇”,這臺(tái)電視也能理解,你所說(shuō)的八成就是這部由陳曉主演、最近熱播的《那年花開(kāi)月正圓》,并為你播放出來(lái)。
20171206132246595004.jpg (25.28 KB, 下載次數(shù): 7)
下載附件
保存到相冊(cè)
2017-12-15 18:25 上傳
這就相當(dāng)于機(jī)器真正有了“大腦”,從而可以感知,交互,理解和決策。因此,也就能夠更好地為人類服務(wù)了。
以上就是《人工的智能語(yǔ)音進(jìn)化史三部曲》的全部?jī)?nèi)容,智能電視用戶可以安裝第三方軟件當(dāng)貝市場(chǎng)(www.dangbei.com)搜索更多應(yīng)用軟件安裝使用哦~
192602dvvhopgvvv7q67cc.jpg (87.05 KB, 下載次數(shù): 9)
下載附件
保存到相冊(cè)
2017-12-15 18:23 上傳
|