自從 1956 年計算機科學(xué)家們在達特茅斯會議(Dartmouth Conferences)上確認人工智能這個術(shù)語以來,人們就不乏關(guān)于人工智能奇思妙想,研究人員也在不遺余力地研究。在此后的幾十年間,人工智能先是被捧為人類文明光明未來的鑰匙,后又被當(dāng)作過于自大的異想天開而拋棄。
但是在過去幾年中,人工智能出現(xiàn)了爆炸式的發(fā)展,尤其是 2015 年之后。大部分原因,要歸功于圖形處理器(GPU)的廣泛應(yīng)用,使得并行處理更快、更便宜、更強大。另外,人工智能的發(fā)展還得益于幾乎無限的存儲空間和海量數(shù)據(jù)的出現(xiàn)(大數(shù)據(jù)運動):圖像、文本、 交易數(shù)據(jù)、地圖數(shù)據(jù),應(yīng)有盡有。
下面我們從發(fā)展的歷程中來一一展開對人工智能、機器學(xué)習(xí)和深度學(xué)習(xí)的深度學(xué)習(xí)。
為了搞清三者關(guān)系,我們來看一張圖:
149242351020702994.JPEG (40.48 KB, 下載次數(shù): 3)
下載附件
保存到相冊
2017-4-18 15:18 上傳
如圖所示:人工智能最大,此概念也最先問世;然后是機器學(xué)習(xí),出現(xiàn)的稍晚;最后才是深度學(xué)習(xí)。
人工智能
149242351092010558.JPEG (97.41 KB, 下載次數(shù): 3)
下載附件
保存到相冊
2017-4-18 15:19 上傳
人工智能先驅(qū)們在達特茅斯開會時,心中的夢想是希望通過當(dāng)時新興的計算機,打造擁有相當(dāng)于人類智能的復(fù)雜機器。這就是我們所說的“通用人工智能”(General AI)概念,擁有人類五感(甚至更多)、推理能力以及人類思維方式的神奇機器。在電影中我們已經(jīng)看過無數(shù)這樣的機器人,對人類友好的 C-3PO,以及人類的敵人終結(jié)者。通用人工智能機器至今只存在 于電影和科幻小說里,理由很簡單:我們還實現(xiàn)不了,至少目前為止。
我們力所能及的,算是“弱人工智能”(Narrow AI):執(zhí)行特定任務(wù)的水平與人類相當(dāng),甚至超越人類的技術(shù)?,F(xiàn)實中有很多弱人工智能的例子。這些技術(shù)有人類智能的一面。但是它們是如何做到的?智能來自哪里?這就涉及到下一個同心圓:機器學(xué)習(xí)。
機器學(xué)習(xí)
149242351523151344.JPEG (76.14 KB, 下載次數(shù): 2)
下載附件
保存到相冊
2017-4-18 15:19 上傳
機器學(xué)習(xí)是實現(xiàn)人工智能的一種方法。機器學(xué)習(xí)的概念來自早期的人工智能研究者,已經(jīng)研究出的算法包括決策樹學(xué)習(xí)、歸納邏輯編程、增強學(xué)習(xí)和貝葉斯網(wǎng)絡(luò)等。簡單來說,機器學(xué)習(xí)就是使用算法分析數(shù)據(jù),從中學(xué)習(xí)并做出推斷或預(yù)測。與傳統(tǒng)的使用特定指令集手寫軟件不同,我們使用大量數(shù)據(jù)和算法來“訓(xùn)練”機器,由此帶來機器學(xué)習(xí)如何完成任務(wù)。
許多年來,計算機視覺一直是機器學(xué)習(xí)最佳的領(lǐng)用領(lǐng)域之一,盡管還需要大量的手動編碼才能完成任務(wù)。研究者會手動編寫一些分類器(classifier),如邊緣檢測篩選器,幫助程序辨別物體的邊界;圖形檢測分類器,判斷物體是否有八個面;以及識別“S-T-O-P”的分類器。在這些手動編寫的分類器的基礎(chǔ)上,他們再開發(fā)用于理解圖像的算法,并學(xué)習(xí)如何判斷是否有停止標(biāo)志。
但是由于計算機視覺和圖像檢測技術(shù)的滯后,經(jīng)常容易出錯。
深度學(xué)習(xí)
149242351048095629.JPEG (84.71 KB, 下載次數(shù): 3)
下載附件
保存到相冊
2017-4-18 15:19 上傳
深度學(xué)習(xí)是實現(xiàn)機器學(xué)習(xí)的一種技術(shù)。早期機器學(xué)習(xí)研究者中還開發(fā)了一種叫人工神經(jīng)網(wǎng)絡(luò)的算法,但是發(fā)明之后數(shù)十年都默默無聞。神經(jīng)網(wǎng)絡(luò)是受人類大腦的啟發(fā)而來的:神經(jīng)元之間的相互連接關(guān)系。但是,人類大腦中的神經(jīng)元可以與特定范圍內(nèi)的任意神經(jīng)元連接,而人工神經(jīng)網(wǎng)絡(luò)中數(shù)據(jù)傳播要經(jīng)歷不同的層,傳播方向也不同。
舉個例子,你可以將一張圖片切分為小塊,然后輸入到神經(jīng)網(wǎng)絡(luò)的第一層中。在第一層中做初步計算,然后神經(jīng)元將數(shù)據(jù)傳至第二層。由第二層神經(jīng)元執(zhí)行任務(wù),依次類推,直到最后一層,然后輸出最終的結(jié)果。
每個神經(jīng)元都會給其輸入指定一個權(quán)重:相對于執(zhí)行的任務(wù)該神經(jīng)元的正確和錯誤程度。最終的輸出由這些權(quán)重共同決定。因此,我們再來看看上面提到的停止標(biāo)志示例。一張停止標(biāo)志圖像的屬性,被一一細分,然后被神經(jīng)元“檢查”:形狀、顏色、字符、標(biāo)志大小和是否運動。神經(jīng)網(wǎng)絡(luò)的任務(wù)是判斷這是否是一個停止標(biāo)志。它將給出一個“概率向量”(probability vector),這其實是基于權(quán)重做出的猜測結(jié)果。在本文的示例中,系統(tǒng)可能會有 86% 的把握認定圖像是一個停止標(biāo)志,7% 的把握認為是一個限速標(biāo)志,等等。網(wǎng)絡(luò)架構(gòu)然后會告知神經(jīng)網(wǎng)絡(luò)其判斷是否正確。不過,問題在于即使是最基礎(chǔ)的神經(jīng)網(wǎng)絡(luò)也要耗費巨大的計算資源,因此當(dāng)時不算是一個可行的方法。不過,以多倫多大學(xué) Geoffrey Hinton 教授為首的一小批狂熱研究者們堅持采用這種方法,最終讓超級計算機能夠并行執(zhí)行該算法,并證明該算法的作用。如果我們回到停止標(biāo)志那個例子,很有可能神經(jīng)網(wǎng)絡(luò)受訓(xùn)練的影響,會經(jīng)常給出錯誤的答案。這說明還需要不斷的訓(xùn)練。它需要成千上萬張圖片,甚至數(shù)百萬張圖片來訓(xùn)練,直到神經(jīng)元輸入的權(quán)重調(diào)整到非常精確,幾乎每次都能夠給出正確答案。不過值得慶幸的是Facebook 利用神經(jīng)網(wǎng)絡(luò)記住了你母親的面孔;吳恩達 2012 年在谷歌實現(xiàn)了可以識別貓的神經(jīng)網(wǎng)絡(luò)。
如今,在某些情況下,通過深度學(xué)習(xí)訓(xùn)練過的機器在圖像識別上表現(xiàn)優(yōu)于人類,這包括找貓、識別血液中的癌癥跡象等。谷歌的 AlphaGo 學(xué)會了圍棋,并為比賽進行了大量的訓(xùn)練:不斷的和自己比賽。
總結(jié)
人工智能的根本在于智能,而機器學(xué)習(xí)則是部署支持人工智能的計算方法。簡單的將,人工智能是科學(xué),機器學(xué)習(xí)是讓機器變得更加智能的算法,機器學(xué)習(xí)在某種程度上成就了人工智能。
|