亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專(zhuān)欄INFORMATION COLUMN

深度學(xué)習(xí)教父Geoffrey Hinton的“膠囊理論”終于發(fā)出論文

VincentFF / 4052人閱讀

摘要:在底層的膠囊之后連接了層和層。膠囊效果的討論在論文最后,作者們對(duì)膠囊的表現(xiàn)進(jìn)行了討論。他們認(rèn)為,由于膠囊具有分別處理不同屬性的能力,相比于可以提高對(duì)圖像變換的健壯性,在圖像分割中也會(huì)有出色的表現(xiàn)。

背景

目前的神經(jīng)網(wǎng)絡(luò)中,每一層的神經(jīng)元都做的是類(lèi)似的事情,比如一個(gè)卷積層內(nèi)的每個(gè)神經(jīng)元都做的是一樣的卷積操作。而Hinton堅(jiān)信,不同的神經(jīng)元完全可以關(guān)注不同的實(shí)體或者屬性,比如在一開(kāi)始就有不同的神經(jīng)元關(guān)注不同的類(lèi)別(而不是到最后才有歸一化分類(lèi))。具體來(lái)說(shuō),有的神經(jīng)元關(guān)注位置、有的關(guān)注尺寸、有的關(guān)注方向。這類(lèi)似人類(lèi)大腦中語(yǔ)言、視覺(jué)都有分別的區(qū)域負(fù)責(zé),而不是分散在整個(gè)大腦中。

為了避免網(wǎng)絡(luò)結(jié)構(gòu)的雜亂無(wú)章,Hinton提出把關(guān)注同一個(gè)類(lèi)別或者同一個(gè)屬性的神經(jīng)元打包集合在一起,好像膠囊一樣。在神經(jīng)網(wǎng)絡(luò)工作時(shí),這些膠囊間的通路形成稀疏激活的樹(shù)狀結(jié)構(gòu)(整個(gè)樹(shù)中只有部分路徑上的膠囊被激活),從而形成了他的Capsule理論。值得一提的是,同在谷歌大腦(但不在同一個(gè)辦公室)的Jeff Dean也認(rèn)為稀疏激活的神經(jīng)網(wǎng)絡(luò)是未來(lái)的重要發(fā)展方向,不知道他能不能也提出一些不同的實(shí)現(xiàn)方法來(lái)。

Capsule這樣的網(wǎng)絡(luò)結(jié)構(gòu)在符合人們“一次認(rèn)知多個(gè)屬性”的直觀感受的同時(shí),也會(huì)帶來(lái)另一個(gè)直觀的問(wèn)題,那就是不同的膠囊應(yīng)該如何訓(xùn)練、又如何讓網(wǎng)絡(luò)自己決定膠囊間的激活關(guān)系。Hinton這篇論文解決的重點(diǎn)問(wèn)題就是不同膠囊間連接權(quán)重(路由)的學(xué)習(xí)。

解決路由問(wèn)題

首先,每個(gè)層中的神經(jīng)元分組形成不同的膠囊,每個(gè)膠囊有一個(gè)“活動(dòng)向量”activity vector,它是這個(gè)膠囊對(duì)于它關(guān)注的類(lèi)別或者屬性的表征。樹(shù)結(jié)構(gòu)中的每個(gè)節(jié)點(diǎn)就對(duì)應(yīng)著一個(gè)活動(dòng)的膠囊。通過(guò)一個(gè)迭代路由的過(guò)程,每個(gè)活動(dòng)的膠囊都會(huì)從高一層網(wǎng)絡(luò)中的膠囊中選擇一個(gè),讓它成為自己的母節(jié)點(diǎn)。對(duì)于高階的視覺(jué)系統(tǒng)來(lái)說(shuō),這樣的迭代過(guò)程就很有潛力解決一個(gè)物體的部分如何層層組合成整體的問(wèn)題。

對(duì)于實(shí)體在網(wǎng)絡(luò)中的表征,眾多屬性中有一個(gè)屬性比較特殊,那就是它出現(xiàn)的概率(網(wǎng)絡(luò)檢測(cè)到某一類(lèi)物體出現(xiàn)的置信度)。一般典型的方式是用一個(gè)多帶帶的、輸出0到1之間的回歸單元來(lái)表示,0就是沒(méi)出現(xiàn),1就是出現(xiàn)了。在這篇論文中,Hinton想用活動(dòng)向量同時(shí)表示一個(gè)實(shí)體是否出現(xiàn)以及這個(gè)實(shí)體的屬性。他的做法是用向量不同維度上的值分別表示不同的屬性,然后用整個(gè)向量的模表示這個(gè)實(shí)體出現(xiàn)的概率。為了保證向量的長(zhǎng)度,也就是實(shí)體出現(xiàn)的概率不超過(guò)1,向量會(huì)通過(guò)一個(gè)非線性計(jì)算進(jìn)行標(biāo)準(zhǔn)化,這樣實(shí)體的不同屬性也就實(shí)際上體現(xiàn)為了這個(gè)向量在高維空間中的方向。

采用這樣的活動(dòng)向量有一個(gè)很大的好處,就是可以幫助低層級(jí)的膠囊選擇自己連接到哪個(gè)高層級(jí)的膠囊。具體做法是,一開(kāi)始低層級(jí)的膠囊會(huì)給所有高層級(jí)的膠囊提供輸入;然后這個(gè)低層級(jí)的膠囊會(huì)把自己的輸出和一個(gè)權(quán)重矩陣相乘,得到一個(gè)預(yù)測(cè)向量。如果預(yù)測(cè)向量和某個(gè)高層級(jí)膠囊的輸出向量的標(biāo)量積更大,就可以形成從上而下的反饋,提高這兩個(gè)膠囊間的耦合系數(shù),降低低層級(jí)膠囊和其它高層級(jí)膠囊間的耦合系數(shù)。進(jìn)行幾次迭代后,貢獻(xiàn)更大的低層級(jí)膠囊和接收它的貢獻(xiàn)的高層級(jí)膠囊之間的連接就會(huì)占越來(lái)越重要的位置。

在論文作者們看來(lái),這種“一致性路由”(routing-by-agreement)的方法要比之前較大池化之類(lèi)只保留了一個(gè)最活躍的特征的路由方法有效得多。

網(wǎng)絡(luò)構(gòu)建

作者們構(gòu)建了一個(gè)簡(jiǎn)單的CapsNet。除最后一層外,網(wǎng)絡(luò)的各層都是卷積層,但它們現(xiàn)在都是“膠囊”的層,其中用向量輸出代替了CNN的標(biāo)量特征輸出、用一致性路由代替了較大池化。與CNN類(lèi)似,更高層的網(wǎng)絡(luò)觀察了圖像中更大的范圍,不過(guò)由于不再是較大池化,所以位置信息一直都得到了保留。對(duì)于較低的層,空間位置的判斷也只需要看是哪些膠囊被激活了。

這個(gè)網(wǎng)絡(luò)中最底層的多維度膠囊結(jié)構(gòu)就展現(xiàn)出了不同的特性,它們起到的作用就像傳統(tǒng)計(jì)算機(jī)圖形渲染中的不同元素一樣,每一個(gè)膠囊關(guān)注自己的一部分特征。這和目前的計(jì)算機(jī)視覺(jué)任務(wù)中,把圖像中不同空間位置的元素組合起來(lái)形成整體理解(或者說(shuō)圖像中的每個(gè)區(qū)域都會(huì)首先激活整個(gè)網(wǎng)絡(luò)然后再進(jìn)行組合)具有截然不同的計(jì)算特性。在底層的膠囊之后連接了PrimaryCaps層和DigitCaps層。

實(shí)驗(yàn)結(jié)果

由于膠囊具有新的特性,所以文中的實(shí)驗(yàn)結(jié)果也并不只是跑跑Benchmark而已,還有很多對(duì)膠囊?guī)?lái)的新特性的分析。

數(shù)字識(shí)別

首先在MNIST數(shù)據(jù)集上,經(jīng)過(guò)三次路由迭代學(xué)習(xí)、層數(shù)也不算多的CapsNet就得到了優(yōu)秀的錯(cuò)誤率。

同時(shí),作者們依據(jù)CapsNet中的表征對(duì)“網(wǎng)絡(luò)認(rèn)為自己識(shí)別到”的圖像進(jìn)行重構(gòu),表明在正確識(shí)別的樣本中(豎線左側(cè)),CapsNet可以正確識(shí)別到圖像中的細(xì)節(jié),同時(shí)降低噪聲。

健壯性

由于網(wǎng)絡(luò)結(jié)構(gòu)中DigitCaps部分能夠分別學(xué)到書(shū)寫(xiě)中旋轉(zhuǎn)、粗細(xì)、風(fēng)格等變化,所以對(duì)小變化的健壯性更好。在用一個(gè)隨機(jī)抹黑過(guò)數(shù)字的MNIST數(shù)據(jù)集訓(xùn)練CapsNet后,作者們用它來(lái)識(shí)別affNIST數(shù)據(jù)集。這個(gè)數(shù)據(jù)集中的樣本都是經(jīng)過(guò)小幅度變化后的MNIST樣本,變化后的樣本如下圖。這個(gè)CapsNet直接拿來(lái)識(shí)別affNIST的正確率有79%;同步訓(xùn)練的、參數(shù)數(shù)目類(lèi)似的CNN只有66%。

分割高度重合的數(shù)字

作者們把MNIST數(shù)據(jù)集中的數(shù)字兩兩疊在一起建立了MultiMNIST數(shù)據(jù)集,兩個(gè)數(shù)字的邊框范圍平均有80%是重合的。CapsNet的識(shí)別結(jié)果高于CNN基準(zhǔn)自不必提,但作者們接下來(lái)做的圖形分析中清晰地展現(xiàn)出了膠囊的妙處。

如圖,作者們把兩個(gè)激活程度較高的膠囊對(duì)應(yīng)的數(shù)字作為識(shí)別結(jié)果,據(jù)此對(duì)識(shí)別到的圖像元素進(jìn)行了重構(gòu)。對(duì)于下圖中識(shí)別正確的樣本(L指真實(shí)標(biāo)簽,R指激活程度較高的兩個(gè)膠囊對(duì)應(yīng)的標(biāo)簽),可以看到由于不同的膠囊各自工作,在一個(gè)識(shí)別結(jié)果中用到的特征并不會(huì)影響到另一個(gè)識(shí)別結(jié)果,不受重疊的影響(或者說(shuō)重疊部分的特征可以復(fù)用)。

另一方面,每個(gè)膠囊還是需要足夠多的周邊信息支持,而不是一味地認(rèn)為重疊部分的特征就需要復(fù)用。下圖左圖是選了一個(gè)高激活程度的膠囊和一個(gè)低激活程度膠囊的結(jié)果(*R表示其中一個(gè)數(shù)字既不是真實(shí)標(biāo)簽也不是識(shí)別結(jié)果,L仍然為真實(shí)標(biāo)簽)??梢钥吹剑冢?,0)圖中,關(guān)注“7”的膠囊并沒(méi)有找到足夠多的“7”的特征,所以激活很弱;(1,8)圖中也是因?yàn)闆](méi)有“0”的支持特征,所以重疊的部分也沒(méi)有在“0”的膠囊中用第二次。

膠囊效果的討論

在論文最后,作者們對(duì)膠囊的表現(xiàn)進(jìn)行了討論。他們認(rèn)為,由于膠囊具有分別處理不同屬性的能力,相比于CNN可以提高對(duì)圖像變換的健壯性,在圖像分割中也會(huì)有出色的表現(xiàn)。膠囊基于的“圖像中同一位置至多只有某個(gè)類(lèi)別的一個(gè)實(shí)體”的假設(shè)也使得膠囊得以使用活動(dòng)向量這樣的分離式表征方式來(lái)記錄某個(gè)類(lèi)別實(shí)例的各方面屬性,還可以通過(guò)矩陣乘法建模的方式更好地利用空間信息。不過(guò)膠囊的研究也才剛剛開(kāi)始,他們覺(jué)得現(xiàn)在的膠囊至于圖像識(shí)別,就像二十一世紀(jì)初的RNN之于語(yǔ)音識(shí)別 —— 研究現(xiàn)在只是剛剛起步,日后定會(huì)大放異彩。

論文全文參見(jiàn):https://arxiv.org/pdf/1710.09829.pdf?

歡迎加入本站公開(kāi)興趣群

商業(yè)智能與數(shù)據(jù)分析群

興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價(jià)值的辦法,實(shí)際應(yīng)用案例分享與討論,分析工具,ETL工具,數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)挖掘工具,報(bào)表系統(tǒng)等全方位知識(shí)

QQ群:81035754

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://www.ezyhdfw.cn/yun/4660.html

相關(guān)文章

  • Hinton膠囊理論代碼開(kāi)源,上線即受熱捧

    摘要:近日,該論文的一作終于在上公開(kāi)了該論文中的代碼。該項(xiàng)目上線天便獲得了個(gè),并被了次。 當(dāng)前的深度學(xué)習(xí)理論是由Geoffrey Hinton大神在2007年確立起來(lái)的,但是如今他卻認(rèn)為,CNN的特征提取層與次抽樣層交叉存取,將相同類(lèi)型的相鄰特征檢測(cè)器的輸出匯集到一起是大有問(wèn)題的。去年9月,在多倫多接受媒體采訪時(shí),Hinton大神斷然宣稱(chēng)要放棄反向傳播,讓整個(gè)人工智能從頭再造。10月,人們關(guān)注已久...

    tianlai 評(píng)論0 收藏0
  • 卷積網(wǎng)絡(luò)雖動(dòng)人,膠囊網(wǎng)絡(luò)更傳“神”

    摘要:而加快推動(dòng)這一趨勢(shì)的,正是卷積神經(jīng)網(wǎng)絡(luò)得以雄起的大功臣。卷積神經(jīng)網(wǎng)絡(luò)面臨的挑戰(zhàn)對(duì)的深深的質(zhì)疑是有原因的。據(jù)此,也斷言卷積神經(jīng)網(wǎng)絡(luò)注定是沒(méi)有前途的神經(jīng)膠囊的提出在批判不足的同時(shí),已然備好了解決方案,這就是我們即將討論的膠囊神經(jīng)網(wǎng)絡(luò),簡(jiǎn)稱(chēng)。 本文作者 張玉宏2012年于電子科技大學(xué)獲計(jì)算機(jī)專(zhuān)業(yè)博士學(xué)位,2009~2011年美國(guó)西北大學(xué)聯(lián)合培養(yǎng)博士,現(xiàn)執(zhí)教于河南工業(yè)大學(xué),電子科技大學(xué)博士后。中國(guó)計(jì)...

    zhisheng 評(píng)論0 收藏0
  • Hinton傳奇:退學(xué)當(dāng)木匠,辭職反軍方,終成一代AI教父

    摘要:沒(méi)有繼續(xù)完成學(xué)業(yè),而是退了學(xué),搬到了當(dāng)時(shí)倫敦北部臟亂的伊斯靈頓區(qū),成了一名木匠。于是,他決定辭職以表抗議,并隨后搬到了加拿大,遠(yuǎn)離軍事機(jī)構(gòu)的資助。谷歌宣布旗下的無(wú)人駕駛汽車(chē)已經(jīng)行駛了英里,沒(méi)有發(fā)生一次意外。 英國(guó)《每日電訊報(bào)》打算用三篇報(bào)道,來(lái)描繪人工智能在加拿大多倫多的繁榮景象。本文是其中第一篇:The ‘Godfather of AI’ on making machines clever...

    jimhs 評(píng)論0 收藏0
  • Geoffrey Hinton成功之路:從神經(jīng)網(wǎng)絡(luò)黑暗時(shí)代堅(jiān)守到今天勝利

    摘要:使用神經(jīng)網(wǎng)絡(luò)的思路被摧毀和抹黑,教授說(shuō),傳統(tǒng)的模型得到了人們無(wú)疑的信賴(lài)。但終于,神經(jīng)網(wǎng)絡(luò)奏效了。 深度學(xué)習(xí)泰斗 Geoffrey Hinton 的名字在當(dāng)今的人工智能研究界可謂是如雷貫耳,他曾發(fā)明了玻爾茲曼機(jī)(Boltzmann machine),也首先將反向傳播(Backpropagation)應(yīng)用于多層神經(jīng)網(wǎng)絡(luò);不僅如此,他還有 Yann LeCun 和 Ilya Sutskever 等...

    xushaojieaaa 評(píng)論0 收藏0
  • 吳恩達(dá)眼中深度學(xué)習(xí)七雄

    摘要:的研究興趣涵蓋大多數(shù)深度學(xué)習(xí)主題,特別是生成模型以及機(jī)器學(xué)習(xí)的安全和隱私。與以及教授一起造就了年始的深度學(xué)習(xí)復(fù)興。目前他是僅存的幾個(gè)仍然全身心投入在學(xué)術(shù)界的深度學(xué)習(xí)教授之一。 Andrej Karpathy特斯拉 AI 主管Andrej Karpathy 擁有斯坦福大學(xué)計(jì)算機(jī)視覺(jué)博士學(xué)位,讀博期間師從現(xiàn)任 Google AI 首席科學(xué)家李飛飛,研究卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理上的應(yīng)...

    MingjunYang 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

閱讀需要支付1元查看
<