谷歌大腦的 Swish 激活函數(shù)與 ReLU 激活函數(shù)對(duì)比

wujl596 發(fā)布于2019-07-30 15:10 / 3758人閱讀

摘要：作者微信號(hào)微信公眾號(hào)簡書地址最近谷歌大腦公布了一個(gè)新的激活函數(shù)，叫做激活函數(shù)。根據(jù)谷歌大腦的論文，該激活函數(shù)的性能比激活函數(shù)的性能要好很多。編寫激活函數(shù)在中還沒有實(shí)現(xiàn)激活函數(shù)。時(shí)間比較在我的上面，激活函數(shù)比激活函數(shù)快秒左右。

作者：chen_h
微信號(hào) & QQ：862251340
微信公眾號(hào)：coderpai
簡書地址：http://www.jianshu.com/p/95e3...

最近谷歌大腦公布了一個(gè)新的激活函數(shù)，叫做 Swish 激活函數(shù)。這個(gè)函數(shù)非常的有趣，很多人都把它應(yīng)用到一些小的神經(jīng)網(wǎng)絡(luò)和大的神經(jīng)網(wǎng)絡(luò)中去測(cè)試它的性能。所以，我也打算去 kaggle 上面測(cè)試一些這個(gè)函數(shù)的性能如何。

Swish 激活函數(shù)的數(shù)學(xué)公式非常的簡單，即 f(x) = x * sigmoid(x) 。根據(jù)谷歌大腦的論文，該激活函數(shù)的性能比 ReLU 激活函數(shù)的性能要好很多。

我利用 Keras 實(shí)現(xiàn)的 ReLU 模型，在 kaggle 上面獲得的分?jǐn)?shù)是 0.99457。我保持所有的模型參數(shù)不變，只是把原來模型中的 ReLU 激活函數(shù)修改為 Swish 激活函數(shù)，該模型的正確率就可以達(dá)到 0.99671 。

編寫 Swish 激活函數(shù)

在 keras 中還沒有實(shí)現(xiàn) Swith 激活函數(shù)。所以我們第一步就是需要去實(shí)現(xiàn)這個(gè)激活函數(shù)。下面的 3 行代碼就可以實(shí)現(xiàn)這個(gè)功能：

from keras import backend as K
from keras.layers import Activationfrom 
keras.utils.generic_utils import get_custom_objects
def swish(x):
    return (K.sigmoid(x) * x)
get_custom_objects().update({"swish": Activation(swish )})

現(xiàn)在我們只需要將 Swish 激活函數(shù)添加到模型就行了。

model.add(Conv2D(filters = 32, kernel_size = (5,5),padding = ‘Same’, 
 activation =’swish’, input_shape = (28,28,1)))

但我們的最后一層還是采用原來的 sigmoid 激活函數(shù)。

精度比較

在正確率方面，我發(fā)現(xiàn) Swish 激活函數(shù)的性能比 ReLU 激活函數(shù)好一點(diǎn)，在 kaggle 上面的排名大約可以排到 90 名。

時(shí)間比較

在我的 Geforce 940mx 上面，ReLU 激活函數(shù)比 Swish 激活函數(shù)快 10 秒左右。我知道可能 Swish 激活函數(shù)在計(jì)算 sigmoid 函數(shù)的時(shí)候比 ReLU 多浪費(fèi)了 10 秒。

總結(jié)

在 kaggle 上面提交之后，我們的正確率只是多了 0.002 左右，排名大約在 90 名。但是我們每運(yùn)行一個(gè) epoch ，在 GPU 上面需要多花費(fèi) 20% - 30% 的時(shí)間。剛剛我們使用的是最原始的 Swish 版本，還有另外一個(gè)版本，即 Swish_beta (f(x) = 2xsigmoid(betax)) 。我希望這個(gè)激活函數(shù)比最原始的激活函數(shù)可以更加的高效。

參考資料

kaggle 代碼，請(qǐng)點(diǎn)擊這里。
GitHub 代碼，請(qǐng)點(diǎn)擊這里。
Swish 原始論文，請(qǐng)點(diǎn)擊這里。

如果你發(fā)現(xiàn)了任何的問題，或者有什么好的想法，請(qǐng)與我聯(lián)系。

作者：chen_h
微信號(hào) & QQ：862251340
簡書地址：http://www.jianshu.com/p/95e3...

CoderPai 是一個(gè)專注于算法實(shí)戰(zhàn)的平臺(tái)，從基礎(chǔ)的算法到人工智能算法都有設(shè)計(jì)。如果你對(duì)算法實(shí)戰(zhàn)感興趣，請(qǐng)快快關(guān)注我們吧。加入AI實(shí)戰(zhàn)微信群，AI實(shí)戰(zhàn)QQ群，ACM算法微信群，ACM算法QQ群。長按或者掃描如下二維碼，關(guān)注 “CoderPai” 微信號(hào)（coderpai）

GPU云服務(wù)器云服務(wù)器您的賬號(hào)無法激活函數(shù)對(duì)比構(gòu)造函數(shù)對(duì)比 php函數(shù)與函數(shù)調(diào)用

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://www.ezyhdfw.cn/yun/41087.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

wujl596

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

tensorflow+resnet

閱讀 1325·2023-04-26 02:46
tensorflow數(shù)據(jù)集

閱讀 761·2023-04-25 19:38
調(diào)查表明80%的企業(yè)在云計(jì)算方面超支_云資訊

閱讀 762·2021-10-14 09:42
Python學(xué)習(xí)總結(jié)

閱讀 1372·2021-09-08 09:36
css/day08

閱讀 1482·2019-08-30 15:44
奔跑

閱讀 1439·2019-08-29 17:23
CSS 水平垂直居中

閱讀 2365·2019-08-29 15:27
Flex布局做出自適應(yīng)頁面--語法和案例

閱讀 939·2019-08-29 14:15

亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！

谷歌大腦的 Swish 激活函數(shù)與 ReLU 激活函數(shù)對(duì)比

相關(guān)文章

**激活函數(shù)可視化**

神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)簡史第四部分：深度學(xué)習(xí)終迎偉大復(fù)興

**「自歸一化神經(jīng)網(wǎng)絡(luò)」提出新型激活函數(shù)SELU**

發(fā)表評(píng)論

0條評(píng)論

wujl596

男|高級(jí)講師

TA的文章

tensorflow+resnet

tensorflow數(shù)據(jù)集

調(diào)查表明80%的企業(yè)在云計(jì)算方面超支_云資訊

Python學(xué)習(xí)總結(jié)

css/day08

奔跑

CSS 水平垂直居中

Flex布局做出自適應(yīng)頁面--語法和案例

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！

谷歌大腦的 Swish 激活函數(shù)與 ReLU 激活函數(shù)對(duì)比

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！