少花錢搭建深度學(xué)習(xí)系統(tǒng)的硬件指南

anRui 發(fā)布于2019-04-25 18:15 / 3643人閱讀

摘要：本文將告訴你如何用最省錢的方式，來搭建一個(gè)高性能深度學(xué)習(xí)系統(tǒng)。

由于深度學(xué)習(xí)的計(jì)算相當(dāng)密集，所以有人覺得“必須要購買一個(gè)多核快速CPU”，也有人認(rèn)為“購買快速CPU可能是種浪費(fèi)”。

那么，這兩種觀點(diǎn)哪個(gè)是對(duì)的？其實(shí)，在建立深度學(xué)習(xí)系統(tǒng)時(shí)，最糟糕的事情之一就是把錢浪費(fèi)在不必要的硬件上。本文將告訴你如何用最省錢的方式，來搭建一個(gè)高性能深度學(xué)習(xí)系統(tǒng)。

當(dāng)初，在我研究并行深度學(xué)習(xí)過程中，我構(gòu)建了一個(gè)GPU集群，所以我需要仔細(xì)選擇硬件。盡管經(jīng)過了反復(fù)的研究和推理，但當(dāng)我挑選硬件時(shí)，我仍然會(huì)犯許多錯(cuò)誤，并且當(dāng)應(yīng)用于實(shí)踐中時(shí)，那些錯(cuò)誤就展現(xiàn)出來了。所以，在這里，我想分享一下我所學(xué)到的知識(shí)，希望你不會(huì)像我一樣再陷入同樣的陷阱。

GPU

本文假設(shè)您將使用GPU進(jìn)行深度學(xué)習(xí)。如果您正在建立或升級(jí)您的系統(tǒng)，那么忽視GPU是不明智的。 GPU才是深度學(xué)習(xí)應(yīng)用的核心，它能大大提升處理速度，所以不能忽略。

我在之前的文章中詳細(xì)介紹了GPU的選擇，并且GPU的選擇可能是您的深度學(xué)習(xí)系統(tǒng)中最關(guān)鍵的選擇。?

一般來說，如果您的資金預(yù)算有限，我推薦您購買GTX 680，或者GTX Titan X（如果你很有錢，可用它做卷積）或GTX 980（它性價(jià)比很高，但若做大型卷積神經(jīng)網(wǎng)絡(luò)就有些局限性了），它們?cè)趀Bay上就能買得到。

另外，低成本高性價(jià)比的內(nèi)存我推薦GTX Titan。之前我支持過GTX 580，但是由于新更新的cuDNN庫顯著提升了卷積速度，故而所有不支持cuDNN的GPU都已經(jīng)過時(shí)了，其中 GTX 580就是這樣一款GPU。如果您不使用卷積神經(jīng)網(wǎng)絡(luò)，GTX 580仍然是一個(gè)很好的選擇。

你能識(shí)別上面哪個(gè)硬件會(huì)導(dǎo)致糟糕的表現(xiàn)？是這些GPU的其中一個(gè)？還是CPU？

CPU

要選擇CPU，我們首先要了解CPU及它與深度學(xué)習(xí)的關(guān)系。

CPU對(duì)深度學(xué)習(xí)有什么作用？當(dāng)您在GPU上運(yùn)行深度網(wǎng)絡(luò)時(shí)，CPU幾乎沒有計(jì)算，

但是CPU仍然可以處理以下事情：

在代碼中寫入和讀取變量

執(zhí)行諸如函數(shù)調(diào)用的指令

在GPU上啟動(dòng)函數(shù)調(diào)用

創(chuàng)建小批量數(shù)據(jù)

啟動(dòng)到GPU的數(shù)據(jù)傳輸

所需CPU的數(shù)量

當(dāng)我用三個(gè)不同的庫訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)時(shí)，我總是看到一個(gè)CPU線程是100％（有時(shí)另一個(gè)線程會(huì)在0到100％之間波動(dòng)）。而且這一切立即告訴你，大多數(shù)深入學(xué)習(xí)的庫，以及實(shí)際上大多數(shù)的軟件應(yīng)用程序，一般僅使用一個(gè)線程。?

這意味著多核CPU相當(dāng)無用。如果您運(yùn)行多個(gè)GPU，并使用MPI之類的并行化框架，那么您將一次運(yùn)行多個(gè)程序，同時(shí)，也需要多個(gè)線程。?

每個(gè)GPU應(yīng)該是一個(gè)線程，但每個(gè)GPU運(yùn)行兩個(gè)線程將會(huì)為大多數(shù)深入學(xué)習(xí)庫帶來更好的性能；這些庫在單核上運(yùn)行，但是有時(shí)會(huì)異步調(diào)用函數(shù)，就使用了第二個(gè)CPU線程。?

請(qǐng)記住，許多CPU可以在每個(gè)內(nèi)核上運(yùn)行多個(gè)線程（這對(duì)于Intel 的CPU尤為如此），因此通常每個(gè)GPU對(duì)應(yīng)一個(gè)CPU核就足夠了。

CPU和PCI-Express

這是一個(gè)陷阱！一些新的Haswell CPU不支持那些舊CPU所支持的全部40個(gè)PCIe通道。如果要使用多個(gè)GPU構(gòu)建系統(tǒng)，請(qǐng)避免使用這些CPU。另外，如果您有一個(gè)帶有3.0的主板，則還要確保您的處理器支持PCIe 3.0。

CPU緩存大小

正如我們將在后面看到的那樣，CPU高速緩存大小在“CPU-GPU-管線”方面是相當(dāng)無關(guān)緊要的，但是我還是要做一個(gè)簡短的分析，以便我們確保沿著這條計(jì)算機(jī)管道能考慮到每一個(gè)可能出現(xiàn)的瓶頸，進(jìn)而我們可以全面了解整體流程。

通常人們購買CPU時(shí)會(huì)忽略緩存，但通常它是整體性能問題中非常重要的一部分。 CPU緩存的片上容量非常小，且位置非常靠近CPU，可用于高速計(jì)算和操作。 CPU通常具有緩存的分級(jí)，從小型高速緩存（L1，L2）到低速大型緩存（L3，L4）。?

作為程序員，您可以將其視為哈希表，其中每個(gè)數(shù)據(jù)都是鍵值對(duì)（key-value-pair），您可以在特定鍵上進(jìn)行快速查找：如果找到該鍵，則可以對(duì)高速緩存中的值執(zhí)行快速讀寫操作; 如果沒有找到（這被稱為緩存未命中），則CPU將需要等待RAM趕上，然后從那里讀取該值（這是非常緩慢的過程）。重復(fù)的緩存未命中會(huì)導(dǎo)致性能顯著降低。高效的CPU高速緩存方案和架構(gòu)，通常對(duì)CPU的性能至關(guān)重要。

CPU如何確定其緩存方案，是一個(gè)非常復(fù)雜的主題，但通?？梢约俣ㄖ貜?fù)使用的變量、指令和RAM地址將保留在緩存中，而其他不太頻繁出現(xiàn)的則不會(huì)。

在深度學(xué)習(xí)中，相同的內(nèi)存范圍會(huì)重復(fù)被小批量讀取，直到送到GPU，并且該內(nèi)存范圍會(huì)被新數(shù)據(jù)覆蓋。但是如果內(nèi)存數(shù)據(jù)可以存儲(chǔ)在緩存中，則取決于小批量大小。?

對(duì)于128位的小批量大小，我們對(duì)應(yīng)于MNIST和CIFAR分別有0.4MB和1.5 MB，這適合大多數(shù)CPU緩存；對(duì)于ImageNet，我們每個(gè)小批量有超過85 MB的數(shù)據(jù)( )，即使是較大的緩存（L3緩存不超過幾MB），也算是很大的了。

由于數(shù)據(jù)集通常太大而無法適應(yīng)緩存，所以新的數(shù)據(jù)需要從RAM中每個(gè)讀取一小部分新的，并且需要能夠以任何方式持續(xù)訪問RAM。

RAM內(nèi)存地址保留在緩存中（CPU可以在緩存中執(zhí)行快速查找，并指向RAM中數(shù)據(jù)的確切位置），但是這僅限于整個(gè)數(shù)據(jù)集都存儲(chǔ)于RAM時(shí)才會(huì)如此，否則內(nèi)存地址將改變，并且緩存也不會(huì)加速（稍后你會(huì)看到的，使用固定內(nèi)存時(shí)則不會(huì)出現(xiàn)這種情況，但這并不重要）。

深度學(xué)習(xí)代碼的其他部分（如變量和函數(shù)調(diào)用），將從緩存中受益，但這些代碼通常數(shù)量較少，可輕松適應(yīng)幾乎任何CPU的小型快速L1緩存。

從這個(gè)推理結(jié)果可以看出，CPU緩存大小不應(yīng)該很重要。下一節(jié)進(jìn)一步分析的結(jié)果，也與此結(jié)論相一致。

所需的CPU時(shí)鐘頻率（frequency）

當(dāng)人們想到快速的CPU時(shí)，他們通常首先想到時(shí)鐘頻率（clockrate）。 4GHz真的比3.5GHz快嗎？這對(duì)于具有相同架構(gòu)的處理器來說，通常是正確的，例如“Ivy Bridge”。但在不同架構(gòu)的處理器之間，就不能這樣比較了。此外，時(shí)鐘頻率也并非總是較佳的性能指標(biāo)。

在深度學(xué)習(xí)上，使用CPU的計(jì)算很少：比如增加一些變量、評(píng)估一些布爾表達(dá)式、在GPU或程序中調(diào)用一些函數(shù)。以上這些都取決于CPU內(nèi)核時(shí)鐘率。雖然這個(gè)推理似乎是合理的，但是當(dāng)我運(yùn)行深度學(xué)習(xí)程序時(shí)，CPU卻有100％的使用率，這是為什么？為了找到原因，我做了一些CPU核頻率的降頻實(shí)驗(yàn)。

在MNIST和ImageNet上的CPU降頻測(cè)試：以上數(shù)據(jù)，是在具有不同CPU內(nèi)核時(shí)鐘頻率時(shí)，對(duì)ImageNet運(yùn)行200個(gè)周期MNIST數(shù)據(jù)集，或1/4 ImageNet周期所用時(shí)間，進(jìn)行性能測(cè)量的。其中以較大時(shí)鐘頻率作為每個(gè)CPU的基準(zhǔn)線。為了比較：從GTX 680升級(jí)到GTX Titan，性能約為15％; 從GTX Titan到GTX 980提升20％; GPU超頻為所有GPU提升約5％的性能。

那么為什么CPU內(nèi)核頻率對(duì)系統(tǒng)來說無關(guān)緊要，而使用率卻是100％？答案可能是CPU緩存未命中（CPU持續(xù)忙于訪問RAM，但是同時(shí)CPU必須等待RAM以跟上其較慢的時(shí)鐘頻率，這可能會(huì)導(dǎo)致忙碌和等待兩者同時(shí)存在的矛盾狀態(tài)）。如果這是真的，就像上面看到的結(jié)果一樣，那么CPU內(nèi)核的降頻不會(huì)導(dǎo)致性能急劇下降。

另外，CPU還執(zhí)行其他操作，如將數(shù)據(jù)復(fù)制到小批量中，并將準(zhǔn)備復(fù)制到GPU的數(shù)據(jù)準(zhǔn)備好，但這些操作取決于內(nèi)存時(shí)鐘頻率，而不是CPU內(nèi)核時(shí)鐘頻率。所以，現(xiàn)在我們來看看內(nèi)存方面。

RAM時(shí)鐘頻率

CPU-RAM，以及與RAM的其他交互，都相當(dāng)復(fù)雜。我將在這里展示一個(gè)簡化版本的過程。為了能更全面地理解，就我們先來深入了解從CPU RAM到GPU RAM這一過程。

CPU內(nèi)存時(shí)鐘和RAM交織在一起。您的CPU的內(nèi)存時(shí)鐘決定了RAM的較大時(shí)鐘頻率，這兩個(gè)部分構(gòu)成CPU的總體內(nèi)存帶寬，但通常RAM本身確定了總體可用帶寬，原因是它比CPU內(nèi)存頻率慢。?

您可以這樣確定帶寬：

（其中64是指64位CPU架構(gòu)。對(duì)于我的處理器和RAM模塊，帶寬為51.2GB / s）

但是，如果您復(fù)制大量的數(shù)據(jù)，這時(shí)會(huì)和帶寬相關(guān)。通常，您的RAM上的時(shí)序（例如8-8-8）對(duì)于小數(shù)據(jù)量來說更為相關(guān)，并且決定您的CPU等待RAM追趕的時(shí)間。但是如上所述，您深入學(xué)習(xí)程序中的幾乎所有數(shù)據(jù)都將輕松適應(yīng)CPU緩存，除非因?yàn)樘?，才無法從緩存中獲益。這意味著計(jì)時(shí)器將是不重要的，而帶寬可能才是重要的。

那么這與深度學(xué)習(xí)程序有什么關(guān)系呢？我剛剛只是說帶寬可能很重要，但是在下一步里，它就不是很重要了。您的RAM的內(nèi)存帶寬決定了一個(gè)小批量可以被重寫和分配用于初始化GPU傳輸?shù)乃俣龋乱徊?，CPU-RAM到GPU-RAM是真正的瓶頸，這一步使用直接內(nèi)存存?。―MA）。如上所述，我的RAM模塊的內(nèi)存帶寬為51.2GB/ s，但DMA帶寬只有12GB / s！

DMA帶寬與常規(guī)帶寬有關(guān)，但細(xì)節(jié)并不一定必須了解。如果您想詳細(xì)了解，可到該維基百科詞條查看，您可以在詞條內(nèi)查找RAM模塊的DMA帶寬（峰值傳輸限制）。但是先讓我們看看DMA是如何工作的吧。

（地址：https://en.wikipedia.org/wiki/DDR3_SDRAM#JEDEC_standard_modules）?

直接內(nèi)存存?。―MA）

具有RAM的CPU只能通過DMA與GPU進(jìn)行通信。?

在第一步中，CPU RAM和GPU RAM都保留特定的DMA傳輸緩沖區(qū);?

在第二步，CPU將請(qǐng)求的數(shù)據(jù)寫入CPU側(cè)的DMA緩沖區(qū);?

在第三步中，保留的緩沖區(qū)無需CPU的幫助即可傳輸?shù)紾PURAM。?

這里有人可能會(huì)想：你的PCIe帶寬是8GB / s（PCIe 2.0）或15.75GB / s（PCIe 3.0），所以你應(yīng)該買一個(gè)像上面所說的良好峰值傳輸限制的RAM嗎？

答案是：不必要。軟件在這里會(huì)扮演重要角色。如果你以一種聰明的方式進(jìn)行一些傳輸，那么你就不再需要那些便宜且慢的內(nèi)存。?

異步迷你批量分配（Asynchronousmini-batch allocation）

一旦您的GPU完成了當(dāng)前迷你批量的計(jì)算，它就想立即計(jì)算下一迷你批次（mini-batch）。您現(xiàn)在可以初始化DMA傳輸，然后等待傳輸完成，以便您的GPU可以繼續(xù)處理數(shù)字。

但是有一個(gè)更有效的方法：提前準(zhǔn)備下一個(gè)迷你批量，以便讓您的GPU不必等待。這可以輕松且異步地完成，而不會(huì)降低GPU性能。

用于異步迷你批次分配的CUDA代碼：當(dāng)GPU開始處理當(dāng)前批次時(shí)，執(zhí)行前兩次調(diào)用; 當(dāng)GPU完成當(dāng)前批處理時(shí)，執(zhí)行最后兩個(gè)調(diào)用。數(shù)據(jù)傳輸在數(shù)據(jù)流的第二步同步之前就已經(jīng)完成，因此GPU處理下一批次將不會(huì)有任何延遲。

Alex Krishevsky的卷積網(wǎng)絡(luò)的ImageNet 2012迷你批次的大小為128，僅需要0.35秒就能完成它的完整的反向傳遞。我們能夠在如此短時(shí)間內(nèi)分配下一批嗎？

如果我們采用大小為128的批次，并且維度244x244x3大小的數(shù)據(jù)，總量大約為0.085 GB( )。若使用超慢內(nèi)存，我們有6.4 GB / s，即每秒75個(gè)迷你批次！所以使用異步迷你批量分配，即使是最慢的RAM對(duì)深入學(xué)習(xí)也將足夠。如果使用異步迷你批量分配，購買更快的RAM模塊沒有任何優(yōu)勢(shì)。

該過程也間接地意味著CPU緩存是無關(guān)緊要的。您的CPU的快速覆蓋速度（在快速緩存中），以及準(zhǔn)備（將緩存寫到RAM）一個(gè)迷你批次其實(shí)并不重要，因?yàn)樵贕PU請(qǐng)求下一個(gè)迷你批次之前，整個(gè)傳輸就已經(jīng)完成了，所以一個(gè)大型緩存真的沒那么重要。

所以底線確實(shí)是RAM的時(shí)鐘頻率是無關(guān)緊要的，所以買便宜的就行了。

但你需要買多少個(gè)呢？

RAM大小

您應(yīng)該至少具有與GPU內(nèi)存大小相同的RAM。當(dāng)然，您可以使用較少的RAM，但這樣的話可能需要一步一步地傳輸數(shù)據(jù)。然而，從我的經(jīng)驗(yàn)來看，使用更大的RAM會(huì)更加方便。

心理學(xué)告訴我們，專注力是隨著時(shí)間的推移會(huì)慢慢耗盡的一種資源。有些為數(shù)不多的硬件，可以幫您節(jié)省注意力資源以解決更困難的編程問題， RAM就是其中之一。如果您有更多的RAM，您可以將更多的時(shí)間投入到更緊迫的事情上，而不是花費(fèi)大量的時(shí)間來彌補(bǔ)RAM瓶頸。?

有了很多RAM，您可以避免這些瓶頸，節(jié)省時(shí)間并提高生產(chǎn)率，使注意力投入到更緊迫的地方。特別是在Kaggle比賽中，我發(fā)現(xiàn)額外的RAM對(duì)于特征操作非常有用。所以如果你資金充裕，并做了大量的預(yù)處理，那么額外的RAM可能是一個(gè)不錯(cuò)的選擇。

硬盤驅(qū)動(dòng)器/SSD

在某些情況下，硬盤驅(qū)動(dòng)器可能是深度學(xué)習(xí)的重大瓶頸。如果您的數(shù)據(jù)集很大，您通常會(huì)在SSD /硬盤驅(qū)動(dòng)器上放一些數(shù)據(jù)，RAM中也有一些，以及GPURAM中也會(huì)放兩個(gè)迷你批量（mini-batch）。為了不斷地供給GPU，我們需要以GPU可以運(yùn)行完的速度提供新的的迷你批量（mini-batch）。

為此，我們需要使用與異步迷你批量分配相同的想法。我們需要異步讀取多個(gè)小批量的文件，這真的很重要！如果我們不這樣做，結(jié)果表現(xiàn)會(huì)被削弱很多（約5-10％），并且你精心設(shè)計(jì)的硬件優(yōu)勢(shì)將毫無作用（好的深入學(xué)習(xí)軟件在GTX 680也能運(yùn)行很快，而壞的深入學(xué)習(xí)軟件即使用GTX 980也會(huì)步履維艱）

考慮到這一點(diǎn)，如果我們將數(shù)據(jù)保存為32位浮點(diǎn)數(shù)據(jù)，就會(huì)遇到Alex的ImageNet卷積網(wǎng)絡(luò)遇到的數(shù)據(jù)傳輸速率的問題，約每0.3秒0.085GB（ ?）即290MB / s。如果我們把它保存為jpeg數(shù)據(jù)，我們可以將它壓縮5-15倍，將所需的讀取帶寬降低到約30MB / s。如果我們看硬盤驅(qū)動(dòng)器的速度，我們通常會(huì)看到速度為100-150MB / s，所以這對(duì)于壓縮為jpeg的數(shù)據(jù)是足夠的。?

類似地，一個(gè)人可以使用mp3或其他壓縮技術(shù)處理的聲音文件，但是對(duì)于處理原始32位浮點(diǎn)數(shù)據(jù)的其他數(shù)據(jù)組，難以很好地壓縮數(shù)據(jù)（只能壓縮32位浮點(diǎn)數(shù)據(jù)10-15％）。所以如果你有大的32位數(shù)據(jù)組，那么你肯定需要一個(gè)SSD，因?yàn)樗俣葹?00-150 MB / s的硬盤會(huì)很慢，難以跟上GPU。

所以如果你今后有可能遇到這樣的數(shù)據(jù)，那就買一個(gè)一個(gè)SSD；如果不會(huì)遇到那樣的數(shù)據(jù)，一個(gè)硬盤驅(qū)動(dòng)器就足夠用了。

?許多人購買SSD是為了感覺上更好：程序啟動(dòng)和響應(yīng)更快，并且使用大文件進(jìn)行預(yù)處理也更快一些。但是對(duì)于深入學(xué)習(xí)，僅當(dāng)輸入維度很高且無法充分壓縮數(shù)據(jù)時(shí)，才用得到SSD。

如果您購買SSD，您應(yīng)該買一個(gè)能夠容納您常用大小的數(shù)據(jù)組的SSD，另外還需要額外留出幾十GB的空間。其實(shí)，讓硬盤驅(qū)動(dòng)器來存儲(chǔ)未使用的數(shù)據(jù)組也是個(gè)好主意。

電源單元（PSU）

一般來說，您需要一個(gè)足夠的PSU來滿足未來的所有GPU。 GPU通常會(huì)隨著時(shí)間的推移而更加節(jié)能，所以即使當(dāng)其他組件到了更換的時(shí)候，PSU也能繼續(xù)工作很長時(shí)間，所以良好的PSU是一個(gè)明智的投資。

您可以通過將CPU和GPU的所需瓦數(shù)，與其他組件所需瓦數(shù)相加，再加上作為電源峰值緩沖的100-300瓦，就能計(jì)算出所需的瓦數(shù)。?

要注意的一個(gè)重要部分，是留意您的PSU的PCIe連接器是否支持帶有連接線的8pin + 6pin的接頭。我買了一個(gè)具有6x PCIe端口的PSU，但是只能為8pin或6pin連接器供電，所以我無法使用該P(yáng)SU運(yùn)行4個(gè)GPU。

另一個(gè)重要的事情是購買具有高功率效率等級(jí)的PSU，特別是當(dāng)您運(yùn)行多個(gè)GPU并想要運(yùn)行很長時(shí)間。

在全功率（1000-1500瓦特）下運(yùn)行4個(gè)GPU系統(tǒng)，對(duì)卷積網(wǎng)進(jìn)行兩個(gè)星期的訓(xùn)練，將消耗300-500千瓦時(shí)，而在德國的電力成本還要高出20美分/ kWh，即60~100

云服務(wù)器 GPU云服務(wù)器搭建小程序的騰訊云服務(wù)少錢深度學(xué)習(xí)指南深度學(xué)習(xí)的深度深度學(xué)習(xí)的深度指

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://www.ezyhdfw.cn/yun/4571.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

anRui

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

前端開發(fā)知識(shí)點(diǎn)總結(jié)

閱讀 1452·2019-08-30 12:54
【軟工二】大作業(yè)總結(jié)

閱讀 1934·2019-08-30 11:16
總結(jié)常用偽類與偽元素

閱讀 1667·2019-08-30 10:50
初步認(rèn)識(shí)pug

閱讀 2546·2019-08-29 16:17
JS面向?qū)ο蠖?this/原型鏈/new原理

閱讀 1342·2019-08-26 12:17
面試官想要什么樣的簡歷之【實(shí)習(xí)/應(yīng)屆生簡歷】

閱讀 1433·2019-08-26 10:15
一種在地圖中處理曲線的通用方法

閱讀 2449·2019-08-23 18:38
javascript系列--javascript深入理解--作用域，作用域鏈，閉包的面試題解

閱讀 838·2019-08-23 17:50

亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！

少花錢搭建深度學(xué)習(xí)系統(tǒng)的硬件指南

相關(guān)文章

EOS入門指南PART4——合約開發(fā)鋪墊：搭建本地測(cè)試節(jié)點(diǎn)

**計(jì)算機(jī)視覺中的深度學(xué)習(xí)：技術(shù)、市場(chǎng)和5個(gè)你想不到的未來**

是時(shí)候考慮那些沒名氣的數(shù)據(jù)中心硬件了

**深度學(xué)習(xí)三大硬件+四大學(xué)習(xí)庫基準(zhǔn)測(cè)試對(duì)比，指標(biāo)全面呈現(xiàn)**

**從硬件配置到軟件安裝，一臺(tái)深度學(xué)習(xí)機(jī)器的配備指南**

發(fā)表評(píng)論

0條評(píng)論

anRui

男|高級(jí)講師

TA的文章

前端開發(fā)知識(shí)點(diǎn)總結(jié)

【軟工二】大作業(yè)總結(jié)

總結(jié)常用偽類與偽元素

初步認(rèn)識(shí)pug

JS面向?qū)ο蠖?this/原型鏈/new原理

面試官想要什么樣的簡歷之【實(shí)習(xí)/應(yīng)屆生簡歷】

一種在地圖中處理曲線的通用方法

javascript系列--javascript深入理解--作用域，作用域鏈，閉包的面試題解

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！

少花錢搭建深度學(xué)習(xí)系統(tǒng)的硬件指南

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！