從框架優(yōu)缺點(diǎn)說起，這是一份TensorFlow入門極簡教程

AlphaWatch 發(fā)布于2019-04-25 18:27 / 3174人閱讀

摘要：第一個(gè)主流產(chǎn)品級(jí)深度學(xué)習(xí)庫，于年由啟動(dòng)。在年月日宣布，的開發(fā)將終止。張量中最基本的單位是常量變量和占位符。占位符并沒有初始值，它只會(huì)分配必要的內(nèi)存。是一個(gè)字典，在字典中需要給出每一個(gè)用到的占位符的取值。

為什么選擇 TensorFlow？

在本文中，我們將對(duì)比當(dāng)前最流行的深度學(xué)習(xí)框架（包括 Caffe、Theano、PyTorch、TensorFlow 和 Keras），幫助你為應(yīng)用選擇最合適的框架。

1. Caffe：第一個(gè)主流產(chǎn)品級(jí)深度學(xué)習(xí)庫，于 2014 年由 UC Berkeley 啟動(dòng)。

優(yōu)點(diǎn)：

快速

支持 GPU

漂亮的 Matlab 和 Python 接口

缺點(diǎn)：

不靈活。在 Caffe 中，每個(gè)節(jié)點(diǎn)被當(dāng)做一個(gè)層，因此如果你想要一種新的層類型，你需要定義完整的前向、后向和梯度更新過程。這些層是網(wǎng)絡(luò)的構(gòu)建模塊，你需要在無窮無盡的列表中進(jìn)行選擇。（相反，在 TensorFlow 中，每個(gè)節(jié)點(diǎn)被當(dāng)做一個(gè)張量運(yùn)算例如矩陣相加、相乘或卷積。你可以輕易地定義一個(gè)層作為這些運(yùn)算的組合。因此 TensorFlow 的構(gòu)建模塊更小巧，允許更靈活的模塊化。）

需要大量的非必要冗長代碼。如果你希望同時(shí)支持 CPU 和 GPU，你需要為每一個(gè)實(shí)現(xiàn)額外的函數(shù)。你還需要使用普通的文本編輯器來定義你的模型。真令人頭疼！幾乎每個(gè)人都希望程序化地定義模型，因?yàn)檫@有利于不同組件之間的模塊化。有趣的是，Caffe 的主要架構(gòu)師現(xiàn)在在 TensorFlow 團(tuán)隊(duì)工作。

專一性。僅定位在計(jì)算機(jī)視覺（但做得很不錯(cuò)）。

不是以 Python 編寫！如果你希望引入新的變動(dòng)，你需要在 C++和 CUDA 上編程（對(duì)于更小的變動(dòng)，你可以使用它的 Python 和 Matlab 接口）。

糟糕的文檔。

安裝比較困難！有大量的依賴包。

只有少量種類的輸入格式，僅有一種輸出格式 HDF5（雖然你總是可以使用它的 Python/C++/Matlab 接口來運(yùn)行，并從中得到輸出數(shù)據(jù)）。

不適用于構(gòu)建循環(huán)網(wǎng)絡(luò)。

2. Theano：由蒙特利爾大學(xué)研究團(tuán)隊(duì)構(gòu)建。Theano 的頂層構(gòu)建了數(shù)值開源深度庫，包括 Keras、Lasagne 和 Blocks。Yoshua Bengio 在 2017 年 9 月 28 日宣布，Theano 的開發(fā)將終止。因此實(shí)際上 Theano 已死！

優(yōu)點(diǎn)：

計(jì)算圖的抽象很漂亮（可媲美 TensorFlow）

為 CPU 和 GPU 都做了優(yōu)化

很好地適應(yīng)數(shù)值優(yōu)化任務(wù)

高級(jí)封裝（Keras、Lasagne）

缺點(diǎn)：

原始的 Theano 只有比較低級(jí)的 API

import numpy

? ? ? ? ? ?for _ in range(T):

? ? ? ? ? ? ? ?h = torch.matmul(W, h) + b

大型模型可能需要很長的編譯時(shí)間

不支持多 GPU

錯(cuò)誤信息可能沒有幫助（有時(shí)候令人懊惱）

3. Pytorch：2017 年 1 月，F(xiàn)acebook 將 Python 版本的 Torch 庫（用 Lua 編寫）開源。

優(yōu)點(diǎn)：

提供動(dòng)態(tài)計(jì)算圖（意味著圖是在運(yùn)行時(shí)生成的），允許你處理可變長度的輸入和輸出，例如，在使用 RNN 時(shí)非常有用。

另一個(gè)例子是，在 PyTorch 中，可以使用標(biāo)準(zhǔn) Python 語法編寫 for 循環(huán)語句。

大量預(yù)訓(xùn)練模型

大量易于組合的模塊化組件

易于編寫自己的圖層類型，易于在 GPU 上運(yùn)行

「TensorBoard」缺少一些關(guān)鍵功能時(shí)，「Losswise」可以作為 Pytorch 的替代品

缺點(diǎn)：

正式文檔以外的參考資料/資源有限

無商業(yè)支持

4. TensorFlow: 由較低級(jí)別的符號(hào)計(jì)算庫（如 Theano）與較高級(jí)別的網(wǎng)絡(luò)規(guī)范庫（如 Blocks 和 Lasagne）組合而成。

優(yōu)點(diǎn)：

由谷歌開發(fā)、維護(hù)，因此可以保障支持、開發(fā)的持續(xù)性。

巨大、活躍的社區(qū)

網(wǎng)絡(luò)訓(xùn)練的低級(jí)、高級(jí)接口

「TensorBoard」是一款強(qiáng)大的可視化套件，旨在跟蹤網(wǎng)絡(luò)拓?fù)浜托阅埽拐{(diào)試更加簡單。

用 Python 編寫（盡管某些對(duì)性能有重要影響的部分是用 C++實(shí)現(xiàn)的），這是一種頗具可讀性的開發(fā)語言

支持多 GPU。因此可以在不同的計(jì)算機(jī)上自由運(yùn)行代碼，而不必停止或重新啟動(dòng)程序

比基于 Theano 的選項(xiàng)更快的模型編譯

編譯時(shí)間比 Theano 短

TensorFlow 不僅支持深度學(xué)習(xí)，還有支持強(qiáng)化學(xué)習(xí)和其他算法的工具。

缺點(diǎn)：

計(jì)算圖是純 Python 的，因此速度較慢

圖構(gòu)造是靜態(tài)的，意味著圖必須先被「編譯」再運(yùn)行

5. Keras：Keras 是一個(gè)更高級(jí)、對(duì)用戶最友好的 API，具有可配置的后端，由 Google Brain 團(tuán)隊(duì)成員 Francis Chollet 編寫和維護(hù)。

優(yōu)點(diǎn)：

提供高級(jí) API 來構(gòu)建深度學(xué)習(xí)模型，使其易于閱讀和使用

編寫規(guī)范的文檔

大型、活躍的社區(qū)

位于其他深度學(xué)習(xí)庫（如 Theano 和 TensorFlow，可配置）之上

使用面向?qū)ο蟮脑O(shè)計(jì)，因此所有內(nèi)容都被視為對(duì)象（如網(wǎng)絡(luò)層、參數(shù)、優(yōu)化器等）。所有模型參數(shù)都可以作為對(duì)象屬性進(jìn)行訪問。

例如：

model.layers[3].output 將提供模型的第三層

model.layers[3].weights 是符號(hào)權(quán)重張量的列表

缺點(diǎn)：

由于用途非常普遍，所以在性能方面比較欠缺

與 TensorFlow 后端配合使用時(shí)會(huì)出現(xiàn)性能問題（因?yàn)椴⑽瘁槍?duì)其進(jìn)行優(yōu)化），但與 Theano 后端配合使用時(shí)效果良好

不像 TensorFlow 或 PyTorch 那樣靈活

TensorFlow 基礎(chǔ)

TensorFlow 是一種采用數(shù)據(jù)流圖（data flow graphs），用于數(shù)值計(jì)算的開源軟件庫。其中 Tensor 代表傳遞的數(shù)據(jù)為張量（多維數(shù)組），F(xiàn)low 代表使用計(jì)算圖進(jìn)行運(yùn)算。數(shù)據(jù)流圖用「節(jié)點(diǎn)」（nodes）和「邊」（edges）組成的有向圖來描述數(shù)學(xué)運(yùn)算。「節(jié)點(diǎn)」一般用來表示施加的數(shù)學(xué)操作，但也可以表示數(shù)據(jù)輸入的起點(diǎn)和輸出的終點(diǎn)，或者是讀取/寫入持久變量（persistent variable）的終點(diǎn)。邊表示節(jié)點(diǎn)之間的輸入/輸出關(guān)系。這些數(shù)據(jù)邊可以傳送維度可動(dòng)態(tài)調(diào)整的多維數(shù)據(jù)數(shù)組，即張量（tensor）。

計(jì)算圖與會(huì)話

學(xué)習(xí) TensorFlow 的第一步是了解它的主要特色——「計(jì)算圖」方法?；旧纤械?TensorFlow 代碼都包含兩個(gè)重要部分：

1. 創(chuàng)建「計(jì)算圖」，表示計(jì)算的數(shù)據(jù)流

2. 運(yùn)行「會(huì)話」，執(zhí)行圖中的運(yùn)算

事實(shí)上，TensorFlow 將計(jì)算的定義與其執(zhí)行分開。這兩個(gè)部分將在以下各節(jié)中詳細(xì)說明。在此之前，請(qǐng)記住第一步是導(dǎo)入 TensorFlow ！

import tensorflow as tf

這樣，Python 就可以訪問 TensorFlow 的所有類、方法和符號(hào)。使用此命令，TensorFlow 庫將在別名「tf」下導(dǎo)入，以便以后我們可以使用它而不必每次鍵入其全稱「TensorFlow」。

1. 計(jì)算圖

TensorFlow 的創(chuàng)意中的較大創(chuàng)意是數(shù)值計(jì)算被表達(dá)成計(jì)算圖。換種說法，任何 TensorFlow 程序的骨干都是一個(gè)計(jì)算圖。正如 TensorFlow 官網(wǎng)上提及的，「一個(gè)計(jì)算圖是被組織到圖節(jié)點(diǎn)上的一系列 TensorFlow 運(yùn)算」。

首先，什么是節(jié)點(diǎn)和運(yùn)算？較好的解釋方式是，舉個(gè)例子。假設(shè)我們?yōu)楹瘮?shù)「f(x,y)=x^2y+y+2」編寫代碼。TensorFlow 中的計(jì)算圖如下所示：

圖 2：TensorFlow 構(gòu)建的計(jì)算圖。

如上圖所示，計(jì)算圖有一系列由邊互相連接的節(jié)點(diǎn)構(gòu)成。每個(gè)節(jié)點(diǎn)稱為 op，即 operation（運(yùn)算）的縮寫。因此每個(gè)節(jié)點(diǎn)代表一個(gè)運(yùn)算，可能是張量運(yùn)算或生成張量的操作。每個(gè)節(jié)點(diǎn)以零或更多張量為輸入，并生成一個(gè)張量作為輸出。

現(xiàn)在我們來構(gòu)建一個(gè)簡單的計(jì)算圖。

import tensorflow as tf

a = 2

b = 3

c = tf.add(a, b, name="Add")

print(c)

______________________________________________________

Tensor("Add:0", shape=(), dtype=int32)

生成的計(jì)算圖和變量為：

圖 3：左：生成的圖在 Tensorboard 中可視化；右：生成的變量（在 debug 模式下運(yùn)行時(shí)從 PyCharm 調(diào)試器獲取的屏幕截圖）

為了實(shí)際評(píng)估節(jié)點(diǎn)，必須在會(huì)話內(nèi)運(yùn)行計(jì)算圖。簡言之，編寫的代碼只生成僅僅用來確定張量的預(yù)期大小以及對(duì)它們執(zhí)行的運(yùn)算的圖。但是，它不會(huì)為任何張量賦值。

因此，TensorFlow Graph 類似于 Python 中的函數(shù)定義。它「不會(huì)」為你執(zhí)行任何計(jì)算（就像函數(shù)定義不會(huì)有任何執(zhí)行結(jié)果一樣）。它「僅」定義計(jì)算操作。

2. 會(huì)話（Session）

在 TensorFlow 中，所有不同的變量和運(yùn)算都是儲(chǔ)存在計(jì)算圖。所以在我們構(gòu)建完模型所需要的圖之后，還需要打開一個(gè)會(huì)話（Session）來運(yùn)行整個(gè)計(jì)算圖。在會(huì)話中，我們可以將所有計(jì)算分配到可用的 CPU 和 GPU 資源中。舉個(gè)簡單的例子，運(yùn)行計(jì)算圖并獲取 c 的值：

sess = tf.Session()

print(sess.run(c))

sess.close()

__________________________________________

這些代碼創(chuàng)建了一個(gè) Session() 對(duì)象（分配到 sess），然后（第二行）調(diào)用它的運(yùn)行方法來運(yùn)行足夠的計(jì)算圖以評(píng)估 c。計(jì)算完畢后需要關(guān)閉會(huì)話來幫助系統(tǒng)回收資源，不然就會(huì)出現(xiàn)資源泄漏的問題。

TensorFlow 張量

import tensorflow as tf

TensorFlow 中最基本的單位是常量（Constant）、變量（Variable）和占位符（Placeholder）。常量定義后值和維度不可變，變量定義后值可變而維度不可變。在神經(jīng)網(wǎng)絡(luò)中，變量一般可作為儲(chǔ)存權(quán)重和其他信息的矩陣，而常量可作為儲(chǔ)存超參數(shù)或其他結(jié)構(gòu)信息的變量。

1. 常量

創(chuàng)建一個(gè)節(jié)點(diǎn)取常數(shù)值，它接收以下的變量：

tf.constant(value, dtype=None, shape=None, name="Const", verify_shape=False)

我們來創(chuàng)建兩個(gè)常量并將它們加起來。常量張量可以通過定義一個(gè)值來簡單地定義：

# create graph

a = tf.constant(2)

b = tf.constant(3)

c = a + b

# launch the graph in a session

with tf.Session() as sess:

? ? print(sess.run(c))

____________________________________________________

5 ? ?

現(xiàn)在我們來看看創(chuàng)建的計(jì)算圖和生成的數(shù)據(jù)類型：

2. 變量

變量是狀態(tài)性的節(jié)點(diǎn)，輸出的是它們當(dāng)前的值，意味著它們可以在一個(gè)計(jì)算圖的多次執(zhí)行中保留它們的值。它們有一系列的有用特征，例如：

它們可以在訓(xùn)練期間或訓(xùn)練后保存到硬盤上。這允許來自不同公司和團(tuán)隊(duì)的人們保存、恢復(fù)和發(fā)送他們的模型參數(shù)給別人。

默認(rèn)情況下，梯度更新（在所有神經(jīng)網(wǎng)絡(luò)中應(yīng)用）將應(yīng)用到計(jì)算圖中的所有變量。實(shí)際上，變量是你希望調(diào)整以最小化損失函數(shù)的東西。

為了創(chuàng)建變量，你可以按如下方式使用 tf.Variable：

# Create a variable.

w = tf.Variable(, name=)

以下語句聲明一個(gè) 2 行 3 列的變量矩陣，該變量的值服從標(biāo)準(zhǔn)差為 1 的正態(tài)分布，并隨機(jī)生成。

w1=tf.Variable(tf.random_normal([2,3],stddev=1,seed=1))

TensorFlow 還有 tf.truncated_normal() 函數(shù)，即截?cái)嗾龖B(tài)分布隨機(jī)數(shù)，它只保留 [mean-2*stddev,mean+2*stddev] 范圍內(nèi)的隨機(jī)數(shù)。

調(diào)用 tf.Variable 來創(chuàng)建一個(gè)變量是一種老方法。TensorFlow 推薦使用封裝器 tf.get_variable，它能接收命名、形狀等參數(shù)：

tf.get_variable(name,

? ? ? ? ? ? ? ? shape=None,

? ? ? ? ? ? ? ? dtype=None,

? ? ? ? ? ? ? ? initializer=None,

? ? ? ? ? ? ? ? regularizer=None,

? ? ? ? ? ? ? ? trainable=True,

? ? ? ? ? ? ? ? collections=None,

? ? ? ? ? ? ? ? caching_device=None,

? ? ? ? ? ? ? ? partitioner=None,

? ? ? ? ? ? ? ? validate_shape=True,

? ? ? ? ? ? ? ? use_resource=None,

? ? ? ? ? ? ? ? custom_getter=None,

? ? ? ? ? ? ? ? constraint=None)

變量在使用前需要初始化。為此，我們必須調(diào)用「變量初始值設(shè)定項(xiàng)操作」，并在 session 上運(yùn)行該操作。

a = tf.get_variable(name="var_1", initializer=tf.constant(2))

b = tf.get_variable(name="var_2", initializer=tf.constant(3))

c = tf.add(a, b, name="Add1")

# launch the graph in a session

with tf.Session() as sess:

? ? # now let"s evaluate their value

? ? print(sess.run(a))

? ? print(sess.run(b))

? ? print(sess.run(c))

3. 占位符

我們已經(jīng)創(chuàng)建了各種形式的常量和變量，但 TensorFlow 同樣還支持占位符。占位符并沒有初始值，它只會(huì)分配必要的內(nèi)存。在會(huì)話中，占位符可以使用 feed_dict 饋送數(shù)據(jù)。

feed_dict 是一個(gè)字典，在字典中需要給出每一個(gè)用到的占位符的取值。在訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí)需要每次提供一個(gè)批量的訓(xùn)練樣本，如果每次迭代選取的數(shù)據(jù)要通過常量表示，那么 TensorFlow 的計(jì)算圖會(huì)非常大。因?yàn)槊吭黾右粋€(gè)常量，TensorFlow 都會(huì)在計(jì)算圖中增加一個(gè)節(jié)點(diǎn)。所以說擁有幾百萬次迭代的神經(jīng)網(wǎng)絡(luò)會(huì)擁有極其龐大的計(jì)算圖，而占位符卻可以解決這一點(diǎn)，它只會(huì)擁有占位符這一個(gè)節(jié)點(diǎn)。

a = tf.constant([5, 5, 5], tf.float32, name="A")

b = tf.placeholder(tf.float32, shape=[3], name="B")

c = tf.add(a, b, name="Add")

with tf.Session() as sess:

? ? # create a dictionary:

? ? d = {b: [1, 2, 3]}

? ? # feed it to the placeholder

? ? print(sess.run(c, feed_dict=d))?

?___________________________________________________

?[6. 7. 8.]

它生成的計(jì)算圖與變量如下所示：

現(xiàn)在，我們已經(jīng)能創(chuàng)建一個(gè)簡單的神經(jīng)網(wǎng)絡(luò)。如下利用隨機(jī)生成的數(shù)據(jù)創(chuàng)建了一個(gè)三層全連接網(wǎng)絡(luò)：

import tensorflow as tf

from numpy.random import RandomState

batch_size=10

w1=tf.Variable(tf.random_normal([2,3],stddev=1,seed=1))

w2=tf.Variable(tf.random_normal([3,1],stddev=1,seed=1))

# None 可以根據(jù)batch 大小確定維度，在shape的一個(gè)維度上使用None

x=tf.placeholder(tf.float32,shape=(None,2))

y=tf.placeholder(tf.float32,shape=(None,1))

#激活函數(shù)使用ReLU

a=tf.nn.relu(tf.matmul(x,w1))

yhat=tf.nn.relu(tf.matmul(a,w2))

#定義交叉熵為損失函數(shù)，訓(xùn)練過程使用Adam算法最小化交叉熵

cross_entropy=-tf.reduce_mean(y*tf.log(tf.clip_by_value(yhat,1e-10,1.0)))

train_step=tf.train.AdamOptimizer(0.001).minimize(cross_entropy)

rdm=RandomState(1)

data_size=516

#生成兩個(gè)特征，共data_size個(gè)樣本

X=rdm.rand(data_size,2)

#定義規(guī)則給出樣本標(biāo)簽，所有x1+x2<1的樣本認(rèn)為是正樣本，其他為負(fù)樣本。Y，1為正樣本

Y = [[int(x1+x2 < 1)] for (x1, x2) in X]

with tf.Session() as sess:

? ? sess.run(tf.global_variables_initializer())

? ? print(sess.run(w1))

? ? print(sess.run(w2))

? ? steps=11000

? ? for i in range(steps):

? ? ? ? #選定每一個(gè)批量讀取的首尾位置，確保在1個(gè)epoch內(nèi)采樣訓(xùn)練

? ? ? ? start = i * batch_size % data_size

? ? ? ? end = min(start + batch_size,data_size)

? ? ? ? sess.run(train_step,feed_dict={x:X[start:end],y:Y[start:end]})

? ? ? ? if i % 1000 == 0:

? ? ? ? ? ? training_loss= sess.run(cross_entropy,feed_dict={x:X,y:Y})

? ? ? ? ? ? print("在迭代 %d 次后，訓(xùn)練損失為 %g"%(i,training_loss))

上面的代碼定義了一個(gè)簡單的三層全連接網(wǎng)絡(luò)（輸入層、隱藏層和輸出層分別為 2、3 和 2 個(gè)神經(jīng)元），隱藏層和輸出層的激活函數(shù)使用的是 ReLU 函數(shù)。該模型訓(xùn)練的樣本總數(shù)為 512，每次迭代讀取的批量為 10。這個(gè)簡單的全連接網(wǎng)絡(luò)以交叉熵為損失函數(shù)，并使用 Adam 優(yōu)化算法進(jìn)行權(quán)重更新。

其中需要注意的幾個(gè)函數(shù)如 tf.nn.relu() 代表調(diào)用 ReLU 激活函數(shù)，tf.matmul() 為矩陣乘法等。tf.clip_by_value(yhat,1e-10,1.0) 這一語句代表的是截?cái)?yhat 的值，因?yàn)檫@一語句是嵌套在 tf.log() 函數(shù)內(nèi)的，所以我們需要確保 yhat 的取值不會(huì)導(dǎo)致對(duì)數(shù)無窮大。

TensorBoard 基礎(chǔ)

TensorBoard 是一個(gè)可視化軟件，在所有的 TensorFlow 標(biāo)準(zhǔn)安裝中都包含了 TensorBoard。按谷歌的話說：「使用 TensorFlow 執(zhí)行的計(jì)算，例如訓(xùn)練一個(gè)大規(guī)模深度神經(jīng)網(wǎng)絡(luò)，可能復(fù)雜且令人困惑。為了更加容易理解、調(diào)試和優(yōu)化 TensorFlow 程序，我們內(nèi)置了一套可視化工具，即 TensorBoard?！?/p>

TensorFlow 程序既能解決非常簡單也能解決非常復(fù)雜的問題，它們都有兩種基本組件——運(yùn)算和張量。如前所述，你創(chuàng)建了一個(gè)由一系列運(yùn)算構(gòu)成的模型，饋送數(shù)據(jù)到模型上，張量將在運(yùn)算之間流動(dòng)，直到得到了輸出張量，即你的結(jié)果。

完全配置好后，TensorBoard 窗口將呈現(xiàn)與下圖類似的畫面：

TensorBoard 的創(chuàng)建是為了幫助你了解模型中張量的流動(dòng)，以便調(diào)試和優(yōu)化模型。它通常用于兩項(xiàng)任務(wù):

1. 圖形可視化

2. 編寫摘要（或可視化學(xué)習(xí)）

在本教程中，我們將介紹 TensorBoard 的上述兩項(xiàng)主要用法。盡早學(xué)習(xí)使用 TensorBoard，可以讓使用 TensorFlow 的工作更有趣也更有成效。

1. 計(jì)算圖可視化

強(qiáng)大的 TensorFlow 計(jì)算圖會(huì)變得極其復(fù)雜?？梢暬瘓D形有助于理解并對(duì)其進(jìn)行調(diào)試。這是一個(gè)在 TensorFlow 網(wǎng)站工作的可視化示例。

為了激活 TensorFlow 程序 TensorBoard，需要向其中添加幾行代碼。這將把 TensorFlow 運(yùn)算導(dǎo)出到一個(gè)名為「event file」（或 event log file）的文件中。TensorBoard 能夠讀取此文件并深入了解模型圖及其性能。

現(xiàn)在我們來編寫一個(gè)簡單的 TensorFlow 程序，并用 TensorBoard 可視化其計(jì)算圖。先創(chuàng)建兩個(gè)常量并將其添加到一起。常數(shù)張量可以簡單地通過定義它們的值來定義：

import tensorflow as tf

# create graph

a = tf.constant(2)

b = tf.constant(3)

c = tf.add(a, b)

# launch the graph in a session

with tf.Session() as sess:

? ? print(sess.run(c))

_____________________________________________

為了用 TensorBoard 可視化程序，我們需要編寫程序的日志文件。為了編寫事件文件，我們首先需要為那些日志編寫一個(gè) writer，使用以下代碼：

writer = tf.summary.FileWriter([logdir], [graph])

其中 [logdir] 是你想要保存那些日志文件的文件夾。你可以選擇 [logdir] 作為某些有意義的東西，例如『./graphs』。第二個(gè)參數(shù) [graph] 是我們正在編寫的程序的計(jì)算圖。有兩種獲取計(jì)算圖的方法：

1. 使用 tf.get_default_graph() 調(diào)用計(jì)算圖，返回程序的默認(rèn)計(jì)算圖

2. 將計(jì)算圖設(shè)置為 sess.graph，返回會(huì)話的計(jì)算圖（注意這里需要我們已經(jīng)創(chuàng)建了會(huì)話）

我們將在以下的例子中展示兩種方法。然而，第二種方法更加常用。不管用哪種方法，確保僅當(dāng)你定義了計(jì)算圖之后才創(chuàng)建一個(gè) writer。否則，TensorBoard 中可視化的計(jì)算圖將是不完整的。讓我們添加 writer 到第一個(gè)例子中并可視化計(jì)算圖。

import tensorflow as tf

# create graph

a = tf.constant(2)

b = tf.constant(3)

c = tf.add(a, b)

# creating the writer out of the session

# writer = tf.summary.FileWriter("./graphs", tf.get_default_graph())

# launch the graph in a session

with tf.Session() as sess:

? ? # or creating the writer inside the session

? ? writer = tf.summary.FileWriter("./graphs", sess.graph)

? ? print(sess.run(c))

? ? # don"t forget to close the writer at the end

? ? writer.close()

接下來轉(zhuǎn)到 Terminal，確保當(dāng)前工作目錄與運(yùn)行 Python 代碼的位置相同。例如，此處我們可以使用以下代碼切換到目錄

$ cd ~/Desktop/tensorboard

接下來運(yùn)行：

$ tensorboard --logdir="./graphs" —port 6006

這將為你生成一個(gè)鏈接。ctrl+左鍵單擊該鏈接（或?qū)⑵鋸?fù)制到瀏覽器中，或只需打開瀏覽器并轉(zhuǎn)到 http://localhost:6006/）。接下來將顯示 TensorBoard 頁面，如下所示：

參數(shù)存儲(chǔ)與加載

在基礎(chǔ)部分中，最后還介紹了模型參數(shù)的保存與恢復(fù)。一般 TensorFlow 模型持久化可使用 tf.train.Saver() 完成，它會(huì)將 TensorFlow 模型保存為 .ckpt 格式的文件。一般該文件目錄下會(huì)有三個(gè)文件，第一個(gè) model.ckpt.meta 保存了 TensorFlow 計(jì)算圖的結(jié)構(gòu)，第二個(gè) model.ckpt 文件保存了 TensorFlow 中每一個(gè)變量的取值，而最后一個(gè) cheekpoint 文件保存了同目錄下所有的模型文件列表。

為了保存和恢復(fù)模型變量，我們需要在構(gòu)建計(jì)算圖后調(diào)用 tf.train.Saver()，例如：

# create the graph

X = tf.placeholder(..)

Y = tf.placeholder(..)

w = tf.get_variale(..)

b = tf.get_variale(..)

...

loss = tf.losses.mean_squared_error(..)

optimizer = tf.train.AdamOptimizer(..).minimize(loss)

...

saver = tf.tfain.Saver()

在訓(xùn)練模式中，我們需要打開會(huì)話初始化變量和運(yùn)行計(jì)算圖，并在訓(xùn)練結(jié)束時(shí)調(diào)用 saver.save() 保存變量：

# TRAIN

with tf.Session() as sess:

? ? sess.run(tf.globale_variables_initializer())

? ? # train our model

? ? for step in range(steps):

? ? ? ? sess.run(optimizer)

? ? ? ? ...

? ? saved_path = saver.save(sess, "./my-model", global_step=step)

在測(cè)試模式中，我們需要使用 saver.restore() 恢復(fù)參數(shù)：

# TEST

with tf.Session() as sess:

? ? saver.restore(sess, "./my-model")

? ? ...

當(dāng)然，模型持久化還有非常多的內(nèi)容，例如由 MetaGraphDef Protocol Buffer 定義的計(jì)算圖節(jié)點(diǎn)元數(shù)據(jù)。

歡迎加入本站公開興趣群

商業(yè)智能與數(shù)據(jù)分析群

興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價(jià)值的辦法，實(shí)際應(yīng)用案例分享與討論，分析工具，ETL工具，數(shù)據(jù)倉庫，數(shù)據(jù)挖掘工具，報(bào)表系統(tǒng)等全方位知識(shí)

QQ群：81035754

云服務(wù)器 GPU云服務(wù)器 tensorflow從入門到精通說起分布式存儲(chǔ)大家可能都會(huì)覺得這是一個(gè) tensorflow入門教程 tensorflow入門

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://www.ezyhdfw.cn/yun/4781.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

AlphaWatch

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

繼電器的工作原理

閱讀 2478·2021-11-16 11:44
嵌入式系統(tǒng)基礎(chǔ)知識(shí)總結(jié)

閱讀 2014·2021-10-12 10:12
云主機(jī)怎么連接-云主機(jī)怎么使用？

閱讀 2304·2021-09-22 15:22
racknerd，便宜vps補(bǔ)貨，$9.49/年，1核/768M內(nèi)存/12G SSD/2T流量/1G

閱讀 3073·2021-08-11 11:17
前端每日實(shí)戰(zhàn)：150# 視頻演示如何用 CSS 和 D3 創(chuàng)作一個(gè)集體舞動(dòng)畫

閱讀 1573·2019-08-29 16:53
帶你徹底了解CSS浮動(dòng)（文字整理版）

閱讀 2715·2019-08-29 14:09
js插件講解_javascript原生日歷插件講解

閱讀 3533·2019-08-29 14:03
說說動(dòng)畫卡頓的解決方案

閱讀 3405·2019-08-29 11:09

亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！

從框架優(yōu)缺點(diǎn)說起，這是一份TensorFlow入門極簡教程

相關(guān)文章

深度學(xué)習(xí)

分享AI有道干貨 | 126 篇 AI 原創(chuàng)文章精選（ML、DL、資源、教程）

發(fā)表評(píng)論

0條評(píng)論

AlphaWatch

男|高級(jí)講師

TA的文章

繼電器的工作原理

嵌入式系統(tǒng)基礎(chǔ)知識(shí)總結(jié)

云主機(jī)怎么連接-云主機(jī)怎么使用？

racknerd，便宜vps補(bǔ)貨，$9.49/年，1核/768M內(nèi)存/12G SSD/2T流量/1G

前端每日實(shí)戰(zhàn)：150# 視頻演示如何用 CSS 和 D3 創(chuàng)作一個(gè)集體舞動(dòng)畫

帶你徹底了解CSS浮動(dòng)（文字整理版）

js插件講解_javascript原生日歷插件講解

說說動(dòng)畫卡頓的解決方案

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！

從框架優(yōu)缺點(diǎn)說起，這是一份TensorFlow入門極簡教程

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！

從框架優(yōu)缺點(diǎn)說起，這是一份TensorFlow入門極簡教程