亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

Google內(nèi)部案例分享 | 是如何構建定制化TensorFlow預測系統(tǒng)的?

Batkid / 2813人閱讀

摘要:預測事件本質(zhì)上是我們通過機器學習預測系統(tǒng),創(chuàng)造出來的一個假想事件,并根據(jù)預測閾值的不同,可以在下載安裝及最終付費之間做優(yōu)化調(diào)節(jié)。目前,此機器學習系統(tǒng)已在行業(yè)內(nèi)上線,每天會分析預測上百萬用戶,幫助他們優(yōu)化游戲內(nèi)及廣告體驗。

近年來,移動端游戲隨著智能手機技術的發(fā)展,越來越成為人們娛樂休閑的新模式。據(jù) NewZoo 數(shù)據(jù)調(diào)查研究發(fā)現(xiàn),全球手機端游戲已達到 21 億玩家規(guī)模,呈 14% 同比年增長趨勢,其中大部分玩家有在游戲中付費的經(jīng)歷。

對于 SLG 策略類型手機游戲,由于前期用戶需要時間了解及熟練游戲操作,即使有付費傾向,一般也會比較滯后。這種滯后為游戲的內(nèi)部運營,市場投放效果的衡量及優(yōu)化帶來了很大挑戰(zhàn)。本文基于一款日活 600 萬的明星 SLG 游戲,根據(jù)游戲內(nèi)用戶的 500+ 個特征行為,對未付費用戶在下載安裝后 28 天內(nèi)是否會轉(zhuǎn)化為付費用戶加以預測。

文章盡量避免涉及過多的技術細節(jié),主要從系統(tǒng)架構的角度加以闡述,如何自動化一套機器學習預測系統(tǒng)并與 Google UAC (通用應用廣告平臺) 相結合,最終提高 7 倍轉(zhuǎn)化率,2.6 倍投資回報率,降低 63% 付費用戶獲取成本。

數(shù)據(jù)準備

數(shù)據(jù)包括兩部分, 預測目標 Y 及用戶參數(shù) X,其中用戶參數(shù) X 又分為狀態(tài)參數(shù) Xs 和行為參數(shù) Xb。

原始數(shù)據(jù)符合如下模板:

其中,每行數(shù)據(jù)為每一位用戶每天的行為參數(shù)匯總和狀態(tài)快照。如若用戶當天未登錄,則不需記錄當天狀態(tài)或行為。如果用戶前 n-1 天未付費,在第 n 天發(fā)生付費轉(zhuǎn)化,則該用戶有 n 行數(shù)據(jù) (假設用戶每天登陸)。

狀態(tài)參數(shù) (當天零點快照) 包括但不限于,游戲內(nèi)人物等級,游戲內(nèi)金幣數(shù)量,登陸游戲手機品牌,登陸游戲地點等。

行為參數(shù)包括但不限于 (推薦四種對預測付費最重要的行為,其他行為越多越好):

付費相關類行為:打開付費窗口,點擊付費按鈕(還未確認付費成功)

游戲幣購買物品:這里物品可縮小范圍到游戲的核心追求品類,如皮膚,武器等

社交行為:是否加入公會,在團隊發(fā)言次數(shù),社交賬號分享等

打折類行為:打開打折商店等

對原始數(shù)據(jù)處理后,得到如下數(shù)據(jù) (假設模型目標是基于未付費用戶下載后 7 天行為預測下載后 28 天內(nèi)是否會付費):

預測目標 Y:如果用戶下載游戲后 28 天內(nèi)發(fā)生付費轉(zhuǎn)化,則為 1,否則為 0

用戶參數(shù) X:假設原始數(shù)據(jù)中對于用戶 i, 有 j 行數(shù)據(jù),經(jīng)過處理后每個用戶只有一行數(shù)據(jù)

注 1:推薦取 7 天以內(nèi)行為作預測基礎,這樣可以在用戶下載安裝 APP 后七天內(nèi)產(chǎn)生預測,進而及時把預測信號發(fā)送給 Google UAC 廣告投放平臺,便于 UAC 平臺內(nèi)的機器學習。

注 2:推薦取 28 天內(nèi)的付費作預測目標,這樣便于在一個月內(nèi)完成預測效果及 Google UAC 廣告平臺投放效果的衡量。

數(shù)據(jù)清洗與特征工程

對數(shù)據(jù)進行清洗

用 0 填充所有缺失值

以列為單位,標準化變形。sklearn.preprocessing.StandardScaler

主成分分析 PCA:降維到原緯度數(shù)量的一半。

經(jīng)過數(shù)據(jù)清洗和特征工程處理后,得到如下數(shù)據(jù)(假設模型目標是基于未付費用戶下載后7天行為預測下載后 28 天內(nèi)會不會付費):

將處理后的數(shù)據(jù)按 1:1 分成兩部分,train 和 test

預測目標沒有變化,即 Y_noTransform_train, Y_noTransform_test:如果用戶下載游戲后 28 天內(nèi)付過費,則為 1,否則為 0;

相對應的用戶參數(shù)經(jīng)過變形,即 X_transformed_train, X_transformed_test;每個用戶一行數(shù)據(jù),但經(jīng)過 PCA 降維之后,很難理解X中每一列代表什么行為。

基于TensorFlow深度神經(jīng)網(wǎng)絡分類器建模

創(chuàng)建分類器

設計系統(tǒng)時,選擇調(diào)用 tensorflow Python API,直接建立 DNNClassifier 對象,省去了大量從底層開始架構模型的時間。對解決簡單分類問題很有效,推薦給大家。

classifier = tf.estimator.DNNClassifier()

訓練分類器

調(diào)用 DNNClassifier 對象的 fit 函數(shù),建立訓練模塊。

classifier.fit(X_transformed_train, Y_noTransform_train, steps=2000, batch_size=5000)

分類器預測

調(diào)用 DNNClassifier 對象的 predict 函數(shù),建立預測模塊。輸出為 0 或 1,0 代表分類器認為轉(zhuǎn)化概率低于 50%,即不會付費轉(zhuǎn)化,1 代表分類器認為轉(zhuǎn)化概率大于等于 50%,即大概率付費轉(zhuǎn)化。50% 為 predict 函數(shù)默認的缺省閾值,如需改變此閾值,則要調(diào)用 predict_proba 函數(shù),輸出為轉(zhuǎn)化概率,而不再是 0 或 1。

Y_predict = classifier.predict(X_transformed_test)

分類器驗證

Y_predict 和 Y_noTransform_test 都是真對同一批測試者,前者為預測值,后者為實際值。通過比較得出 Precision 和 Recall,以此衡量預測模型的準確度。如果用于 Google 廣告平臺的投放,則 Recall 比 Precision 重要,應盡量提高 Recall。如果用戶內(nèi)部運營,則 Precision 比 Recall 重要,應盡量提高 Precision。

其中 precision 代表精度,recall 代表廣度。f1 是綜合考慮 precision,recall 的整體參數(shù)。具體定義如下:

經(jīng)過多次調(diào)參迭代,模型性能如下所示,

注:藍色豎虛線與 x 軸的交點是使 f1 達到較高點的預測概率的取值

系統(tǒng)設計

系統(tǒng)基于 Google Cloud Platform,簡稱 GCP,進行架構。激活了 GCP 中三個組件,BigQuery, Compute Engine 和 Storage。每天,基于游戲內(nèi)新產(chǎn)生的數(shù)據(jù)運行“預測模塊”,對每個用戶加以評估,是否會付費轉(zhuǎn)化。每季度初,基于過去 120 天內(nèi)注冊的用戶數(shù)據(jù)運行“訓練模塊”,對模型加以更新。這里采用了混合數(shù)據(jù)集的方法,即90天新數(shù)據(jù),30 天老數(shù)據(jù),以保證模型和谷歌廣告投放平臺的合作順暢。

每季度

每天

預測結果在 Google UAC 廣告平臺的應用

Univeral App Campaign 即通用應用廣告系列(以下簡稱 UAC),是 Google 開發(fā)的基于大數(shù)據(jù)和機器學習的移動端應用廣告投放平臺。旨在幫助用戶簡化廣告投放流程,更輕松地在 Google 用戶量最多的各款產(chǎn)品和服務(包括 Google 搜索、Google Play、YouTube 和 Google 展示廣告網(wǎng)絡)中宣傳自己的應用 APP。用戶只需添加幾行文字、設置出價、提供一些素材資料,系統(tǒng)會自動優(yōu)化其余部分(包括具體廣告的設計、廣告投放的目標定位和出價等),從而幫助用戶推廣應用 APP。

目前有三個版本,根據(jù)推廣目標不同,分別為以提升 APP 下載安裝量為目標、提升 APP 內(nèi)事件觸發(fā)頻次為目標和提升 APP 內(nèi)用戶價值為目標。本文主要應用在 UAC 的第二個版本,以提升 APP 內(nèi)事件觸發(fā)頻次為目標。

APP 內(nèi)的事件多種多樣,游戲內(nèi)充值付費(以下簡稱 IAP,In-App-Purchase)應屬最簡單明了也最便于嘗試的事件之一。大多數(shù)用戶都有測試,但效果有好有壞,究竟是什么因素導致了效果的不同?有沒有一種方法可以提升 UAC 廣告投放效果?本文希望通過對大量投放經(jīng)驗的總結,提出一種基于預測付費用戶的新的 UAC 廣告投放方式,用于高質(zhì)量的新用戶獲取。

如之前章節(jié)所述,最后得出的預測結果應為兩列數(shù)據(jù),DeviceID 及預測標簽 (0 或1)。取決于預測概率閾值的不同,被標記為 1 (有付費傾向) 的用戶數(shù)量及準確度也會不同。閾值越高,被標記為 1 的要求越苛刻,既被認為有付費傾向的用戶數(shù)量越少,準確度越高,如圖二所示。當閾值達到較高 100%,則預測事件等同于實際付費事件;當閾值達到較低 0%,則預測事件等同于 APP 安裝事件?!邦A測事件”本質(zhì)上是我們通過機器學習預測系統(tǒng),創(chuàng)造出來的一個“假想”事件,并根據(jù)預測閾值的不同,可以在APP下載安裝及最終付費之間做優(yōu)化調(diào)節(jié)。

經(jīng)大量實驗研究發(fā)現(xiàn),如果考慮把預測結果應用在 UAC 上,應盡量調(diào)節(jié)閾值,犧牲一些 precision,使 recall 盡可能高。

如下圖所示,闡述了基于 TensorFlow 的機器學習預測系統(tǒng)與 Google UAC 廣告投放平臺結合的工作原理。左邊藍色的部分為本文搭建的預測系統(tǒng),右側(cè)綠色的部分為 UAC 系統(tǒng)。通過分析預測,找出潛在付費用戶,擴大了發(fā)送給 UAC 的種子人群數(shù)量,縮短了從 APP 安裝到有效轉(zhuǎn)化發(fā)生的效果回饋時間,進而提升了 UAC 機器學習和廣告投放的效果。

注:用戶需要思考是否充值付費的時間越長,潛在付費用戶群體越大

結論及未來展望

本文通過對行業(yè)背景的分析,提出了策略類手機游戲面臨的挑戰(zhàn)。并從系統(tǒng)架構的角度,介紹了如何對數(shù)據(jù)進行清理、特征工程、預測分類器的建模及系統(tǒng)自動化。其中,數(shù)據(jù)的搜集處理對模型的準確性及應用性有很大影響。文章也給出了四種對預測游戲內(nèi)付費有重要影響的行為參數(shù),并通過 PCA 主成分分析的特征降維方法,極大提高了模型的性能。另外,通過調(diào)節(jié)預測轉(zhuǎn)化概率的閾值,可在精度和廣度之間作以取舍,使模型的預測結果適用于不同的領域。

目前,此機器學習系統(tǒng)已在行業(yè)內(nèi)上線,每天會分析預測上百萬用戶,幫助他們優(yōu)化游戲內(nèi)及廣告體驗。預測是為了更好地了解用戶,進而更有效率地幫助用戶。預測結果可對用戶加以分層,可應用于內(nèi)部運營、市場再營銷、新用戶獲取等領域。在此案例中,通過把機器學習系統(tǒng)與 Google UAC 廣告平臺的結合,在新用戶獲取領域極大的提高了用戶質(zhì)量,使付費率提高了 7 倍,投資回報率提高了 2.6 倍。關于具體實施的細節(jié),如感興趣,請聯(lián)系您的 Google Awords 賬戶經(jīng)理,我們很樂意與您分享相關經(jīng)驗,這里不再贅述。

未來,我們會對用戶終身價值 pltv 加以建模研究,期望基于用戶的行為及付費數(shù)據(jù),預測用戶未來在游戲內(nèi)的活躍時間及終身價值。這樣可以幫助我們更細顆粒度地區(qū)分用戶,構建千人千面的用戶體驗。

歡迎加入本站公開興趣群

商業(yè)智能與數(shù)據(jù)分析群

興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價值的辦法,實際應用案例分享與討論,分析工具,ETL工具,數(shù)據(jù)倉庫,數(shù)據(jù)挖掘工具,報表系統(tǒng)等全方位知識

QQ群:81035754

文章版權歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://www.ezyhdfw.cn/yun/4761.html

相關文章

  • Move Mirror:使用 TensorFlow.js 在瀏覽器中預測姿勢之 AI 實驗

    摘要:文和,創(chuàng)意實驗室創(chuàng)意技術專家在機器學習和計算機視覺領域,姿勢預測或根據(jù)圖像數(shù)據(jù)探測人體及其姿勢的能力,堪稱最令人興奮而又最棘手的一個話題。使用,用戶可以直接在瀏覽器中運行機器學習模型,無需服務器。 文 / ?Jane Friedhoff 和 Irene Alvarado,Google 創(chuàng)意實驗室創(chuàng)意技術專家在機器學習和計算機視覺領域,姿勢預測或根據(jù)圖像數(shù)據(jù)探測人體及其姿勢的能力,堪稱最令人興...

    MiracleWong 評論0 收藏0
  • TensorFlow開源2年官方回顧】下一個重要方向分布式模型服務

    摘要:自從年月開源以來,我們做了一些重大改進?,F(xiàn)在,讓我們再回到這個項目開始的地方,回顧我們的進展過程,并分享我們下一步的方向。 自從2016年2月 TensorFlow Serving 開源以來,我們做了一些重大改進?,F(xiàn)在,讓我們再回到這個項目開始的地方,回顧我們的進展過程,并分享我們下一步的方向。在 TensorFlow Serving 啟動之前,谷歌公司內(nèi)的 TensorFlow 用戶也必須...

    morgan 評論0 收藏0
  • TensorFlow-dev-summit:那些TensorFlow上好玩和黑科技

    摘要:現(xiàn)場宣布全球領先的深度學習開源框架正式對外發(fā)布版本,并保證的本次發(fā)布版本的接口滿足生產(chǎn)環(huán)境穩(wěn)定性要求。有趣的應用案例皮膚癌圖像分類皮膚癌在全世界范圍內(nèi)影響深遠,患病人數(shù)眾多,嚴重威脅身體機能。 前言本文屬于介紹性文章,其中會介紹許多TensorFlow的新feature和summit上介紹的一些有意思的案例,文章比較長,可能會花費30分鐘到一個小時Google于2017年2月16日(北京時間...

    BLUE 評論0 收藏0
  • 計算機視覺中深度學習:技術、市場和5個你想不到未來

    摘要:接下來,介紹了使用深度學習的計算機視覺系統(tǒng)在農(nóng)業(yè)零售業(yè)服裝量身定制廣告制造等產(chǎn)業(yè)中的應用和趨勢,以及在這些產(chǎn)業(yè)中值得關注的企業(yè)。 嵌入式視覺聯(lián)盟主編Brian Dipert今天發(fā)布博文,介紹了2016年嵌入式視覺峰會(Embedded Vision Summit)中有關深度學習的內(nèi)容:谷歌工程師Pete Warden介紹如何利用TensorFlow框架,開發(fā)為Google Translate...

    baukh789 評論0 收藏0

發(fā)表評論

0條評論

Batkid

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<