摘要:近日,峰會(huì)在京盛大開(kāi)幕。所以對(duì)于游戲而言,可將最小可用產(chǎn)品的優(yōu)化目標(biāo)定位在盡快鎖定游戲的高價(jià)值用戶,且鎖定時(shí)間要迅速。第四范式在這方面已經(jīng)做了一些工作,先知平臺(tái)已經(jīng)根據(jù)連續(xù)和離散的數(shù)據(jù)的計(jì)算特性做針對(duì)性的設(shè)計(jì)。
近日,AWS 2017峰會(huì)在京盛大開(kāi)幕。第四范式互聯(lián)網(wǎng)業(yè)務(wù)負(fù)責(zé)人周開(kāi)拓受邀出席,并發(fā)表了“打造人工智能MVP”的主題演講,分享了企業(yè)高效、快速地向人工智能轉(zhuǎn)型的寶貴經(jīng)驗(yàn)。周開(kāi)拓曾任職于淘寶網(wǎng),負(fù)責(zé)在線推薦系統(tǒng)的設(shè)計(jì)和算法工作,加入第四范式之后,基于第四范式核心產(chǎn)品“先知”,孵化了面向中小企業(yè)的公有云版機(jī)器學(xué)習(xí)服務(wù),致力于完成內(nèi)容推薦、電商推薦、精準(zhǔn)營(yíng)銷、計(jì)算廣告等關(guān)鍵業(yè)務(wù)的AI轉(zhuǎn)型。
快速定位機(jī)器學(xué)習(xí)的MVP
在移動(dòng)互聯(lián)網(wǎng)領(lǐng)域,最容易被接受的一個(gè)概念便是最小可用產(chǎn)品(MVP),即開(kāi)發(fā)團(tuán)隊(duì)、設(shè)計(jì)團(tuán)隊(duì)用最小的成本、冒最小的風(fēng)險(xiǎn),最大程度去驗(yàn)證產(chǎn)品的可行性——這個(gè)產(chǎn)品的可行性,是指這個(gè)需求是否真實(shí)存在,當(dāng)前產(chǎn)品解決這個(gè)需求的方向是否是正確的。機(jī)器學(xué)習(xí)亦是如此,企業(yè)對(duì)于機(jī)器學(xué)習(xí)的投入是長(zhǎng)期、持續(xù)的,帶來(lái)的收入和回報(bào)也是巨大的,但在此之前,企業(yè)更希望用較低的成本去驗(yàn)證:引入機(jī)器學(xué)習(xí)是否可以帶來(lái)業(yè)務(wù)指標(biāo)的提升,產(chǎn)生價(jià)值的潛力有多大。
以較為經(jīng)典的推薦系統(tǒng)為例,數(shù)據(jù)科學(xué)家往往會(huì)從點(diǎn)擊、購(gòu)買、收藏、轉(zhuǎn)發(fā)分享等來(lái)表達(dá)用戶是否喜歡推薦的商品。為了簡(jiǎn)化目標(biāo),可以選擇點(diǎn)擊作為最小可用產(chǎn)品的優(yōu)化方向,因?yàn)辄c(diǎn)擊是所有事情發(fā)生的前提,且點(diǎn)擊率容易得到較好的優(yōu)化效果。而在游戲運(yùn)營(yíng)方面,其目標(biāo)主要是盡可能延長(zhǎng)玩家停留的時(shí)間,并且吸引玩家付費(fèi),故提高用戶留存率便是重中之重。但由于留存率更多地由游戲本身的可玩性和玩家的興趣喜好決定,可干預(yù)性不高,所以留存率較難影響。盡管整體的留存率難干預(yù),但游戲收入都是由極少數(shù)忠實(shí)玩家提供,這部分玩家可以用很強(qiáng)的運(yùn)營(yíng)策略進(jìn)行干預(yù)。所以對(duì)于游戲而言,可將最小可用產(chǎn)品的優(yōu)化目標(biāo)定位在盡快鎖定游戲的高價(jià)值用戶,且鎖定時(shí)間要迅速。
機(jī)器學(xué)習(xí)MVP的關(guān)鍵步驟
在機(jī)器學(xué)習(xí)的項(xiàng)目中,數(shù)據(jù)決定效果的上限;建模、調(diào)參則是達(dá)到上限的過(guò)程。因此數(shù)據(jù)處理、建模、調(diào)參,是成功實(shí)現(xiàn)一個(gè)機(jī)器學(xué)習(xí)MVP至關(guān)重要的步驟。
以往,公司規(guī)模越大的企業(yè)獲取數(shù)據(jù)越麻煩,且在數(shù)據(jù)的使用時(shí),若使用了錯(cuò)誤的方式進(jìn)行拼接,項(xiàng)目后期出現(xiàn)問(wèn)題時(shí),很難debug。所以在項(xiàng)目前期,需要控制項(xiàng)目風(fēng)險(xiǎn)和成本的前提下,盡量使用熟悉、好理解的數(shù)據(jù)。寧可犧牲一些效果,也要避免使用看似有吸引力,但風(fēng)險(xiǎn)更大的數(shù)據(jù)。
對(duì)于數(shù)據(jù)本身來(lái)說(shuō),數(shù)據(jù)的挑選、數(shù)據(jù)是否有預(yù)測(cè)性等,無(wú)需耗費(fèi)過(guò)多的人力去考慮,針對(duì)此類工作目前已經(jīng)有了很成熟的方法和工具,在不違背因果關(guān)系的前提下,我們盡可能地讓機(jī)器去自主完成,此外,真實(shí)的數(shù)據(jù)缺失是正常的,不缺失的數(shù)據(jù)可能才是有問(wèn)題的,我們已經(jīng)有很多方式來(lái)填充缺失值,或者把缺失本身也作為一個(gè)特征。其次,數(shù)據(jù)有離散的、連續(xù)的,比如預(yù)測(cè)一個(gè)游戲玩家是不是高價(jià)值用戶,那么數(shù)據(jù)可能有這個(gè)玩家已經(jīng)消費(fèi)的鉆石、金幣數(shù)量,可能有這個(gè)玩家的職業(yè),甚至是玩家手機(jī)型號(hào),這就要求數(shù)據(jù)處理中能同時(shí)處理這兩類特征。第四范式在這方面已經(jīng)做了一些工作,先知平臺(tái)已經(jīng)根據(jù)連續(xù)和離散的數(shù)據(jù)的計(jì)算特性做針對(duì)性的設(shè)計(jì)。
數(shù)據(jù)選定之后,便開(kāi)始建模。其中,特征組合與調(diào)參是關(guān)鍵。在解決實(shí)際問(wèn)題中,業(yè)界傾向于先使用簡(jiǎn)單的邏輯回歸LR模型,為了模型具備更強(qiáng)的學(xué)習(xí)能力及表達(dá)能力,就需要使特征具備非線性的特性。特征組合便是一種常用且效果明顯的方法。換句話說(shuō),特征組合是一種加強(qiáng)特征描述能力,提升模型預(yù)測(cè)效果的方法。然而,想要獲得特征組合并非易事,需要數(shù)據(jù)科學(xué)家具備極強(qiáng)的機(jī)器學(xué)習(xí)知識(shí)儲(chǔ)備及業(yè)務(wù)理解能力。調(diào)參亦是如此。
事實(shí)上,特征組合與調(diào)參這類重復(fù)性較強(qiáng)且占用時(shí)間較多的工作可以用機(jī)器自動(dòng)完成。在將數(shù)據(jù)科學(xué)家的經(jīng)驗(yàn)固化為產(chǎn)品之后,技術(shù)人員只需設(shè)定好用于組合的基礎(chǔ)特征,以及參數(shù)的類別、次數(shù)即可。目前,第四范式先知平臺(tái)(試用鏈接:https://prophet.4paradigm.com...)依靠自主研發(fā)的FeatureGo算法,實(shí)現(xiàn)了機(jī)器自動(dòng)特征組合、自動(dòng)調(diào)參的功能,解決了以往人為添加組合特征門檻高、耗時(shí)長(zhǎng)等問(wèn)題,大大節(jié)省了建模的時(shí)間。舉個(gè)例子,此前第四范式基于先知平臺(tái)打造了某新聞內(nèi)容平臺(tái)的新聞推薦系統(tǒng),從數(shù)據(jù)基礎(chǔ)開(kāi)始構(gòu)建,收集、分析、挖掘了新聞及用戶等各個(gè)維度的數(shù)據(jù),再通過(guò)自動(dòng)特征工程、自動(dòng)調(diào)參等功能,只耗費(fèi)2周時(shí)間就訓(xùn)練出了特征維度數(shù)十億級(jí)別的模型。最終,該平臺(tái)推薦新聞的點(diǎn)擊率提高35%,顯著提升了用戶的使用體驗(yàn)。
綜上所述,當(dāng)定義好了問(wèn)題的目標(biāo)、邊界,利用現(xiàn)有的數(shù)據(jù)、人員,再配上一個(gè)專業(yè)的工具,一個(gè)機(jī)器學(xué)習(xí)業(yè)務(wù)改造系統(tǒng)的上線可以非??焖佟⒂行?。當(dāng)機(jī)器學(xué)習(xí)技術(shù)真正產(chǎn)生了效果,客戶就知道下一步應(yīng)該如何投入資源,以及應(yīng)該投在什么地方。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://www.ezyhdfw.cn/yun/19638.html
摘要:小企業(yè)遇上了大平臺(tái)即便是在人才濟(jì)濟(jì)的眾多華為云當(dāng)中,劉源仍然相當(dāng)搶眼,原因之一就是他看上去實(shí)在太年輕了。而在本次華為云開(kāi)放日活動(dòng)上,華為云對(duì)開(kāi)發(fā)者的重視更是得到了進(jìn)一步的體現(xiàn)。華為云MVP的使命在華為云攜手眾多合作伙伴打造的開(kāi)發(fā)者生態(tài)中,活躍著這樣一群技術(shù)大咖的身影。這群技術(shù)大咖當(dāng)中,既有優(yōu)先體驗(yàn)產(chǎn)品權(quán)益、反饋產(chǎn)品優(yōu)化建議的產(chǎn)品體驗(yàn)官;也有在公開(kāi)活動(dòng)中,分享技術(shù)經(jīng)驗(yàn)和實(shí)戰(zhàn)經(jīng)驗(yàn)的技術(shù)布道者;還...
摘要:那么,什么樣的機(jī)遇能夠帶來(lái)最好的結(jié)果如何確保能取得成功的結(jié)果呢英特爾為此提出了一套概念驗(yàn)證的解決方案,并且詳細(xì)撰寫了一套白皮書,能夠幫助決策者回答這些問(wèn)題,同時(shí)最大化價(jià)值,最小化風(fēng)險(xiǎn)。 showImg(http://upload-images.jianshu.io/upload_images/13825820-5ded473acf69a9d1.jpg?imageMogr2/auto-o...
摘要:針對(duì)這個(gè)問(wèn)題,第四范式創(chuàng)始人首席執(zhí)行官戴文淵近日就在公司內(nèi)部分享上,向大家介紹了機(jī)器學(xué)習(xí)教材中的七個(gè)經(jīng)典問(wèn)題。所以今天我就想和大家分享一下機(jī)器學(xué)習(xí)教材中的一些經(jīng)典問(wèn)題,希望對(duì)大家今后的工作和學(xué)習(xí)有所幫助。 *如果希望了解機(jī)器學(xué)習(xí),或者已經(jīng)決定投身機(jī)器學(xué)習(xí),你會(huì)第一時(shí)間找到各種教材進(jìn)行充電,同時(shí)在心中默認(rèn):書里講的是牛人大神的畢生智慧,是正確無(wú)誤的行動(dòng)指南,認(rèn)真學(xué)習(xí)就能獲得快速提升。但實(shí)...
閱讀 1381·2019-08-30 15:44
閱讀 2148·2019-08-30 13:49
閱讀 1751·2019-08-26 13:54
閱讀 3568·2019-08-26 10:20
閱讀 3430·2019-08-23 17:18
閱讀 3363·2019-08-23 17:05
閱讀 2199·2019-08-23 15:38
閱讀 1087·2019-08-23 14:35