亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

深度學(xué)習(xí)如何改變?nèi)粘I睿縉etflix、Yelp、等是這么做到的

Darkgel / 2718人閱讀

摘要:不同平臺(tái)的不同表情和雅虎視覺(jué)與機(jī)器學(xué)習(xí)團(tuán)隊(duì)測(cè)試了三種不同的方法算法,一種快速線性分類器算法,一種循環(huán)神經(jīng)網(wǎng)絡(luò)架構(gòu)算法,一種平衡性能與復(fù)雜性的卷積網(wǎng)絡(luò)。雅虎不是將機(jī)器學(xué)習(xí)應(yīng)用于的公司。

周末想在Netflix看場(chǎng)電影?可能,你選擇觀看的電影正受到來(lái)自Netflix復(fù)雜的AI算法的影響。同理,由深度學(xué)習(xí)驅(qū)動(dòng)的預(yù)測(cè)技術(shù),將越來(lái)越便捷地決定你喜歡吃什么、穿什么。

而作為消費(fèi)型科技公司,Netflix、Yelp、Yahoo、StitchFix這4家公司正在利用AI技術(shù)改變用戶體驗(yàn)。

Netflix:動(dòng)態(tài)個(gè)性化布局與視頻縮略圖

從觀看傳統(tǒng)上來(lái)講,看電視是一個(gè)單向的通信方式——觀眾觀看到的內(nèi)容是制作者單向傳遞的,但觀眾不向內(nèi)容制作者提供反饋。借助數(shù)字流媒體技術(shù),觀眾的觀看記錄、鼠標(biāo)(手指)點(diǎn)擊,以及檢索詞,都可以讓Netflix了解觀眾的偏好設(shè)置,并提供更多相關(guān)的內(nèi)容。

2009年,Netflix在公開(kāi)賽中為外部的編程團(tuán)隊(duì)授予了100萬(wàn)美元的Netflix獎(jiǎng),以改進(jìn)公司的內(nèi)部評(píng)級(jí)預(yù)測(cè)系統(tǒng)。該獲勝隊(duì)伍打敗了原有的算法,效果提高超過(guò)10%。

Tony Jebara

從那時(shí)起,Netflix引入了更多先進(jìn)的機(jī)器學(xué)習(xí)算法,讓Netflix在排名、布局、目錄、會(huì)員等各個(gè)方面,實(shí)現(xiàn)全新的預(yù)測(cè),并提高個(gè)性化水平。今年年初,Netflix公司董事、哥倫比亞計(jì)算機(jī)科學(xué)系教授Tony Jebara在舊金山的RE?WORK深度學(xué)習(xí)峰會(huì)(RE?WORK Deep Learning Summit in San Francisco)上曾解釋說(shuō),Netflix不僅可以給用戶推薦更好的電影,而且為每個(gè)用戶預(yù)測(cè)出更好的縮略圖圖像。

圖片來(lái)源:Netflix

一般來(lái)說(shuō),優(yōu)化網(wǎng)站上的圖像需要在一段時(shí)間內(nèi)測(cè)試A / B兩種替代方案。這種方法的問(wèn)題是,用戶必須痛苦地等待系統(tǒng)收集數(shù)據(jù),之后才能完成較佳決策。在此期間,網(wǎng)站的部分受眾群體會(huì)經(jīng)歷測(cè)試過(guò)程的非最優(yōu)變量。這種體驗(yàn)的喪失被稱為“regret”。

圖片作者:Tony Jebara

為了較大限度地減少regret,Netflix采用動(dòng)態(tài)自適應(yīng)測(cè)試法,比如多臂老虎機(jī)(multi-arm bandit)模型。這種模型能夠在測(cè)試期間,動(dòng)態(tài)地將流量轉(zhuǎn)移為展示較好的廣告素材,并在數(shù)學(xué)上減少regret。

什么算是“更好”呢?每個(gè)人不盡相同,所以Netflix也將用戶的消費(fèi)情況納入,以執(zhí)行個(gè)性化的探索/開(kāi)發(fā)優(yōu)化。如果你經(jīng)??聪矂?,Netflix將使用羅賓?威廉姆斯的電影《心靈捕手》的封面。如果用戶喜歡浪漫的言情片,Netflix則會(huì)把電影中馬特?達(dá)蒙和明妮?德瑞弗接吻的照片推送給用戶。

Yelp使所有地點(diǎn)展示最美麗的照片

一張圖片勝過(guò)千言萬(wàn)語(yǔ)。為了幫助用戶做出正確的餐廳選擇,Yelp的Alex Miller和他的團(tuán)隊(duì)采用深度學(xué)習(xí)算法,用來(lái)展示最美的用戶照片。

雖然指標(biāo)(比如喜歡次數(shù)和點(diǎn)擊次數(shù))可用于評(píng)估照片,但它們也可能因偶然事件出錯(cuò)。更好的解決方案是,基于固有的內(nèi)容和特征(例如景深,對(duì)比度和對(duì)準(zhǔn))來(lái)判斷照片,但是每天有2500萬(wàn)MAU(每月活躍用戶)給Yelp上傳成千上萬(wàn)張照片,沒(méi)有人能干得了這些工作。

2017年1月27日,在舊金山舉行的Startup ML會(huì)議上,Miller介紹了他的工程團(tuán)隊(duì)如何使用CNN(卷積神經(jīng)網(wǎng)絡(luò))建立一個(gè)圖像評(píng)分模型。對(duì)于照片是不是好的標(biāo)準(zhǔn)可以是,這張照片是不是用單反拍的,這只需要檢測(cè)EXIF元數(shù)據(jù)就行了。

Miller的團(tuán)隊(duì)利用它創(chuàng)建出可擴(kuò)展的訓(xùn)練數(shù)據(jù)集,使用單反圖像作為正例,而非單反圖像作為負(fù)例。深度學(xué)習(xí)算法從訓(xùn)練數(shù)據(jù)集中學(xué)習(xí)了好的照片的質(zhì)量,并且可以將這些學(xué)習(xí)應(yīng)用于所有照片,無(wú)論是否是使用單反相機(jī)拍攝的。

除了照片質(zhì)量得分,團(tuán)隊(duì)還添加了過(guò)濾器和多元化邏輯,這樣,當(dāng)你查看以某一菜或特色聞名的餐館時(shí),前10張照片不會(huì)都是同一主題。

?

事實(shí)勝于雄辯,我們來(lái)看看圖片查看結(jié)果:

上圖是舊版本,下圖是版本

雅虎確保用戶在任何情況

可以選擇較好的表情符號(hào)

對(duì)于不愛(ài)打字的人來(lái)說(shuō),emoji是最簡(jiǎn)單的方法。但是,emoji目前有超過(guò)1800種表情符號(hào)可供選擇,那么,用戶怎么能確定選擇最完美的那個(gè)呢?

雅虎的機(jī)器學(xué)習(xí)工程師Stacey Svetlichnaya就在解決這些問(wèn)題。當(dāng)用戶撰寫或回復(fù)消息時(shí),自動(dòng)填充建議中應(yīng)顯示哪些表情呢?理想情況下,用戶希望可以給出前五個(gè)表情符號(hào)來(lái)選擇。

使用表情符號(hào)是高度動(dòng)態(tài)的。一些用于替換圖像,還有的用于表達(dá)情感……

另一個(gè)挑戰(zhàn)是emoji在不同平臺(tái)的視覺(jué)風(fēng)格迥然不同,容易造成誤解。

?不同平臺(tái)的不同emoji表情

Svetlichnaya和雅虎視覺(jué)與機(jī)器學(xué)習(xí)團(tuán)隊(duì)(Yahoo Vision & Machine Learning Team)測(cè)試了三種不同的方法:

FastText算法,一種快速線性分類器;

LSTM算法,一種循環(huán)神經(jīng)網(wǎng)絡(luò)架構(gòu);

WordCNN算法,一種平衡性能與復(fù)雜性的卷積網(wǎng)絡(luò)。

當(dāng)然,三者之中,F(xiàn)astText不出意外地成為了速度的勝利者,但人們似乎更喜歡LSTM的結(jié)果。

雅虎不是將機(jī)器學(xué)習(xí)應(yīng)用于emoji的公司。2015年,InstagramEngineering刊發(fā)了一套由工程師Thomas Dimson撰寫的系列——Emojineering:機(jī)器學(xué)習(xí)表情符號(hào)趨勢(shì)。

系列文章地址:

https://engineering.instagram.com/emojineering-part-1-machine-learning-for-emoji-trendsmachine-learning-for-emoji-trends-7f5f9cb979ad#.wppfkra4e

StitchFix更快地找到最適合你的時(shí)尚

時(shí)尚是件很難的事,但StitchFix使造型這件事變得很輕松。這家個(gè)性化造型創(chuàng)業(yè)公司使用戶可以個(gè)性化風(fēng)格,并且每月將精選的服裝和配件送上家門。

定義風(fēng)格可能是模糊的。畢竟,用戶怎么能知道一件襯衫是否復(fù)古,或者一件衣服是否“性感”但又不顯得“太放蕩”。

?

Christopher Moody

Moody是StitchFix的數(shù)據(jù)科學(xué)家,擁有統(tǒng)計(jì)學(xué)、天體物理學(xué)和計(jì)算機(jī)學(xué)的多學(xué)科學(xué)術(shù)背景。事實(shí)證明,“書(shū)呆子”的學(xué)術(shù)技能在時(shí)尚界是大有可為的。

許多深度學(xué)習(xí)模型是“黑匣子”,用戶很難理解為什么算法得出特定的結(jié)論。Moody的研究集中于提高模型可解釋性,使人類專家能夠?qū)λ惴ǖ南鄬?duì)性能提供反饋。

一種方法是使用t-SNE(t分布的隨機(jī)相鄰嵌入),一種有助于降低可視化相似對(duì)象的維數(shù)的方法。許多深度學(xué)習(xí)模型使用人類不可能概念化的高維數(shù)據(jù),維數(shù)減少方法將復(fù)雜的數(shù)據(jù)變成更易于理解的二維或三維散點(diǎn)圖。

Moody也是k-SVD方法的狂熱者。 k-SVD是k均值聚類方法的泛化。在高級(jí)非技術(shù)術(shù)語(yǔ)中,聚類分析指將具有類似屬性的對(duì)象分組在一起。一旦已經(jīng)識(shí)別出不同的集群,人類專家可以檢查組合,以查看它們是否表現(xiàn)出任何統(tǒng)一的特征,并添加適當(dāng)?shù)臉?biāo)簽,例如“背心”。

圖片作者:Christopher Moody

歡迎加入本站公開(kāi)興趣群

商業(yè)智能與數(shù)據(jù)分析群

興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價(jià)值的辦法,實(shí)際應(yīng)用案例分享與討論,分析工具,ETL工具,數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)挖掘工具,報(bào)表系統(tǒng)等全方位知識(shí)

QQ群:81035754

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://www.ezyhdfw.cn/yun/4471.html

相關(guān)文章

  • 美國(guó)“大眾點(diǎn)評(píng)網(wǎng)”Yelp如何利用深度學(xué)習(xí)對(duì)美食照片進(jìn)行評(píng)分

    摘要:結(jié)果,我們當(dāng)時(shí)非常抱以厚望的就是卷積神經(jīng)網(wǎng)絡(luò)模型,或者說(shuō)是。單反相機(jī)可以讓攝影師調(diào)節(jié)透鏡類型和光圈大小,更好地控制把相片里的哪個(gè)部分作為焦點(diǎn)。更進(jìn)一步,單反相機(jī)的傳感器更大,對(duì)光線更敏感,即使在非?;璋档沫h(huán)境下也可以拍出非常漂亮的相片。 Yelp的數(shù)據(jù)庫(kù)中已經(jīng)存儲(chǔ)了幾千萬(wàn)張相片,用戶們現(xiàn)在每天都會(huì)上傳大概十萬(wàn)張,而且速度還在不斷加快。事實(shí)上,我們發(fā)現(xiàn)相片的上傳增長(zhǎng)率大于相片的查看率。這些相片...

    legendmohe 評(píng)論0 收藏0
  • Yelp如何使用深度學(xué)習(xí)對(duì)商業(yè)照片進(jìn)行分類

    摘要:構(gòu)建一個(gè)照片分類器對(duì)于理解照片中的模棱兩可的目標(biāo),其實(shí)有許多不同的方式。如果決定進(jìn)一步集成依賴于其它信號(hào)的新的分類器,這將讓問(wèn)題變得更加簡(jiǎn)單。該架構(gòu)如下圖所示對(duì)于每一個(gè)新的分類器,掃描所有的照片,并且將分類結(jié)果存儲(chǔ)在一個(gè)數(shù)據(jù)庫(kù)中。 Yelp是美國(guó)較大點(diǎn)評(píng)網(wǎng)站,擁有世界各地的Yelper上傳的成千上萬(wàn)的照片。各種各樣的照片給進(jìn)入當(dāng)?shù)氐纳虡I(yè)提供了一個(gè)豐富的窗口。通過(guò)開(kāi)發(fā)一個(gè)照片理解系統(tǒng)使Yelp...

    Alan 評(píng)論0 收藏0
  • 深度解讀云計(jì)算將如何改變我們生活

    摘要:云計(jì)算革的命性不僅僅是針對(duì)企業(yè),同時(shí)也影響著我們的日常生活。因此云計(jì)算正在改善著我們的生活,或至少在某些方面改變著我們的生活。所以組織和企業(yè)為提升發(fā)展速度將擁抱云計(jì)算,以保持競(jìng)爭(zhēng)力,這甚至可能使自身企業(yè)成為市場(chǎng)的領(lǐng)導(dǎo)者。 在過(guò)去的十年中,計(jì)算機(jī)趨勢(shì)像互聯(lián)網(wǎng)與全球化趨勢(shì)轉(zhuǎn)變。這使得世界各地的人們,通過(guò)匿名聊天室和網(wǎng)上論壇等方式進(jìn)行互動(dòng)。而現(xiàn)在隨著社交網(wǎng)絡(luò)的普 及,匿名正在慢慢消失。這是在社交方...

    whlong 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<