亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

首次曝光!在線視頻衣物精確檢索技術(shù),開啟刷劇敗明星同款時(shí)代

Chiclaim / 1705人閱讀

摘要:整個(gè)系統(tǒng)采用了目前較先進(jìn)的衣物檢測(cè)和跟蹤技術(shù)。然后對(duì)這些候選框進(jìn)行跟蹤,得到明星同款在視頻中的的運(yùn)動(dòng)軌跡。

《從視頻到電商:視頻衣物較精確檢索》圍繞視頻電商業(yè)務(wù)場(chǎng)景,提出了一個(gè)在線視頻衣物較精確檢索系統(tǒng)。該系統(tǒng)能夠滿足用戶在觀看影視劇時(shí)想要同時(shí)購(gòu)買明星同款的需求。

整個(gè)系統(tǒng)采用了目前較先進(jìn)的衣物檢測(cè)和跟蹤技術(shù)。針對(duì)明星同款檢索中存在的多角度、多場(chǎng)景、遮擋等問(wèn)題,提出可變化的深度樹形結(jié)構(gòu)(ReconfigurableDeep Tree structure)利用多幀之間的相似匹配解決單一幀檢索存在的遮擋、模糊等問(wèn)題。該結(jié)構(gòu)可以認(rèn)為是對(duì)現(xiàn)有attention模型的一種擴(kuò)展,可以用來(lái)解決多模型融合問(wèn)題。

論文技術(shù)在天貓魔盒視頻中應(yīng)用

業(yè)務(wù)場(chǎng)景及研究問(wèn)題:視頻電商中的衣物較精確匹配

早在2014年,阿里與優(yōu)酷土豆發(fā)布視頻電商戰(zhàn)略,稱未來(lái)可以實(shí)現(xiàn)邊看邊買,使得視頻電商的概念,繼微博電商,朋友圈電商之后浮出水面。電商平臺(tái)擁有少量商品,而視頻網(wǎng)站具有巨大的流量,二者結(jié)合是發(fā)展的必然結(jié)果。電商平臺(tái)可以借助視頻網(wǎng)站的流量來(lái)實(shí)現(xiàn)導(dǎo)流和平臺(tái)下沉,而視頻網(wǎng)站則需要通過(guò)廣告點(diǎn)擊和商品成交來(lái)實(shí)現(xiàn)流量變現(xiàn),因此二者的結(jié)合可謂一拍即合。

視頻電商的商業(yè)主旨是打造以視頻為入口的購(gòu)物服務(wù),視頻中出現(xiàn)所有物體都可能是商品,提供包括邊看邊買、明星同款、廣告投放等服務(wù),它集娛樂(lè)、休閑、購(gòu)物于一體,給用戶構(gòu)造出一種“身臨其境”情境營(yíng)銷,或者是明星同款的沖動(dòng)式消費(fèi)。視頻電商目前已經(jīng)不是停留在概念層次了,視頻網(wǎng)站向電商的導(dǎo)流轉(zhuǎn)化也一直在不斷的嘗試中。

?

影視劇中的服飾存在較大的差異性和異構(gòu)性,同一個(gè)目標(biāo)往往展現(xiàn)出較大的差異。服飾購(gòu)物圖像通常具有雜亂、多樣的背景,而且常在戶外拍攝。多樣化的背景可能是建筑物,街道、風(fēng)景、汽車等多種情況。由于自然場(chǎng)景下受到光線、角度、大小、分辨率、幾何學(xué)和光度學(xué)的變化等影響,使得服飾呈現(xiàn)出現(xiàn)的外形極為復(fù)雜,即使是同一件服飾也會(huì)出現(xiàn)變化較大的效果。

同時(shí)在線網(wǎng)站為更好地展示服飾的效果,通常聘請(qǐng)時(shí)尚模特穿著所售商品,模特/人物姿勢(shì)變化也是導(dǎo)致服飾變化的一個(gè)重要因素。由于以上這些因素,使得視頻明星同款搜索成為了一個(gè)極具挑戰(zhàn)性的技術(shù)問(wèn)題。

網(wǎng)絡(luò)結(jié)構(gòu)及技術(shù)細(xì)節(jié)

AsymNet網(wǎng)絡(luò)結(jié)構(gòu):整個(gè)Asymnet深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。當(dāng)用戶通過(guò)機(jī)頂盒(天貓魔盒)觀看視頻時(shí),該網(wǎng)絡(luò)將從電商網(wǎng)站(淘寶、天貓)檢索到與之匹配的衣服,并推薦給用戶。

為忽略復(fù)雜背景對(duì)檢索結(jié)果的影響,更準(zhǔn)確的進(jìn)行服裝定位,我們首先應(yīng)用服飾檢測(cè)技術(shù),提取得到服飾區(qū)域一組候選框。然后對(duì)這些候選框進(jìn)行跟蹤,得到明星同款在視頻中的的運(yùn)動(dòng)軌跡。對(duì)于衣物候選區(qū)域和運(yùn)動(dòng)軌跡我們分別利用用圖像特征網(wǎng)絡(luò)(IFN)和視頻特征網(wǎng)絡(luò)(VFN)進(jìn)行特征學(xué)習(xí)。

考慮到服裝的運(yùn)動(dòng)軌跡,衣物較精確檢索問(wèn)題被定義為不對(duì)稱(多對(duì)單)匹配問(wèn)題,我們提出可變化的深度樹形結(jié)(Reconfigurable Deep Tree Structure),利用多幀之間的相似匹配解決單一幀檢索存在的遮擋、模糊等問(wèn)題。后續(xù)本文將詳細(xì)介紹模型的各個(gè)部分。

圖 1 Asymnet深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

圖像特征網(wǎng)絡(luò)(IFN):傳統(tǒng)CNN網(wǎng)絡(luò)要求輸入圖像為固定的227x227(因?yàn)镃NN網(wǎng)絡(luò)中的卷積層需要有一個(gè)確定的預(yù)定義的維度)。在視頻電商業(yè)務(wù)場(chǎng)景中,因?yàn)橐挛餀z測(cè)候選框?yàn)槿我獯笮?,尺度變化很大,傳統(tǒng)CNN網(wǎng)絡(luò)無(wú)法進(jìn)行有效的特征學(xué)習(xí)。

針對(duì)這一問(wèn)題,我們利用空間金字塔池化結(jié)構(gòu)(SPP)體系結(jié)構(gòu),如圖2所示。它通過(guò)空間池聚合最后一個(gè)卷積層的特征,從而使池區(qū)域的大小與輸入的大小無(wú)關(guān)。

圖 2 Asymnet圖像特征網(wǎng)絡(luò)(IFN)

視頻特征網(wǎng)絡(luò) (VFN):為了更好的考慮視頻的空間序列模式,進(jìn)一步提高衣物檢索的性能。基于 LSTM,我們提出了視頻特征網(wǎng)絡(luò) (VFN),如圖3所示。其中實(shí)驗(yàn)驗(yàn)證明兩層堆疊式 LSTM 結(jié)構(gòu)能夠在視頻特征學(xué)習(xí)中得到較佳性能。

圖 3 Asymnet視頻特征網(wǎng)絡(luò)(VFN)

相似性網(wǎng)絡(luò):明星同款匹配不同于近似衣物檢索,較精確匹配要求完全一致。在完全一致的要求下,傳統(tǒng)的通過(guò)相似性計(jì)算來(lái)進(jìn)行檢索的方法,不能滿足明星同款較精確匹配要求。已有的方法通常將較精確匹配問(wèn)題轉(zhuǎn)換為一個(gè)二分類問(wèn)題,但這種方式適應(yīng)性差,只能利用單一時(shí)刻的視頻幀。

為了能夠利用整個(gè)衣物運(yùn)動(dòng)軌跡,我們提出了如下的可變化的深度樹形結(jié)構(gòu)(ReconfigurableDeep Tree structure)將匹配問(wèn)題轉(zhuǎn)換為邏輯回歸問(wèn)題。匹配網(wǎng)絡(luò)擬采用基于混合專家系統(tǒng)的邏輯回歸網(wǎng)絡(luò)。該結(jié)構(gòu)可以認(rèn)為是對(duì)現(xiàn)有attention模型的一種擴(kuò)展,可以用來(lái)解決多模型融合問(wèn)題。

圖 4 Asymnet相似性網(wǎng)絡(luò)

整個(gè)模型的目標(biāo)函數(shù)是綜合考慮每一幀的匹配結(jié)果,得到基于整個(gè)衣物運(yùn)動(dòng)序列和電商衣物的相似性,整個(gè)系統(tǒng)可以建模為對(duì)如下目標(biāo)公式進(jìn)行求解:

試驗(yàn)結(jié)果:我們利用業(yè)務(wù)數(shù)據(jù)和的衣物檢索方法進(jìn)行了對(duì)比,試驗(yàn)結(jié)果如下表所示。相對(duì)于alexnet,Asymnet在前20的檢索較精確率指標(biāo)上,其性能幾乎提高了進(jìn)一倍。

相對(duì)于其他2種網(wǎng)絡(luò)CS和RC,我們發(fā)現(xiàn)RC的性能略優(yōu)于CS,因?yàn)镽C具有較強(qiáng)的識(shí)別能力差異較?。ú捎枚嗳蝿?wù)學(xué)習(xí))。甚至在對(duì)于某些類別(無(wú)明顯差別)RC在較精確率上甚至略好于AsymNet,但是總的來(lái)說(shuō)AsymNet比目前現(xiàn)有的方法擁有更好的性能。因?yàn)锳symnet可以處理現(xiàn)有的視頻的時(shí)空動(dòng)態(tài)變化,并結(jié)合自動(dòng)視頻幀的自動(dòng)調(diào)節(jié)爐排判別信息的融合策略。

歡迎加入本站公開興趣群

商業(yè)智能與數(shù)據(jù)分析群

興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價(jià)值的辦法,實(shí)際應(yīng)用案例分享與討論,分析工具,ETL工具,數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)挖掘工具,報(bào)表系統(tǒng)等全方位知識(shí)

QQ群:81035754

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://www.ezyhdfw.cn/yun/4599.html

相關(guān)文章

  • 基于深度學(xué)習(xí)的商品檢索技術(shù)

    摘要:當(dāng)前,很多學(xué)者和研究機(jī)構(gòu)都嘗試基于深度學(xué)習(xí)進(jìn)行服裝檢索技術(shù)的探究與創(chuàng)新。下文將回顧三篇基于深度學(xué)習(xí)來(lái)解決跨域服裝檢索問(wèn)題的文章??偟膩?lái)說(shuō),以上深度學(xué)習(xí)方法的探索與創(chuàng)新都將為商品檢索技術(shù)趨 摘要商品檢索是一門綜合了物體檢測(cè)、 圖像分類以及特征學(xué)習(xí)的技術(shù)。 近期, 很多研究者成功地將深度學(xué)習(xí)方法應(yīng)用到這個(gè)領(lǐng)域。 本文對(duì)這些方法進(jìn)行了總結(jié), 然后概括地提出了商品特征學(xué)習(xí)框架以及垂類數(shù)據(jù)挖掘方式, ...

    Half 評(píng)論0 收藏0
  • 馬蜂窩 iOS App 啟動(dòng)治理:回歸用戶體驗(yàn)

    摘要:馬蜂窩旅游歷經(jīng)幾十個(gè)版本的開發(fā)迭代,在啟動(dòng)流程上積累了一定的技術(shù)債務(wù)。我們定義啟動(dòng)廣告曝光率啟動(dòng)廣告曝光啟動(dòng)廣告加載。 增長(zhǎng)、活躍、留存是移動(dòng) App 的常見(jiàn)核心指標(biāo),直接反映一款 App 甚至一個(gè)互聯(lián)網(wǎng)公司運(yùn)行的健康程度和發(fā)展動(dòng)能。啟動(dòng)流程的體驗(yàn)決定了用戶的第一印象,在一定程度上影響了用戶活躍度和留存率。因此,確保啟動(dòng)流程的良好體驗(yàn)至關(guān)重要。 「馬蜂窩旅游」App 是馬蜂窩為用戶提供...

    Jinkey 評(píng)論0 收藏0
  • 【戴嘉樂(lè)】詳解IPFS的本質(zhì)、技術(shù)架構(gòu)以及應(yīng)用

    摘要:戴嘉樂(lè)去年月參與了的眾籌,從而了解到技術(shù),獨(dú)立開發(fā)了兩款基于的開源應(yīng)用,一個(gè)是與有關(guān)的系統(tǒng),另一個(gè)是相關(guān)的地理位置檢索系統(tǒng)?,F(xiàn)在支持的數(shù)據(jù)結(jié)構(gòu),支持比特幣以太坊的區(qū)塊數(shù)據(jù)。 戴嘉樂(lè)是前百度高級(jí)研發(fā)工程師,ipfser.org&巴比特專欄作者。戴嘉樂(lè)去年8月參與了FileCoin的眾籌,從而了解到IPFS技術(shù),獨(dú)立開發(fā)了兩款基于IPFS的開源應(yīng)用,一個(gè)是與IPFS有關(guān)的wiki系統(tǒng),另一...

    whlong 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<