亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

首次公開!《阿里計算機視覺技術(shù)精選》揭秘前沿落地案例

Carbs / 3059人閱讀

摘要:元旦假期即將來臨,我們精心準備了這本阿里巴巴機器智能計算機視覺技術(shù)精選,收錄了頂級會議阿里論文,送給計劃在假期充電的同學們,也希望能和更多學術(shù)界工業(yè)界同仁一起探討交流。

當下計算機視覺技術(shù)無疑是AI浪潮中最火熱的議題之一。視覺技術(shù)的滲透,既可以對傳統(tǒng)商業(yè)進行改造使之看到新的商業(yè)機會,還可以創(chuàng)造全新的商業(yè)需求和市場。無論在電商、安防、娛樂,還是在工業(yè)、醫(yī)療、自動駕駛領域,計算機視覺技術(shù)都扮演著越發(fā)重要的角色。

元旦假期即將來臨,我們精心準備了這本《阿里巴巴機器智能計算機視覺技術(shù)精選》,收錄了頂級會議 CVPR 2018 阿里論文,送給計劃在假期“充電”的同學們,也希望能和更多學術(shù)界、工業(yè)界同仁一起探討交流。

下載地址:https://yq.aliyun.com/download/3237?utm_content=g_1000033518

在這本干貨精選集中,我們收錄了多篇具有代表性的 CVPR 2018 論文。比如,拍立淘利用圖像搜索和識別技術(shù),幫助用戶在移動端通過拍照就能找到相似商品;線下新零售領域,阿里用空間定位、貨架商品SKU識別技術(shù)推動“人貨場”數(shù)字化,并做進一步的商業(yè)分析;城市大腦項目中,阿里研發(fā)了大規(guī)模視頻高效處理技術(shù),幫助城市交通事故識別、人流軌跡判斷、交通數(shù)據(jù)樣本匯總。

哪些核心技術(shù)值得一看?

Spotlight論文《基于時間尺度選擇的在線行為預測》討論了視頻中行為預測的一個非常重要的問題:怎么去選擇一個好的時間維度窗口?論文提出了包含多個子網(wǎng)絡的尺度選擇網(wǎng),比如包括時間序列建模的一維卷積子網(wǎng)絡、尺度回歸子網(wǎng)絡以及行為預測子網(wǎng)絡。在兩個公開數(shù)據(jù)集上,尺度選擇網(wǎng)的實驗結(jié)果優(yōu)于其他方法,并且準確率也接近使用Ground Truth尺度的結(jié)果。

Spotlight論文《基于語境對比特征和門控多尺度融合的場景分割》致力于場景分割中的兩大問題:場景圖片中像素形式的多樣化(例如:顯著或者不顯著、前景或者背景)和場景圖片中物體大小的多樣性。文章針對這兩個問題分別提出了語境對比局部特征和門控多尺度融合方法。本文提出的模型在Pascal Context, SUN-RGBD和COCO Stuff 三個場景分割數(shù)據(jù)集上驗證了性能,取得了目前最高的場景分割性能。

對于跨模態(tài)檢索而言,如何學到合適的特征表達非常關鍵。Spotlight論文《所見所想所找-基于生成模型的跨模態(tài)檢索》提出了一種基于生成模型的跨模態(tài)檢索方法,該方法可以學習跨模態(tài)數(shù)據(jù)的高層次特征相似性,以及目標模態(tài)上的局部相似性。本文通過大量的實驗證明了所提出的方法可以準確地匹配圖像和文本,并且在MSCOCO以及Flickr30K的數(shù)據(jù)集上都取得了state-of-the-art的效果。

在論文《整體還是局部?應用Localized GAN進行圖像內(nèi)容編輯、半監(jiān)督訓練和解決mode collapse問題》中,作者建立了GAN和半監(jiān)督機器學習中Laplace-Beltrami算子的聯(lián)系,在用少量標注樣本訓練深度學習模型上取得了優(yōu)異的性能。同時論文還展示了用Localized GAN (LGAN)對給定圖像在局部坐標系下進行編輯修改,從而獲得具有不同角度、姿態(tài)和風格的新圖像;以及如何從流型切向量獨立性的角度來解釋和解決GAN的mode collapse問題。

論文《處理多種退化類型的卷積超分辨率》針對現(xiàn)有基于CNN的單圖超分(SISR)算法不能擴展到用單一模型解決多種不同的圖像退化類型的問題,提出了一種維度拉伸策略,使得單個卷積超分辨率網(wǎng)絡能夠?qū)ISR退化過程的兩個關鍵因素(即模糊核和噪聲水平)作為網(wǎng)絡輸入來解決這個問題。實驗結(jié)果表明提出的卷積超分辨率網(wǎng)絡可以快速、有效的處理多種圖像退化類型,為SISR實際應用提供了一種高效、可擴展的解決方案。

論文《于尺度空間變換的本征圖像分解》將把圖像分解為其本征的反射圖像和光照圖像看作是一個圖像到圖像的轉(zhuǎn)換問題,并且將輸入和輸出在尺度空間進行分解。通過將輸出圖像(反射圖像和光照圖像)擴展到它們的拉普拉斯金字塔的各個成分,論文提出了一種多通道網(wǎng)絡結(jié)構(gòu),可以在每個通道內(nèi)并行地學習到一個圖像到圖像轉(zhuǎn)換函數(shù),這個函數(shù)通過一個具有跳過連接的卷積神經(jīng)網(wǎng)絡來表示。在MPI-Sintel數(shù)據(jù)集和MIT Intrinsic Images數(shù)據(jù)集上結(jié)果表明,新提出的模型在比之前最先進的技術(shù)上有了明顯的進步。

大多數(shù)現(xiàn)有的零樣本學習(Zero-Shot Learning,ZSL)方法都存在強偏問題。在論文《基于直推式無偏嵌入的零樣本學習》中,作者提出了一個簡單而有效的方法,稱為準完全監(jiān)督學習(QFSL),來緩解此問題。假定標記的源圖像和未標記的目標圖像都可用于訓練。在語義嵌入空間中,被標記的源圖像被映射到由源類別指定的若干個嵌入點,并且未標記的目標圖像被強制映射到由目標類別指定的其他點。在AwA2,CUB和SUN數(shù)據(jù)集上進行的實驗表明,文章的方法在遵循廣義ZSL設置的情況下比現(xiàn)有技術(shù)的方法優(yōu)越。

更為具體的實踐信息,大家可以通過此本電子書,進一步了解。

好的視覺技術(shù)不僅需要好的方法指引,還需要在實際的場景中形成數(shù)據(jù)閉環(huán)和不斷打磨。未來的計算機視覺技術(shù)一定是理論探索和數(shù)據(jù)實踐的共同推進。希望這本論文合集能拋磚引玉,給學術(shù)界和工業(yè)界帶來一些輸入,共同推進計算機視覺技術(shù)的發(fā)展。


本文作者:元旦“充電包”

閱讀原文

本文來自云棲社區(qū)合作伙伴“阿里技術(shù)”,如需轉(zhuǎn)載請聯(lián)系原作者。

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://www.ezyhdfw.cn/yun/19876.html

相關文章

  • 投資千億成立達摩院,揭秘阿里在人工智能領域的探索

    摘要:今天上午,阿里巴巴云棲大會在杭州開幕,第一條重磅消息是阿里首席技術(shù)官張建鋒宣布成立達摩院,在全球各地建立實驗室,年內(nèi)投入千億在全球建立實驗室和高校建立研究所建立全球研究中心等事務。 今天上午,阿里巴巴云棲大會在杭州開幕,第一條重磅消息是阿里首席技術(shù)官張建鋒宣布成立達摩院,在全球各地建立實驗室,3年內(nèi)投入千億在全球建立實驗室、和高校建立研究所、建立全球研究中心等事務。 該院由全球?qū)嶒炇摇?..

    miqt 評論0 收藏0
  • 最熱門軟件測試技術(shù) | MTSC2019 測試開發(fā)大會日程 V1.0 版公布,有獎投票你最關注的議題

    摘要:目前大會日程版正式公布日程后續(xù)可能還會有微調(diào),請以官網(wǎng)最新信息為準。而關于火熱的測試技術(shù),更有來自美團小米小愛產(chǎn)品京東百度騰訊的多個測試落地案例。 showImg(https://segmentfault.com/img/bVbsnfV?w=1920&h=942); 投票選出你最關注的 MTSC2019 測試開發(fā)大會議題,抽獎領取大會門票和 TesterHome 社區(qū)其他福利!參與方式...

    lx1036 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<