【論文簡(jiǎn)讀】 Deep web data extraction based on visual

shiguibiao 發(fā)布于2019-08-23 10:44 / 2394人閱讀

摘要：第一階段設(shè)置卷積層和匯集層以學(xué)習(xí)圖像的特征。除了為輸出設(shè)置最后一個(gè)完全連接之外，第三階段設(shè)置多個(gè)連接層以過濾先前層學(xué)習(xí)的特征。據(jù)區(qū)域檢測(cè)的標(biāo)準(zhǔn)，如果，則數(shù)據(jù)區(qū)域被視為正樣本。

《Deep web data extraction based on visual information processing》
作者 J Liu 上海海事大學(xué) 2017 AIHC會(huì)議登載
引用 Liu J, Lin L, Cai Z, et al. Deep web data extraction based on visual information processing[J]. Journal of Ambient Intelligence & Humanized Computing, 2017(1):1-11.

簡(jiǎn)介

一種基于卷積神經(jīng)網(wǎng)絡(luò)（CNN）的數(shù)據(jù)區(qū)域定位方法
結(jié)合視覺信息進(jìn)行網(wǎng)頁的分割（作者命名為VIBS）

1、CNN 基于卷積神經(jīng)網(wǎng)路進(jìn)行區(qū)域定位

CNN網(wǎng)絡(luò)結(jié)構(gòu)由3個(gè)階段組成，如圖所示。第一階段設(shè)置卷積層和匯集層以學(xué)習(xí)圖像的特征。第二階段是設(shè)置展平圖層所必需的，展平圖層會(huì)將卷積圖層和合并圖層生成的特征圖轉(zhuǎn)換為一維矢量，以計(jì)算完整的連接圖層。除了為輸出設(shè)置最后一個(gè)完全連接之外，第三階段設(shè)置多個(gè)連接層以過濾先前層學(xué)習(xí)的特征。

網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)使用13級(jí)CNN，包括5個(gè)采樣層（S），6個(gè)卷積層（C）和2個(gè)完全連接層。

據(jù)區(qū)域檢測(cè)的標(biāo)準(zhǔn)IOU，如果IOU ?> 50％，則數(shù)據(jù)區(qū)域被視為正樣本。

區(qū)域定位主要步驟流程圖如下

2、基于視覺信息的網(wǎng)頁分割方法 VIBS

3、實(shí)驗(yàn)結(jié)果和分析 數(shù)據(jù)集（Lianjia、Complanet、Fangjia）

58,500個(gè)樣本數(shù)據(jù)集，其中有195種具有不同大小和不同位置的圖像樣本，包含數(shù)據(jù)區(qū)域，總共300個(gè)組。

實(shí)驗(yàn)結(jié)果

總結(jié)

總體看下來，文章的創(chuàng)新意義大于實(shí)際意義吧，這么高的精確度，感覺像是過擬合了，而且速度不可能這么快，應(yīng)該是把網(wǎng)頁先行保存成圖片了的，文章寫得很不錯(cuò)，對(duì)比什么的體系也比較完善，就是有些地方?jīng)]有講清楚，比如能否divide的判定等。

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://www.ezyhdfw.cn/yun/96637.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

shiguibiao

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

Python入門-第一章Python基礎(chǔ)

閱讀 1624·2021-11-24 09:39
H3C生成樹配置

閱讀 1181·2021-11-22 15:11
Android SeekBar 自定義thumb，thumb旋轉(zhuǎn)動(dòng)畫效果

閱讀 2296·2021-11-19 11:35
CloudServer：$4/月KVM-2GB/50GB/5TB/三個(gè)數(shù)據(jù)中心

閱讀 1683·2021-09-13 10:37
香港bgp線路和cn2線路：香港bgp服務(wù)器cn2服務(wù)器選哪一個(gè)?

閱讀 2631·2021-09-03 10:47
Vultr機(jī)房測(cè)評(píng) - Vultr美國(guó)芝加哥Chicago機(jī)房綜合速度和線路去程回程測(cè)

閱讀 2233·2021-08-30 09:47
酷銳云：周年慶全場(chǎng)8折優(yōu)惠，洛杉磯Cera特供VPS月付10元，限量50臺(tái)

閱讀 1699·2021-08-20 09:39
記錄一次杭州順網(wǎng)科技的面試過程

閱讀 3007·2019-08-30 14:13

亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來選購(gòu)！

【論文簡(jiǎn)讀】 Deep web data extraction based on visual

相關(guān)文章

**[論文簡(jiǎn)讀] Deep Neural Networks for Web Page Informati**

**[論文簡(jiǎn)讀] Deep Neural Networks for Web Page Informati**

**[論文簡(jiǎn)讀] Web Content Extraction Using Clustering**

發(fā)表評(píng)論

0條評(píng)論

shiguibiao

男|高級(jí)講師

TA的文章

Python入門-第一章Python基礎(chǔ)

H3C生成樹配置

Android SeekBar 自定義thumb，thumb旋轉(zhuǎn)動(dòng)畫效果

CloudServer：$4/月KVM-2GB/50GB/5TB/三個(gè)數(shù)據(jù)中心

香港bgp線路和cn2線路：香港bgp服務(wù)器cn2服務(wù)器選哪一個(gè)?

Vultr機(jī)房測(cè)評(píng) - Vultr美國(guó)芝加哥Chicago機(jī)房綜合速度和線路去程回程測(cè)

酷銳云：周年慶全場(chǎng)8折優(yōu)惠，洛杉磯Cera特供VPS月付10元，限量50臺(tái)

記錄一次杭州順網(wǎng)科技的面試過程

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來選購(gòu)！

【論文簡(jiǎn)讀】 Deep web data extraction based on visual

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來選購(gòu)！