Node實(shí)現(xiàn)驗(yàn)證碼識(shí)別

luckyw 發(fā)布于2019-08-20 16:46 / 2169人閱讀

摘要：了別人代碼的你最近忽然對(duì)圖像識(shí)別有了興趣，作為一個(gè)前端，當(dāng)然是想用來(lái)深入研究。先從簡(jiǎn)單的入手，識(shí)別圖片驗(yàn)證碼。圖片驗(yàn)證碼對(duì)開(kāi)發(fā)來(lái)說(shuō)一點(diǎn)也不陌生，它是對(duì)服務(wù)器保護(hù)的一道屏障，避免了諸如暴力破解密碼之類的攻擊。

copy了別人代碼的你

最近忽然對(duì)圖像識(shí)別有了興趣，作為一個(gè)前端，當(dāng)然是想用Javascript來(lái)深入研究。

先從簡(jiǎn)單的入手，識(shí)別圖片驗(yàn)證碼。圖片驗(yàn)證碼對(duì)web開(kāi)發(fā)來(lái)說(shuō)一點(diǎn)也不陌生，它是對(duì)服務(wù)器保護(hù)的一道屏障，避免了諸如暴力破解密碼之類的攻擊。但是，今天就是要去突破這道屏障。

現(xiàn)在開(kāi)源的圖像識(shí)別技術(shù)有很多，我在GitHub上找到了一個(gè)用Javascript實(shí)現(xiàn)的，相對(duì)受歡迎的框架Tesseract.js。

我先準(zhǔn)備好一個(gè)簡(jiǎn)單的驗(yàn)證碼

這個(gè)是數(shù)字字母的組合，接下來(lái)我們就用tesseract.js來(lái)對(duì)這個(gè)驗(yàn)證碼進(jìn)行解析。

安裝

npm install --save tesseract.js

使用這個(gè)命令進(jìn)行安裝，--save代表只安裝到當(dāng)前項(xiàng)目中。

使用

首先要在代碼中進(jìn)行引入

var tesseract = require("tesseract.js");

然后使用tesseract的recognize方法對(duì)圖片進(jìn)行解析。

tesseract.recognize(myImage,options)
.then(function(result){
    console.log(result)
});

其中，myImage可以是圖片file對(duì)象，或者圖片的存放地址的字符串等，我們這里先用存放地址的字符串。

options則是對(duì)解析過(guò)程的個(gè)性化設(shè)置，可以設(shè)置語(yǔ)言等其他屬性，較為重要的有lang屬性，用來(lái)設(shè)置語(yǔ)言類型，英文為eng（默認(rèn)）,數(shù)字是Math.

運(yùn)行效果

下面我們來(lái)看一下實(shí)際的運(yùn)行效果。

文件系統(tǒng)

app.js

使用node命令運(yùn)行

可以看出，輸出的結(jié)果是LPGU，驗(yàn)證碼中的字母數(shù)字組合是LP6U，略有偏差，將6解析成了G。

所以，自動(dòng)識(shí)別雖好，但是準(zhǔn)確率還是需要提高。

Tesseract.js訓(xùn)練

tesseract.js是可以通過(guò)訓(xùn)練來(lái)提高準(zhǔn)確率的，我們看一下第一次運(yùn)行結(jié)束后發(fā)生了什么變化。

運(yùn)行結(jié)束之后，文件系統(tǒng)中生成了一個(gè)eng.traineddata文件

這個(gè)文件，就是tesseract的訓(xùn)練文件，下次再分析的時(shí)候，會(huì)先從這個(gè)訓(xùn)練文件中尋找是否有匹配的結(jié)果。通過(guò)這種方式，形成它自己的大腦。

當(dāng)然，我認(rèn)為也可以手動(dòng)的添加相同格式的文件進(jìn)去，手動(dòng)的擴(kuò)充這個(gè)圖像分析系統(tǒng)的智能性。

附錄一

recognize第一個(gè)參數(shù)所允許的類型：

因?yàn)?b>tesseract.js既可以運(yùn)行node服務(wù)器中，也可以運(yùn)行再瀏覽器中，我們這里只提在服務(wù)器中所允許的類型

文件地址（string）

包含PNG或JPEG類型的Buffer對(duì)象

imageData對(duì)象

附錄二

瀏覽器中引入方式

使用方式同node方法

云服務(wù)器 GPU云服務(wù)器驗(yàn)證碼識(shí)別‘’ 驗(yàn)證碼識(shí)別 java實(shí)現(xiàn)驗(yàn)證碼 android驗(yàn)證碼實(shí)現(xiàn)

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://www.ezyhdfw.cn/yun/83156.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

luckyw

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

講講Python中的函數(shù)傳遞問(wèn)題【文末送書(shū)】

閱讀 3601·2021-11-18 10:02
阿里云：速搶，輕量雲(yún)服務(wù)器，60元/年，2核/2G/5M帶寬/60GB ESSD/1T流量

閱讀 1016·2021-09-04 16:48
前端實(shí)用知識(shí)

閱讀 2077·2019-08-30 15:55
關(guān)于頁(yè)面優(yōu)化

閱讀 3589·2019-08-30 15:52
前端面試題-clearfix（清除浮動(dòng)）

閱讀 1873·2019-08-30 14:08
vue2.0組件間事件派發(fā)與接收

閱讀 3614·2019-08-30 13:19
chatbot：基于 AIML 的 PHP 聊天機(jī)器人

閱讀 1211·2019-08-27 10:53
es6之深入理解promise

閱讀 3180·2019-08-26 12:11

亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

Node實(shí)現(xiàn)驗(yàn)證碼識(shí)別

安裝

使用

運(yùn)行效果

Tesseract.js訓(xùn)練

附錄一

附錄二

相關(guān)文章

node識(shí)別驗(yàn)證碼

**OCR識(shí)別驗(yàn)證碼**

**一只node爬蟲(chóng)的升級(jí)打怪之路**

**如何識(shí)別圖片驗(yàn)證碼？**

***驗(yàn)證碼識(shí)別***

發(fā)表評(píng)論

0條評(píng)論

luckyw

男|高級(jí)講師

TA的文章

講講Python中的函數(shù)傳遞問(wèn)題【文末送書(shū)】

阿里云：速搶，輕量雲(yún)服務(wù)器，60元/年，2核/2G/5M帶寬/60GB ESSD/1T流量

前端實(shí)用知識(shí)

關(guān)于頁(yè)面優(yōu)化

前端面試題-clearfix（清除浮動(dòng)）

vue2.0組件間事件派發(fā)與接收

chatbot：基于 AIML 的 PHP 聊天機(jī)器人

es6之深入理解promise

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

Node實(shí)現(xiàn)驗(yàn)證碼識(shí)別

安裝

使用

運(yùn)行效果

Tesseract.js訓(xùn)練

附錄一

附錄二

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！