摘要:小微企業(yè)查詢系統(tǒng)地址破解的嘗試簡介最近因為有需要對爬取的非上市公司進行一個驗證,而絕大多數(shù)的非上市公司又都是小微企業(yè),比起爬企業(yè)征信系統(tǒng)來說,還是小微企業(yè)名錄更方便一點特點基于全程破解無需下載圖片無需模擬軌跡,模式就是任性覺得不錯幫忙一下啦
小微企業(yè)查詢系統(tǒng)git地址
破解geetest offline的嘗試簡介
最近因為有需要對爬取的非上市公司進行一個驗證,而絕大多數(shù)的非上市公司又都是小微企業(yè),比起爬企業(yè)征信系統(tǒng)來說,還是小微企業(yè)名錄更方便一點
特點基于node.js axios全程破解 無需下載圖片 無需模擬軌跡,offline模式就是任性
覺得不錯幫忙Star一下啦~ 破解流程首先我們跟著正常獲取數(shù)據(jù)的流程走一遍
打開小微企業(yè)名錄并且打開控制臺
可以看到大概有這幾個請求
http://xwqy.gsxt.gov.cn/security/verify_ip http://xwqy.gsxt.gov.cn/security/verify_keyword http://xwqy.gsxt.gov.cn/pc-geetest/register?t=1516872325770
查看一下response(當然你熟悉geetest也行)就會發(fā)現(xiàn)register就是geetest的初始化請求啦
返回值如下
challenge:"a1d0c6e83f027327d8461063f4ac58a61c" gt:"6146190e4171da316dbb5bcc076e2607" success:0
其中你可以發(fā)現(xiàn)success基本都是0 也就是說離線模式
什么是離線模式?基本就是geetest不參與判斷的一個狀態(tài),驗證部分都在前臺和中間服務(wù)器完成
回去看之前系統(tǒng)下載的js 會發(fā)現(xiàn)兩個geetest提供的js
geetest.0.0.0.js
offline.6.0.0.js
這幾個源文件也提供在項目中了
滑塊拼合
發(fā)送了一個新的驗證請求
http://xwqy.gsxt.gov.cn/pc-geetest/validate request如下: geetest_challenge:a1d0c6e83f027327d8461063f4ac58a61c geetest_validate:010886ec_0084e_10100077776e geetest_seccode:010886ec_0084e_10100077776e|jordan
既然是offline 那就分析offline.js唄
查看代碼就能看到這句
return c >= f - 3 && c <= f + 3 ? { success: !0, message: "success", validate: b.A(c, e.d.challenge) + "_" + b.A(a.b("rand0", e.c), e.d.challenge) + "_" + b.A(a.b("rand1", e.c), e.d.challenge), score: Math.round(d / 200) } : {success: 0, message: "fail"}
這不就是我們要的么!
validate: b.A(c, e.d.challenge) + "_" + b.A(a.b("rand0", e.c), e.d.challenge) + "_" + b.A(a.b("rand1", e.c), e.d.challenge),
offline.6.0.0.js和offline.5.0.0.js可以看出一樣是通過密鑰 rand rand1進行加密獲取一個值,一半來說這種方案就是得依靠收集案例倒推,但是我們是不會重復造輪子的
github關(guān)鍵詞一搜就能發(fā)現(xiàn)已經(jīng)有人整理好了"https://github.com/9468305/python-script/blob/master/geetest_offline/util.py"
所以那就用唄
后續(xù)就只是涉及到爬蟲以及頁面跳轉(zhuǎn)的問題了,具體可以看util內(nèi)的代碼
而且在micro_lib內(nèi)也可以直接搜索 發(fā)送驗證的地址改為http://xwqy.gsxt.gov.cn/mirco...
并相應(yīng)修改傳入的值即可
organId:100000 textfield:encode后的關(guān)鍵詞 fwId:1400 searchOrganId: channelId:99 captcha: geetest_challenge:3ef815416f775098fe977004015c619332 geetest_validate:010886ec_0084e_10100077776e geetest_seccode:010886ec_0084e_10100077776e|jordanrestful-api 已經(jīng)做了一個api形式的 直接在url內(nèi)打入關(guān)鍵詞即可爬取 運行步驟
npm install npm run start curl http://127.0.0.1:4001/公司關(guān)鍵詞
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://www.ezyhdfw.cn/yun/92803.html
摘要:國家企業(yè)信用公示系統(tǒng)的爬取網(wǎng)站分析獲取首頁通過直接請求網(wǎng)站首頁,返回錯誤提示碼,返回結(jié)果是代碼。驗證碼識別開發(fā)者文檔代碼結(jié)果查詢企業(yè)在首頁的源代碼中,有一句注釋偽造極驗變量百度成功獲取到結(jié)果鏈接國家企業(yè)信用公示系統(tǒng)爬取 國家企業(yè)信用公示系統(tǒng)的爬取 1. 網(wǎng)站分析 1.1 獲取首頁 通過 requests.get 直接請求網(wǎng)站首頁,返回 521 錯誤提示碼,返回結(jié)果是js代碼。這是采用...
摘要:那么,除了企業(yè)微信和這種落地場景,還有哪些值得投資的業(yè)務(wù)場景分析機構(gòu)預測,到年,美國低代碼開發(fā)的市場規(guī)模將到億美元。相比2015年企業(yè)服務(wù)元年,VC炒紅了整個SaaS創(chuàng)業(yè)市場,2018年卻眼見SaaS投資遇冷,SaaS創(chuàng)業(yè)退潮,SaaS企業(yè)兩難——不是選擇戰(zhàn)略投資遭遇自主發(fā)展難題,就是面臨增長瓶頸生存壓力而紛紛裁員……悲觀者認為,中國SaaS領(lǐng)域很難突破,這種負面情緒甚至波及整個企業(yè)級創(chuàng)業(yè)市...
閱讀 2708·2021-09-30 10:00
閱讀 3635·2021-09-22 10:54
閱讀 6752·2021-09-07 10:28
閱讀 3139·2019-08-29 13:53
閱讀 945·2019-08-29 12:42
閱讀 1112·2019-08-26 13:51
閱讀 1390·2019-08-26 13:32
閱讀 3159·2019-08-26 10:39