摘要:最初產(chǎn)生這個項目的想法應(yīng)該是在年月份,當(dāng)時正在學(xué)習(xí)中,就萌生了這樣一個想法從一個用戶這一年發(fā)布的微博數(shù)據(jù)中,提取最有意義的個關(guān)鍵詞。這些東西提交完就可以提交審核了,微博應(yīng)用審核的速度還算比較快的,一兩天基本差不多會審核完。
最初產(chǎn)生這個項目的想法應(yīng)該是在2018年10月份,當(dāng)時正在學(xué)習(xí)python中,就萌生了這樣一個想法:從一個用戶這一年發(fā)布的微博數(shù)據(jù)中,提取最有意義的top50個關(guān)鍵詞。很明顯涉及到了數(shù)據(jù)采集和自然語言處理的一些知識。前期準(zhǔn)備:
需要到微博開發(fā)平臺認(rèn)證開發(fā)者;
在微博開發(fā)平臺創(chuàng)建應(yīng)用;
域名1個,服務(wù)器1臺;
微博應(yīng)用創(chuàng)建和審核創(chuàng)建應(yīng)用的目的就是你的網(wǎng)站可以接入微博,使用微博登錄授權(quán),調(diào)用微博開放的一些api;質(zhì)量高,用戶多的應(yīng)用還會被推薦到微博應(yīng)用廣場等等。
創(chuàng)建應(yīng)用需要我們填寫一些信息,應(yīng)用名稱,描述之類的。把準(zhǔn)備好的文案直接粘貼進(jìn)去就可以;需要不同規(guī)格的應(yīng)用圖標(biāo)和三張以上應(yīng)用介紹的宣傳圖。這個里面有一個關(guān)鍵點(diǎn)就是應(yīng)用地址,需要提供一個可訪問到的,并且包含微博組件的一個地址。這些東西提交完就可以提交審核了,微博應(yīng)用審核的速度還算比較快的,一兩天基本差不多會審核完。
等應(yīng)用審核完,你就可以拿著appkey和appsecret繼續(xù)往下開發(fā)了。
微博數(shù)據(jù)采集因為微博開放的api接口里并不提供用戶微博數(shù)據(jù),所以才使用了數(shù)據(jù)采集的方案。第一個版本的工具是用nodejs寫的,后來換成了python的版本。
提取關(guān)鍵詞這里還是使用python進(jìn)行處理:
預(yù)處理(去掉微博里的表情、標(biāo)簽等);
分詞(將整句分割為詞匯);
加載詞庫(包括通用詞庫和用戶自定義詞庫);
去停用詞(去除一些無意義的詞匯);
計算TFIDF,按權(quán)重排序;
取前50個詞生成詞云圖片。
串聯(lián)項目項目的基礎(chǔ)架構(gòu)使用nodejs搭建,整個應(yīng)用的路由訪問控制,視圖渲染,異常處理, 日志收集,進(jìn)程管理,都是使用nodejs來完成。
大致流程:用戶訪問應(yīng)用;
引導(dǎo)用戶到微博授權(quán)頁;
授權(quán)成功后,后臺拿到uid,開啟一個新的子進(jìn)程進(jìn)行微博詞云圖片的生成;
這個時候給用戶返回一個grant頁面(此時微博詞云的進(jìn)程可能還沒結(jié)束);
用戶點(diǎn)擊到下一個頁面,如果圖片已經(jīng)生成了,就展示該展示的數(shù)據(jù),如果還沒有,就給用戶等待的處理。
對,基本流程差不多就這些,比較簡單。下面看下最終的效果。
重要的知識點(diǎn)在nodejs中調(diào)用python腳本,大致思路就是生成一個shell命令,然后nodejs開啟一個子進(jìn)程,在子進(jìn)程中執(zhí)行這個shell即可。
h5頁面,長按保存成圖片,這里的大致思路如下:
我們將html轉(zhuǎn)為canvas,然后取出canvas數(shù)據(jù)放入一個img標(biāo)簽里。將這個img放到頁面最頂層,并且將不透明度設(shè)為0就可以了。然后在微信、微博等app里面,長按就可以保存到手機(jī)了,具體實現(xiàn)代碼請看下圖。
總結(jié)更多的是一些交互上的細(xì)化處理,讓用戶有更好的操作體驗,和視覺上的沖擊。這個應(yīng)用視覺沖擊倒是沒有多少,哈哈。
最后,歡迎大家一起交流。
項目地址:http://yk.mcust.cn/wb
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://www.ezyhdfw.cn/yun/42920.html
摘要:時間永遠(yuǎn)都過得那么快,一晃從年注冊,到現(xiàn)在已經(jīng)過去了年那些被我藏在收藏夾吃灰的文章,已經(jīng)太多了,是時候把他們整理一下了。那是因為收藏夾太亂,橡皮擦給設(shè)置私密了,不收拾不好看呀。 ...
摘要:讓你收獲滿滿碼個蛋從年月日推送第篇文章一年過去了已累積推文近篇文章,本文為年度精選,共計篇,按照類別整理便于讀者主題閱讀。本篇文章是今年的最后一篇技術(shù)文章,為了讓大家在家也能好好學(xué)習(xí),特此花了幾個小時整理了這些文章。 showImg(https://segmentfault.com/img/remote/1460000013241596); 讓你收獲滿滿! 碼個蛋從2017年02月20...
摘要:用實現(xiàn)微信好友性別及位置信息統(tǒng)計這里使用的庫開發(fā)。使用圖靈機(jī)器人自動與指定好友聊天讓室友幫忙測試發(fā)現(xiàn)發(fā)送表情發(fā)送文字還能回應(yīng),但是發(fā)送圖片可能不會回復(fù),猜應(yīng)該是我們申請的圖靈機(jī)器人是最初級的沒有加圖片識別功能。 1.用 Python 實現(xiàn)微信好友性別及位置信息統(tǒng)計 這里使用的python3+wxpy庫+Anaconda(Spyder)開發(fā)。如果你想對wxpy有更深的了解請查看:wxpy...
摘要:背景個人背景就讀于東北某普通二本院校計算機(jī)軟件工程專業(yè),現(xiàn)大四,北京實習(xí)前端方向,自學(xué),技術(shù)棧時間背景大概是在月日準(zhǔn)備好簡歷開始投遞秋招差不多已經(jīng)結(jié)束招聘崗位不多,投遞對象為大一些的互聯(lián)網(wǎng)公司事件背景第一個入職的是好未來的前端實習(xí)崗,待遇工 背景 個人背景 就讀于東北某普通二本院校計算機(jī)軟件工程專業(yè),現(xiàn)大四,北京實習(xí) 前端方向,自學(xué),vue技術(shù)棧 時間背景 大概是在11月9日準(zhǔn)備...
閱讀 3267·2021-09-06 15:02
閱讀 2300·2019-08-30 15:48
閱讀 3500·2019-08-29 11:08
閱讀 3340·2019-08-26 13:55
閱讀 2512·2019-08-26 13:35
閱讀 3214·2019-08-26 12:11
閱讀 2660·2019-08-26 11:48
閱讀 956·2019-08-26 11:42