摘要:內(nèi)容代碼打開文件讀取第一個(gè)工作表統(tǒng)計(jì)行數(shù)微信文章屬性每一行數(shù)據(jù)形成一個(gè)列表列表形成字典返回所有數(shù)據(jù)循環(huán)打開每個(gè)微信文章屬性按時(shí)間升序排列寫入文件顯示中文縮進(jìn)為微信寫文件
excel內(nèi)容:
代碼:
import xlrd import json import operator def read_xlsx(filename): # 打開excel文件 data1 = xlrd.open_workbook(filename) # 讀取第一個(gè)工作表 table = data1.sheets()[0] # 統(tǒng)計(jì)行數(shù) n_rows = table.nrows data = [] # 微信文章屬性:wechat_name wechat_id title abstract url time read like number for v in range(1, n_rows-1): # 每一行數(shù)據(jù)形成一個(gè)列表 values = table.row_values(v) # 列表形成字典 data.append({"wechat_name": values[0], "wechat_id": values[1], "title": values[2], "abstract": values[3], "url": values[4], "time": values[5], "read": values[6], "like": values[7], "number": values[8], }) # 返回所有數(shù)據(jù) return data if __name__ == "__main__": d = [] # 循環(huán)打開每個(gè)excel for i in range(1, 16): d1 = read_xlsx("./excel data/"+str(i)+".xlsx") d.extend(d1) # 微信文章屬性 # 按時(shí)間升序排列 d = sorted(d, key=operator.itemgetter("time")) # 寫入json文件 with open("article.json", "w", encoding="utf-8") as f: #ensure_ascii=False顯示中文,indent=2縮進(jìn)為2 f.write(json.dumps(d, ensure_ascii=False, indent=2)) name = [] # 微信id寫文件 f1 = open("wechat_id.txt", "w") for i in d: if i["wechat_id"] not in name: name.append(i["wechat_id"]) f1.writelines(i["wechat_id"]) f1.writelines(" ") print(len(name))
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://www.ezyhdfw.cn/yun/42448.html
摘要:一大熊貓世界來去自如的老生常談,從基礎(chǔ)來看,我們?nèi)匀魂P(guān)心對(duì)于與外部數(shù)據(jù)是如何交互的。函數(shù)受限制問題唯一重要的參數(shù),標(biāo)志著一個(gè)的第個(gè)頁將會(huì)被取出。數(shù)據(jù)分析入門之總結(jié)基礎(chǔ)一歡迎來翔的博客查看完成版。 一.大熊貓世界來去自如:Pandas的I/O 老生常談,從基礎(chǔ)來看,我們?nèi)匀魂P(guān)心pandas對(duì)于與外部數(shù)據(jù)是如何交互的。 1.1 結(jié)構(gòu)化數(shù)據(jù)輸入輸出 read_csv與to_csv 是?對(duì)...
摘要:今天要分享的是,用來寫。數(shù)據(jù)處理環(huán)節(jié)效率低下,易受干擾。問題排查難以溯源。一旦數(shù)據(jù)報(bào)告有誤,想要定位問題所在,常常需要從頭開始復(fù)盤。結(jié)果和上面結(jié)果結(jié)構(gòu)是一致的。這是官網(wǎng)的文檔,但是卻不完全適用目前的場景。 大毛 豈安科技業(yè)務(wù)風(fēng)險(xiǎn)分析師 多年訂單業(yè)務(wù)反欺詐經(jīng)驗(yàn),負(fù)責(zé)豈安科技多款產(chǎn)品運(yùn)營工作。 上回筆者分享過一些 pandas 的常用數(shù)據(jù)查詢語法,但是數(shù)據(jù)查詢對(duì)于 pandas 而言只是冰...
摘要:今天要分享的是,用來寫。數(shù)據(jù)處理環(huán)節(jié)效率低下,易受干擾。問題排查難以溯源。一旦數(shù)據(jù)報(bào)告有誤,想要定位問題所在,常常需要從頭開始復(fù)盤。結(jié)果和上面結(jié)果結(jié)構(gòu)是一致的。這是官網(wǎng)的文檔,但是卻不完全適用目前的場景。 大毛 豈安科技業(yè)務(wù)風(fēng)險(xiǎn)分析師 多年訂單業(yè)務(wù)反欺詐經(jīng)驗(yàn),負(fù)責(zé)豈安科技多款產(chǎn)品運(yùn)營工作。 上回筆者分享過一些 pandas 的常用數(shù)據(jù)查詢語法,但是數(shù)據(jù)查詢對(duì)于 pandas 而言只是冰...
摘要:如果該文件已存在,文件指針將會(huì)放在文件的結(jié)尾。運(yùn)行結(jié)果以上是讀取文件的方法。為了輸出中文,我們還需要指定一個(gè)參數(shù)為,另外規(guī)定文件輸出的編碼。 上一篇文章:Python3網(wǎng)絡(luò)爬蟲實(shí)戰(zhàn)---30、解析庫的使用:PyQuery下一篇文章:Python3網(wǎng)絡(luò)爬蟲實(shí)戰(zhàn)---32、數(shù)據(jù)存儲(chǔ):關(guān)系型數(shù)據(jù)庫存儲(chǔ):MySQL 我們用解析器解析出數(shù)據(jù)之后,接下來的一步就是對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)了,保存的形式可以...
閱讀 4048·2021-09-30 09:59
閱讀 2542·2021-09-13 10:34
閱讀 652·2019-08-30 12:58
閱讀 1579·2019-08-29 18:42
閱讀 2269·2019-08-26 13:44
閱讀 2996·2019-08-23 18:12
閱讀 3392·2019-08-23 15:10
閱讀 1698·2019-08-23 14:37