Python如何讀取千萬級數(shù)據(jù)并自動寫入MySQL數(shù)據(jù)庫

89542767 發(fā)布于2022-12-27 11:20 / 868人閱讀

　　小編寫這篇文章的一個主要目的，主要是去給大家去做一些相關(guān)的一些介紹，涉及到內(nèi)容的還是比較多的，比如如何去進行讀取千萬級的一些數(shù)據(jù)，并且將這些數(shù)據(jù)去自動錄入到系統(tǒng)里面。錄入到系統(tǒng)里面之后，怎么才能夠?qū)氲組ySQL數(shù)據(jù)庫呢？下面就給大家詳細解答下。

　　序言

　　Python數(shù)據(jù)如何去進行讀取MySQL數(shù)據(jù)庫呢？這類工作在生活當中是比較的普遍的，涉及到的內(nèi)容也是相關(guān)的一些python數(shù)據(jù)庫，包括數(shù)據(jù)的聽說讀寫等一些相關(guān)的數(shù)據(jù)工作。數(shù)據(jù)庫的內(nèi)容主要是涉及到mongodb、es，具體的一些相關(guān)內(nèi)容，下面就給大家詳細解答下。

　　場景一：數(shù)據(jù)不需要頻繁的寫入mysql

　　使用navicat工具的導入向?qū)Чδ?。支持多種文件格式，可以根據(jù)文件的字段自動建表，也可以在已有表中插入數(shù)據(jù)，非常快捷方便。

　　場景二：數(shù)據(jù)是增量的，需要自動化并頻繁寫入mysql

　　測試數(shù)據(jù)：csv格式，大約1200萬行

　　import pandas as pd
　　data=pd.read_csv('./tianchi_mobile_recommend_train_user.csv')
　　data.shape

　　打印結(jié)果：

　　方式一：python?pymysql庫

　　安裝pymysql命令：

　pip install pymysql

　　代碼實現(xiàn):

　　import pymysql
　　#數(shù)據(jù)庫連接信息
　　conn=pymysql.connect(
　　host='127.0.0.1',
　　user='root',
　　passwd='wangyuqing',
　　db='test01',
　　port=3306,
　　charset="utf8")
　　#分塊處理
　　big_size=100000
　　#分塊遍歷寫入到mysql
　　with pd.read_csv('./tianchi_mobile_recommend_train_user.csv',chunksize=big_size)as reader:
　　for df in reader:
　　datas=[]
　　print('處理：',len(df))
　　#print(df)
　　for i,j in df.iterrows():
　　data=(j['user_id'],j['item_id'],j['behavior_type'],
　　j['item_category'],j['time'])
　　datas.append(data)
　　_values=",".join(['%s',]*5)
　　sql="""insert into users(user_id,item_id,behavior_type
　　,item_category,time)values(%s)"""%_values
　　cursor=conn.cursor()
　　cursor.executemany(sql,datas)
　　conn.commit()
　　#關(guān)閉服務
　　conn.close()
　　cursor.close()
　　print('存入成功！')

方式二：pandas?sqlalchemy：pandas需要引入sqlalchemy來支持sql，在sqlalchemy的支持下，它可以實現(xiàn)所有常見數(shù)據(jù)庫類型的查詢、更新等操作。

　　代碼實現(xiàn)：

　　from sqlalchemy import create_engine
　　engine=create_engine('mysql+pymysql://root:wangyuqing localhost:3306/test01')
　　data=pd.read_csv('./tianchi_mobile_recommend_train_user.csv')
　　data.to_sql('user02',engine,chunksize=100000,index=None)
　　print('存入成功！')

　　總結(jié)

　　pymysql方法用時12分47秒，耗時還是比較長的，代碼量大，而pandas僅需五行代碼就實現(xiàn)了這個需求，只用了4分鐘左右。最后補充下，方式一需要提前建表，方式二則不需要。所以推薦大家使用第二種方式，既方便又效率高。如果還覺得速度慢的小伙伴，可以考慮加入多進程、多線程。

　　最全的三種將數(shù)據(jù)存入到MySQL數(shù)據(jù)庫方法：

　　直接存，利用navicat的導入向?qū)Чδ?/p>

　　Python pymysql

　　Pandas sqlalchemy

　　綜上所述，這篇文章就給大家介紹完畢了，希望可以給大家?guī)韼椭?/p>

云服務器 GPU云服務器 mysql千萬級數(shù)據(jù) 千萬級千萬級阿里云服務器價格 js讀取json數(shù)據(jù)并遍歷

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://www.ezyhdfw.cn/yun/128824.html

發(fā)表評論

登陸后可評論

0條評論

89542767

男|高級講師

我要關(guān)注我要私信

TA的文章

pythontime控制模塊時間格式與結(jié)構(gòu)型時長詳細說明

閱讀 1066·2023-01-14 11:38
OpenMV與JSON編碼問題分析

閱讀 1062·2023-01-14 11:04
python中的特性管理模式詳細說明

閱讀 901·2023-01-14 10:48
Python運用fastapi完成上傳圖片

閱讀 2377·2023-01-14 10:34
pythonopencv圖象高通濾波和低通濾波器的范例編碼

閱讀 1147·2023-01-14 10:24
Python根據(jù)ssh遠程桌面連接Mysql數(shù)據(jù)庫操作

閱讀 1026·2023-01-14 10:18
本文輕輕松松掌握Python中類的繼承

閱讀 654·2023-01-14 10:09
python中wordcloud組裝方式總結(jié)

閱讀 733·2023-01-14 10:02

亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python如何讀取千萬級數(shù)據(jù)并自動寫入MySQL數(shù)據(jù)庫

相關(guān)文章

**UPYUN Open Talk ：同盾，從零打造千萬級實時風控云服務**

三款新功能發(fā)布，助力阿里云表格存儲再次升級

**從0到千萬級并發(fā)服務架構(gòu)演化**

發(fā)表評論

0條評論

89542767

男|高級講師

TA的文章

pythontime控制模塊時間格式與結(jié)構(gòu)型時長詳細說明

OpenMV與JSON編碼問題分析

python中的特性管理模式詳細說明

Python運用fastapi完成上傳圖片

pythonopencv圖象高通濾波和低通濾波器的范例編碼

Python根據(jù)ssh遠程桌面連接Mysql數(shù)據(jù)庫操作

本文輕輕松松掌握Python中類的繼承

python中wordcloud組裝方式總結(jié)

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python如何讀取千萬級數(shù)據(jù)并自動寫入MySQL數(shù)據(jù)庫

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！