摘要:保存打開執(zhí)行打開的時(shí)候要先加載一個(gè)包第二節(jié)畫個(gè)圖的方法風(fēng)格面向?qū)ο螽媹D第節(jié)簡(jiǎn)易線型圖先設(shè)置。是一個(gè)可以裝圖形文字的容器是帶有刻度和標(biāo)簽的矩形。
第 4 章是講用matplotlib畫圖
期待已久的內(nèi)容,用可視化展示數(shù)據(jù)比丟一張數(shù)據(jù)表給他好的多,在建模的時(shí)候先畫個(gè)圖會(huì)清晰不少,下面進(jìn)入正題:
數(shù)據(jù)源:當(dāng)然是上一章最后一節(jié)的提取了小時(shí)的sougou數(shù)據(jù)
第一節(jié):保存
就是教你怎么保存畫的圖,然后再打開它。
保存:fig.savefig("myfigure.png")
打開:Image("myfigure.png") 執(zhí)行打開的時(shí)候要先加載一個(gè)包: from IPython.display import Image
第二節(jié):畫2個(gè)圖的方法
-- matlab風(fēng)格plt.figure()
plt.subplot(2,1,1)
plt.plot(df.ranks,df.numbers)
plt.subplot(2,1,2)
plt.plot(df.numbers, df.ranks)
fig,ax = plt.subplots(2)
ax[0].plot(df["rank"],df.hours)
ax[1].plot(df["number"],df.hours)
第 3 節(jié):簡(jiǎn)易線型圖
先設(shè)置fig, ax。 fig是一個(gè)可以裝圖形、文字的容器;ax是帶有刻度和標(biāo)簽的矩形。設(shè)置好之后再用ax.plot畫圖
fig = plt.figure() ax = plt.axes() ax.plot(df["number"],df["rank"])-- 穿插一個(gè)小插曲:在用sogou數(shù)據(jù)畫圖的時(shí)候,出現(xiàn)這個(gè)提示:
ValueError: x and y must have same first dimension, but have shapes (1,) and (823818,) 用df.rank查看數(shù)據(jù)時(shí),出現(xiàn)的是多列數(shù)據(jù),而不是一列,所以畫圖的時(shí)候出現(xiàn)了x,y沒有相同的坐標(biāo)。
晚上問的大神,他說你先用df["rank"]試下能不能正常顯示,結(jié)果是正常的。那可能是df.rank是調(diào)用了內(nèi)置函數(shù),以后用中括號(hào)就可以了。
color = "" 顏色支持英文、代碼、灰度、16進(jìn)制、RGB、HTML顏色
linestyle = "" 線條的樣式,比如---.:等
df.groupby("hours")["hours"].count().plot(color = "g",linestyle = ":")-- 設(shè)置坐標(biāo)軸上下限
有兩種方法,效果是一樣的
#設(shè)置 x, y 軸的起始值 df.groupby("hours")["hours"].count().plot(color = "g",linestyle = ":") plt.xlim(0,30) #只能設(shè)置范圍,不能規(guī)定跨度 plt.ylim(10000,100000) #方法2: df.groupby("hours")["hours"].count().plot(color = "g",linestyle = ":") plt.axis([0,25,0,120000]) # plt.axis("")有很其他的功能,可以查看文檔顯示圖例
圖例是label,設(shè)置好圖例后要用plt.legend()才能打印圖例
df.groupby("hours")["rank"].sum().plot(color = "r",linestyle = ":",label="The red data") df.groupby("hours")["hours"].count().plot(color = "g",label = "search/hour") plt.legend() # legend(lable = ["",""], loc = "") label是圖例的名稱,同上;loc是圖例的位置
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://www.ezyhdfw.cn/yun/45003.html
摘要:一周沒寫文了,之前干什么去了呢本周前半部分卡在畫圖了,然后的時(shí)間在處理數(shù)據(jù),處理數(shù)據(jù)是我目前在畫圖和機(jī)器學(xué)習(xí)上一個(gè)重大的障礙,處理各種報(bào)錯(cuò)各種不適合,等我學(xué)會(huì)了和你再來堵我呀 一周沒寫文了,之前干什么去了呢?本周前半部分卡在畫圖了,然后1/3的時(shí)間在處理數(shù)據(jù),處理數(shù)據(jù)是我目前在畫圖和機(jī)器學(xué)習(xí)上一個(gè)重大的障礙,python處理各種報(bào)錯(cuò)各種不適合,等我學(xué)會(huì)了kettle和spark你再來堵...
摘要:時(shí)間序列,日期格式處理原以為本章是講怎么用處理時(shí)間格式,比如提取年月之類的。新增一列日期,不要時(shí)分新增兩列年,月,以便后續(xù)分析。這個(gè)方法太復(fù)雜,而且處理時(shí)間可能會(huì)更長(zhǎng),看下面的簡(jiǎn)單方法新增月份年。 時(shí)間序列,日期格式處理 原以為本章是講怎么用python處理時(shí)間格式,比如提取年月之類的。 但本節(jié)寫的是時(shí)間格式已經(jīng)工整后的事,暫時(shí)不是我想學(xué)的,所以跳過,就沒有寫公式了。 下面的函數(shù)時(shí)之前...
摘要:主成分分析就是降維,通過線性組合,把多個(gè)原始變量合并成若干個(gè)主成分,這樣每個(gè)主成分都變成原始變量的線性組合。相關(guān)系數(shù)系數(shù)為為為。從結(jié)果看,這個(gè)數(shù)據(jù)可能不太適合用來分析,因?yàn)榻档骄S后的代筆性不足。 這兩天用學(xué)了主成分分析,用的是PCA。主成分分析就是降維,通過線性組合,把多個(gè)原始變量合并成若干個(gè)主成分,這樣每個(gè)主成分都變成原始變量的線性組合。所以你想看具體哪個(gè)特征對(duì)結(jié)果的影響大,通過PC...
今天開始學(xué)習(xí)《數(shù)據(jù)科學(xué)手冊(cè)》,主要學(xué)習(xí)3-5章,其他的選修。 -- 先連接數(shù)據(jù)庫(kù)加載數(shù)據(jù): 用sqlalchemy 的create_engine連接: 注意:代碼里mysql+pymysql: 這部分不能加空格,否則會(huì)報(bào)錯(cuò) import pymysql import pandas as pd from sqlalchemy import create_engine sql = select...
摘要:貢獻(xiàn)者飛龍版本最近總是有人問我,把這些資料看完一遍要用多長(zhǎng)時(shí)間,如果你一本書一本書看的話,的確要用很長(zhǎng)時(shí)間。為了方便大家,我就把每本書的章節(jié)拆開,再按照知識(shí)點(diǎn)合并,手動(dòng)整理了這個(gè)知識(shí)樹。 Special Sponsors showImg(https://segmentfault.com/img/remote/1460000018907426?w=1760&h=200); 貢獻(xiàn)者:飛龍版...
閱讀 962·2021-11-15 11:37
閱讀 3780·2021-11-11 16:55
閱讀 3335·2021-11-11 11:01
閱讀 1055·2019-08-30 15:43
閱讀 2801·2019-08-30 14:12
閱讀 738·2019-08-30 12:58
閱讀 3457·2019-08-29 15:19
閱讀 2092·2019-08-29 13:59