分類模型——Logistics Regression

kumfo 發(fā)布于2019-07-31 11:03 / 2736人閱讀

摘要：和準(zhǔn)確率不同，曲線對(duì)分類比例不平衡的數(shù)據(jù)集不敏感，曲線顯示的是對(duì)超過(guò)限定閾值的所有預(yù)測(cè)結(jié)果的分類器效果。曲線畫(huà)的是分類器的召回率與誤警率的曲線。

Logistics regression

from sklearn.linear_model import LogisticRegression
clf = LogisticRegression()
clf.fit(x_train, y_train)

準(zhǔn)確率與召回率

準(zhǔn)確率：scikit-learn提供了accuracy_score來(lái)計(jì)算：LogisticRegression.score()
準(zhǔn)確率是分類器預(yù)測(cè)正確性的比例，但是并不能分辨出假陽(yáng)性錯(cuò)誤和假陰性錯(cuò)誤
精確率是指分類器預(yù)測(cè)出的垃圾短信中真的是垃圾短信的比例，P=TP/(TP+FP)
召回率在醫(yī)學(xué)上也叫做靈敏度，在本例中知所有真的垃圾短信被分類器正確找出來(lái)的比例，R=TP/(TP+FN)

from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score  
predictions = clf.predict(x_test)  
print("準(zhǔn)確率：", accuracy_score(y_test, predictions))  
print("精確率：", precision_score(y_test, predictions))  
print("召回率：", recall_score(y_test, predictions))  
print("F1-Score：", f1_score(y_test, predictions))  

from sklearn.metrics import classification_report, accuracy_score, confusion_matrix  
predictions = clf.predict(x_test)  
print("準(zhǔn)確率：", accuracy_score(y_test, predictions))  
print("混淆矩陣：", confusion_matrix(y_test, predictions))  
print("分類報(bào)告：", classification_report(y_test, predictions))

ROC AUC

ROC曲線（Receiver Operating Characteristic，ROC curve）可以用來(lái)可視化分類器的效果。和準(zhǔn)確率不同，ROC曲線對(duì)分類比例不平衡的數(shù)據(jù)集不敏感，ROC曲線顯示的是對(duì)超過(guò)限定閾值的所有預(yù)測(cè)結(jié)果的分類器效果。ROC曲線畫(huà)的是分類器的召回率與誤警率（fall-out）的曲線。誤警率也稱假陽(yáng)性率，是所有陰性樣本中分類器識(shí)別為陽(yáng)性的樣本所占比例：
F=FP/(TN+FP) AUC是ROC曲線下方的面積，它把ROC曲線變成一個(gè)值，表示分類器隨機(jī)預(yù)測(cè)的效果.

from sklearn.metrics import roc_curve, auc  
predictions = clf.predict_proba(x_test)  
false_positive_rate, recall, thresholds = roc_curve(y_test, predictions[:, 1])  
roc_auc = auc(false_positive_rate, recall)  
plt.title("Receiver Operating Characteristic")  
plt.plot(false_positive_rate, recall, "b", label="AUC = %0.2f" % roc_auc)  
plt.legend(loc="lower right")  
plt.plot([0, 1], [0, 1], "r--")  
plt.xlim([0.0, 1.0])  
plt.ylim([0.0, 1.0])  
plt.ylabel("Recall")  
plt.xlabel("Fall-out")  
plt.show()

模型原理

http://blog.csdn.net/sergeyca...
http://blog.csdn.net/zjuPeco/...

云服務(wù)器 GPU云服務(wù)器 Logistics regression logistic-regression 對(duì)象模型與數(shù)據(jù)模型

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://www.ezyhdfw.cn/yun/44571.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

kumfo

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

搬瓦工，CN2 GIA-E 限量版套餐補(bǔ)貨，$84/年，可隨意切換為美國(guó)cn2 gia、日本軟銀、荷

閱讀 3783·2021-10-18 13:34
raksmart：I3-2120物理機(jī)$30/月甩賣，爆款VPS僅月付$1.99，此外洛杉磯/韓國(guó)/

閱讀 2494·2021-08-11 11:15
關(guān)于vertical-align

閱讀 1305·2019-08-30 15:44
微前端 —— project2項(xiàng)目（VUE）

閱讀 784·2019-08-26 10:32
React 328道最全面試題(持續(xù)更新)

閱讀 1054·2019-08-26 10:13
事件訂閱廣播組件

閱讀 2133·2019-08-23 18:36
【Vue原理】Event - 白話版

閱讀 1844·2019-08-23 18:35
Git Bash常見(jiàn)命令

閱讀 591·2019-08-23 17:10

亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

分類模型——Logistics Regression

相關(guān)文章

TensorFlow學(xué)習(xí)筆記（3）：邏輯回歸

機(jī)器學(xué)習(xí) 面試常見(jiàn)問(wèn)題&答案 ②

發(fā)表評(píng)論

0條評(píng)論

kumfo

男|高級(jí)講師

TA的文章

搬瓦工，CN2 GIA-E 限量版套餐補(bǔ)貨，$84/年，可隨意切換為美國(guó)cn2 gia、日本軟銀、荷

raksmart：I3-2120物理機(jī)$30/月甩賣，爆款VPS僅月付$1.99，此外洛杉磯/韓國(guó)/

關(guān)于vertical-align

微前端 —— project2項(xiàng)目（VUE）

React 328道最全面試題(持續(xù)更新)

事件訂閱廣播組件

【Vue原理】Event - 白話版

Git Bash常見(jiàn)命令

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

分類模型——Logistics Regression

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！