摘要:然而,它最終變成了一種昂貴的選擇,并不總是具有最新的統(tǒng)計功能。對于大多數(shù)專業(yè)人士而言,這是昂貴的且沒有能力以個人身份購買。
介紹
我們熱衷于比較!
從智能手機中的三星,蘋果和HTC,移動操作系統(tǒng)中的iOS,Android和Windows,到即將進行選舉的候選人的比較,或為世界杯團隊選擇隊長,比較和討論豐富了我們的生活。如果你喜歡討論,你需要做的就是在一個充滿激情的論壇里拋出一個相關的問題,然后看著它發(fā)酵。這個過程的美妙之處就在于,論壇里的每個人都是一個知識淵博的人。
那我在這里就拋出一個類似的話題—— SAS和R語言之爭可能是數(shù)據(jù)科學行業(yè)可能見證的最大爭辯,而Python是現(xiàn)在發(fā)展最快的語言之一,自成立以來已經(jīng)走過了漫長的道路。我開始討論這個話題不是想看它引爆全場(雖然這也很有趣),而是我知道我們都會從討論中受益。
這個問題也經(jīng)常在博客中被人們討論。所以,我想和大家一起討論!
在這個問題上討論的還不夠多嗎?可能是! 所以我還是覺得有必要進行討論,理由如下:
數(shù)據(jù)科學非常有活力,前兩年進行的討論可能與現(xiàn)在的情況沒什么關聯(lián)了。
傳統(tǒng)觀念里沒有把python列作比較之內(nèi),我覺得現(xiàn)在這是個非常值得深思的問題。
雖然我們將討論有關語言的全球趨勢,但我也將添加印度分析行業(yè)的相關具體信息(處于不同的發(fā)展水平)
好了,閑話少說,讓我們開始討論吧!
背景下面是一些關于這三個生態(tài)系統(tǒng)的簡要說明:
SAS:SAS一直是商業(yè)分析領域無可爭議的市場領導者。該軟件提供大量統(tǒng)計功能,具有良好的GUI,供人們快速學習,并提供強大的技術支持。然而,它最終變成了一種昂貴的選擇,并不總是具有最新的統(tǒng)計功能。
R:R是SAS的開源對應物,傳統(tǒng)上用于學術和研究。由于其開源性質(zhì),最新技術可以快速發(fā)布?;ヂ?lián)網(wǎng)上有很多相關文檔,R是一個非常劃算的選擇。
Python:作為一種開源腳本語言,Python的使用者數(shù)量隨著時間的推移而不斷增長。今天,它集成一些庫(numpy,scipy和matplotlib)和幾乎所有你可能想做的統(tǒng)計操作/模型構建的功能。自從引入pandas以來,它在結構化數(shù)據(jù)的操作方面變得非常強大。
屬性比較我將在以下屬性上比較這些語言:
1.可用性/成本
2.易于學習
3.數(shù)據(jù)處理能力
4.圖形功能
5.先進的工具
6.工作場景
7.深度學習支持
8.客戶服務支持和社區(qū)
我從分析師的角度來比較這些。 因此,如果您正在為您的公司尋找要購買的工具,您可能無法在此獲得完整的答案。但是以下信息仍然有用。 對于每個屬性,我給這三種語言中的每一種都給出一個分數(shù)(1 - 低 ; 5 - 高)。
這些參數(shù)的權重,根據(jù)您的職業(yè)生涯階段和雄心而有所不同。
可用性/成本SAS是一款商業(yè)軟件。對于大多數(shù)專業(yè)人士而言,這是昂貴的且沒有能力以個人身份購買。但是,它在私人企業(yè)中擁有最高的市場份額。 因此,除非您在投資了SAS的機構中,否則可能很難接觸到SAS。 盡管如此,SAS已經(jīng)引入了一個可以免費訪問的大學版,但它有一些局限性。在那里你也是可以使用 Jupyter notebook的!
另一方面,R&Python是完全免費的。以下是我對此參數(shù)的打分:
SAS - 3
R - 5
Python - 5
易于學習SAS易于學習,并為已經(jīng)了解SQL的人提供簡便的選項(PROC SQL)。 不僅如此,它在其存儲庫中具有良好的穩(wěn)定GUI界面。 在資源方面,各大學的網(wǎng)站上都有教程,SAS有全面的文檔。 從SAS培訓機構出來是可以獲得認證的,但它們也是需要一筆花費。
R在3種語言中具有最陡峭的學習曲線。它要求您學習和理解編碼。R是低級編程語言,因此簡單的過程可能需要較長的代碼。
Python因其編程世界的簡單性而聞名。 對于數(shù)據(jù)分析也是如此。,雖然目前還沒有廣泛的GUI界面,但我希望Python notebooks會變得越來越主流。 它們?yōu)槲臋n和共享提供了出色的功能。
SAS - 4.5
R - 2.5
Python - 3.5
數(shù)據(jù)處理能力這一度是SAS的優(yōu)勢。 R計算內(nèi)存(RAM)中的每一個單元,因此計算受到32位機器上的RAM數(shù)量的限制。 但是現(xiàn)在已不再是這種情況。 這三種語言都具有良好的數(shù)據(jù)處理能力和并行計算選項。我覺得這不再是一個很大的區(qū)別。 他們都帶來了Hadoop和Spark集成,他們也支持Cloudera和Apache Pig。
SAS - 4
R - 4
Python - 4
圖形功能SAS具有不錯的功能圖形功能。但是,它只是功能性的。對繪圖進行任何自定義都很困難,需要您了解SAS Graph包的復雜性。R和Python具有非常先進的圖形功能。 有許多軟件包可以為您提供高級圖形功能。隨著Plotly被引入兩種語言并且Python帶有Seaborn,制作自定義繪圖從未如此簡單。
SAS - 3
R - 4.5
Python - 4.5
先進的工具所有3個生態(tài)系統(tǒng)都具備所有基本和最需要的功能。 此功能僅在您處理最新技術和算法時才有意義。
由于其開放性,R&Python可以快速獲得最新功能。 另一方面,SAS更新了其在新版本推出中的功能。 由于R在過去被廣泛用于學術界,因此新技術的發(fā)展很快。
話雖如此,SAS在受控環(huán)境中發(fā)布更新,因此它們經(jīng)過了充分測試。 另一方面,R&Python有開放的貢獻,并且在最新的發(fā)展中存在錯誤的可能性。
SAS - 4
R - 4.5
Python - 4.5
工作場景在全球范圍內(nèi),SAS仍然是用于企業(yè)工作的市場領導者。大多數(shù)大公司仍在使用SAS。另一方面,R / Python是尋求成本效益的初創(chuàng)企業(yè)和公司的更好選擇。此外,據(jù)報道R / Python上的工作數(shù)量在過去幾年中有所增加。 這是一個在互聯(lián)網(wǎng)上廣泛發(fā)布的趨勢,它顯示了R和SAS工作的趨勢。 用于數(shù)據(jù)分析的Python作業(yè)與R作業(yè)具有相似或更高的趨勢:
下圖顯示了藍色的R和橙色的SAS:
這個圖表現(xiàn)了另一個方面,藍色的R與橙色的python:
總的來說,語言的市場可以用下圖表示:
SAS – 4
R – 4.5
Python – 4.5
客戶服務支持與社區(qū)R和Python擁有最大的在線社區(qū),但沒有客戶服務支持。 所以,如果你遇到麻煩,你就是靠自己。 你會得到很多幫助。另一方面,SAS提供專門的客戶服務與社區(qū)服務。 因此,如果您在安裝或任何其他技術挑戰(zhàn)方面遇到問題,可以與他們聯(lián)系。
SAS – 4
R – 3.5
Python – 3.5
深度學習支持SAS的深度學習仍處于起步階段,有很多工作要做。
另一方面,Python在該領域取得了很大的進步,并擁有許多軟件包,如Tensorflow和Keras。
R最近增加了對這些軟件包的支持,以及一些基礎的軟件包。 R中的kerasR和keras包充當了原始Python包,Keras的接口。
SAS – 2
Python – 4.5
R – 3
其他因素以下是一些值得注意的問題:
Python在Web開發(fā)中被廣泛使用。 因此,如果您從事在線業(yè)務,使用Python進行Web開發(fā)和分析可以提供協(xié)同效應。
SAS過去在部署端到端基礎架構(可視化分析,數(shù)據(jù)倉庫,數(shù)據(jù)質(zhì)量,報告和分析)方面具有很大的優(yōu)勢,這已經(jīng)通過在SAP HANA和Tableau等平臺上集成/支持R而得到緩解。 它仍然遠離SAS之類的無縫集成,但旅程已經(jīng)開始。
總結在今天的情景中,我們看到市場略微向Python傾斜??紤]到行業(yè)的動態(tài)性,投資將會占據(jù)優(yōu)勢。根據(jù)您的情況(職業(yè)階段,財務等),您可以添加自己的權重,并提出可能適合您的權重。以下是一些具體方案:
如果您是進入分析行業(yè)的新手(特別是在印度),我建議您學習SAS作為您的第一語言。它易于學習,占有最高的就業(yè)市場份額。
如果你是一個已經(jīng)在工業(yè)上花時間的人,你應該嘗試將你的專業(yè)知識多樣化,學習一種新工具。
對于行業(yè)的專家和專業(yè)人士,人們至少應該知道其中的兩個。這將為未來增加很多靈活性并開辟新的機會。
如果你是一個初創(chuàng)/自由職業(yè)者,R / Python更有用。
從戰(zhàn)略上講,需要更多實際操作幫助和培訓的企業(yè)設置選擇SAS作為選項。
研究人員和統(tǒng)計學家選擇R作為替代方案,因為它有助于繁重的計算。正如他們所說,R的目的是完成工作而不是簡化您的計算機。
由于其輕量級特性和不斷發(fā)展的社區(qū),Python已成為當今初創(chuàng)公司的明顯選擇。它也是深度學習的最佳選擇。
這是最終的得分表:
文章版權歸作者所有,未經(jīng)允許請勿轉載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉載請注明本文地址:http://www.ezyhdfw.cn/yun/44027.html
摘要:為了你最好的未來,請不斷的學習創(chuàng)始人兼首席執(zhí)行官人工智能和機器學習的時代已經(jīng)到來了,這些領域都有可能對印度的行業(yè)產(chǎn)生重大的影響。在印度努力重振生產(chǎn)力增長的同時,人工智能和機器學習有望填補這一空白。 showImg(http://upload-images.jianshu.io/upload_images/13825820-702c6873cd07cfc3.jpg?imageMogr2/...
摘要:概述在真實的數(shù)據(jù)科學世界里,我們會有兩個極端,一個是業(yè)務,一個是工程。偏向業(yè)務的數(shù)據(jù)科學被稱為數(shù)據(jù)分析,也就是型數(shù)據(jù)科學。所以說,同時學會和這兩把刷子才是數(shù)據(jù)科學的王道。 showImg(https://segmentfault.com/img/bVAgki?w=980&h=596); 概述 在真實的數(shù)據(jù)科學世界里,我們會有兩個極端,一個是業(yè)務,一個是工程。偏向業(yè)務的數(shù)據(jù)科學被稱為數(shù)據(jù)...
閱讀 1444·2021-11-24 09:39
閱讀 1413·2021-11-04 16:12
閱讀 2783·2021-09-24 09:47
閱讀 3406·2021-09-01 10:50
閱讀 1540·2019-08-30 15:55
閱讀 1485·2019-08-30 15:43
閱讀 702·2019-08-30 11:08
閱讀 3640·2019-08-23 18:33