亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

python與R(對比SAS),我該選擇哪種工具?

BDEEFE / 1271人閱讀

摘要:然而,它最終變成了一種昂貴的選擇,并不總是具有最新的統(tǒng)計功能。對于大多數(shù)專業(yè)人士而言,這是昂貴的且沒有能力以個人身份購買。

介紹

我們熱衷于比較!

從智能手機中的三星,蘋果和HTC,移動操作系統(tǒng)中的iOS,Android和Windows,到即將進行選舉的候選人的比較,或為世界杯團隊選擇隊長,比較和討論豐富了我們的生活。如果你喜歡討論,你需要做的就是在一個充滿激情的論壇里拋出一個相關的問題,然后看著它發(fā)酵。這個過程的美妙之處就在于,論壇里的每個人都是一個知識淵博的人。

那我在這里就拋出一個類似的話題—— SAS和R語言之爭可能是數(shù)據(jù)科學行業(yè)可能見證的最大爭辯,而Python是現(xiàn)在發(fā)展最快的語言之一,自成立以來已經(jīng)走過了漫長的道路。我開始討論這個話題不是想看它引爆全場(雖然這也很有趣),而是我知道我們都會從討論中受益。

這個問題也經(jīng)常在博客中被人們討論。所以,我想和大家一起討論!

在這個問題上討論的還不夠多嗎?

可能是! 所以我還是覺得有必要進行討論,理由如下:

數(shù)據(jù)科學非常有活力,前兩年進行的討論可能與現(xiàn)在的情況沒什么關聯(lián)了。

傳統(tǒng)觀念里沒有把python列作比較之內(nèi),我覺得現(xiàn)在這是個非常值得深思的問題。

雖然我們將討論有關語言的全球趨勢,但我也將添加印度分析行業(yè)的相關具體信息(處于不同的發(fā)展水平)

好了,閑話少說,讓我們開始討論吧!

背景

下面是一些關于這三個生態(tài)系統(tǒng)的簡要說明:

SAS:SAS一直是商業(yè)分析領域無可爭議的市場領導者。該軟件提供大量統(tǒng)計功能,具有良好的GUI,供人們快速學習,并提供強大的技術支持。然而,它最終變成了一種昂貴的選擇,并不總是具有最新的統(tǒng)計功能。

R:R是SAS的開源對應物,傳統(tǒng)上用于學術和研究。由于其開源性質(zhì),最新技術可以快速發(fā)布?;ヂ?lián)網(wǎng)上有很多相關文檔,R是一個非常劃算的選擇。

Python:作為一種開源腳本語言,Python的使用者數(shù)量隨著時間的推移而不斷增長。今天,它集成一些庫(numpy,scipy和matplotlib)和幾乎所有你可能想做的統(tǒng)計操作/模型構建的功能。自從引入pandas以來,它在結構化數(shù)據(jù)的操作方面變得非常強大。

屬性比較

我將在以下屬性上比較這些語言:

1.可用性/成本

2.易于學習

3.數(shù)據(jù)處理能力

4.圖形功能

5.先進的工具

6.工作場景

7.深度學習支持

8.客戶服務支持和社區(qū)

我從分析師的角度來比較這些。 因此,如果您正在為您的公司尋找要購買的工具,您可能無法在此獲得完整的答案。但是以下信息仍然有用。 對于每個屬性,我給這三種語言中的每一種都給出一個分數(shù)(1 - 低 ; 5 - 高)。

這些參數(shù)的權重,根據(jù)您的職業(yè)生涯階段和雄心而有所不同。

可用性/成本

SAS是一款商業(yè)軟件。對于大多數(shù)專業(yè)人士而言,這是昂貴的且沒有能力以個人身份購買。但是,它在私人企業(yè)中擁有最高的市場份額。 因此,除非您在投資了SAS的機構中,否則可能很難接觸到SAS。 盡管如此,SAS已經(jīng)引入了一個可以免費訪問的大學版,但它有一些局限性。在那里你也是可以使用 Jupyter notebook的!

另一方面,R&Python是完全免費的。以下是我對此參數(shù)的打分:

SAS - 3

R - 5

Python - 5

易于學習

SAS易于學習,并為已經(jīng)了解SQL的人提供簡便的選項(PROC SQL)。 不僅如此,它在其存儲庫中具有良好的穩(wěn)定GUI界面。 在資源方面,各大學的網(wǎng)站上都有教程,SAS有全面的文檔。 從SAS培訓機構出來是可以獲得認證的,但它們也是需要一筆花費。

R在3種語言中具有最陡峭的學習曲線。它要求您學習和理解編碼。R是低級編程語言,因此簡單的過程可能需要較長的代碼。

Python因其編程世界的簡單性而聞名。 對于數(shù)據(jù)分析也是如此。,雖然目前還沒有廣泛的GUI界面,但我希望Python notebooks會變得越來越主流。 它們?yōu)槲臋n和共享提供了出色的功能。

SAS - 4.5

R - 2.5

Python - 3.5

數(shù)據(jù)處理能力

這一度是SAS的優(yōu)勢。 R計算內(nèi)存(RAM)中的每一個單元,因此計算受到32位機器上的RAM數(shù)量的限制。 但是現(xiàn)在已不再是這種情況。 這三種語言都具有良好的數(shù)據(jù)處理能力和并行計算選項。我覺得這不再是一個很大的區(qū)別。 他們都帶來了Hadoop和Spark集成,他們也支持Cloudera和Apache Pig。

SAS - 4

R - 4

Python - 4

圖形功能

SAS具有不錯的功能圖形功能。但是,它只是功能性的。對繪圖進行任何自定義都很困難,需要您了解SAS Graph包的復雜性。R和Python具有非常先進的圖形功能。 有許多軟件包可以為您提供高級圖形功能。隨著Plotly被引入兩種語言并且Python帶有Seaborn,制作自定義繪圖從未如此簡單。

SAS - 3

R - 4.5

Python - 4.5

先進的工具

所有3個生態(tài)系統(tǒng)都具備所有基本和最需要的功能。 此功能僅在您處理最新技術和算法時才有意義。

由于其開放性,R&Python可以快速獲得最新功能。 另一方面,SAS更新了其在新版本推出中的功能。 由于R在過去被廣泛用于學術界,因此新技術的發(fā)展很快。

話雖如此,SAS在受控環(huán)境中發(fā)布更新,因此它們經(jīng)過了充分測試。 另一方面,R&Python有開放的貢獻,并且在最新的發(fā)展中存在錯誤的可能性。

SAS - 4

R - 4.5

Python - 4.5

工作場景

在全球范圍內(nèi),SAS仍然是用于企業(yè)工作的市場領導者。大多數(shù)大公司仍在使用SAS。另一方面,R / Python是尋求成本效益的初創(chuàng)企業(yè)和公司的更好選擇。此外,據(jù)報道R / Python上的工作數(shù)量在過去幾年中有所增加。 這是一個在互聯(lián)網(wǎng)上廣泛發(fā)布的趨勢,它顯示了R和SAS工作的趨勢。 用于數(shù)據(jù)分析的Python作業(yè)與R作業(yè)具有相似或更高的趨勢:

下圖顯示了藍色的R和橙色的SAS:


這個圖表現(xiàn)了另一個方面,藍色的R與橙色的python:


總的來說,語言的市場可以用下圖表示:

SAS – 4

R – 4.5

Python – 4.5

客戶服務支持與社區(qū)

R和Python擁有最大的在線社區(qū),但沒有客戶服務支持。 所以,如果你遇到麻煩,你就是靠自己。 你會得到很多幫助。另一方面,SAS提供專門的客戶服務與社區(qū)服務。 因此,如果您在安裝或任何其他技術挑戰(zhàn)方面遇到問題,可以與他們聯(lián)系。

SAS – 4

R – 3.5

Python – 3.5

深度學習支持

SAS的深度學習仍處于起步階段,有很多工作要做。

另一方面,Python在該領域取得了很大的進步,并擁有許多軟件包,如Tensorflow和Keras。

R最近增加了對這些軟件包的支持,以及一些基礎的軟件包。 R中的kerasR和keras包充當了原始Python包,Keras的接口。

SAS – 2

Python – 4.5

R – 3

其他因素

以下是一些值得注意的問題:

Python在Web開發(fā)中被廣泛使用。 因此,如果您從事在線業(yè)務,使用Python進行Web開發(fā)和分析可以提供協(xié)同效應。

SAS過去在部署端到端基礎架構(可視化分析,數(shù)據(jù)倉庫,數(shù)據(jù)質(zhì)量,報告和分析)方面具有很大的優(yōu)勢,這已經(jīng)通過在SAP HANA和Tableau等平臺上集成/支持R而得到緩解。 它仍然遠離SAS之類的無縫集成,但旅程已經(jīng)開始。

總結

在今天的情景中,我們看到市場略微向Python傾斜??紤]到行業(yè)的動態(tài)性,投資將會占據(jù)優(yōu)勢。根據(jù)您的情況(職業(yè)階段,財務等),您可以添加自己的權重,并提出可能適合您的權重。以下是一些具體方案:

如果您是進入分析行業(yè)的新手(特別是在印度),我建議您學習SAS作為您的第一語言。它易于學習,占有最高的就業(yè)市場份額。

如果你是一個已經(jīng)在工業(yè)上花時間的人,你應該嘗試將你的專業(yè)知識多樣化,學習一種新工具。

對于行業(yè)的專家和專業(yè)人士,人們至少應該知道其中的兩個。這將為未來增加很多靈活性并開辟新的機會。

如果你是一個初創(chuàng)/自由職業(yè)者,R / Python更有用。

從戰(zhàn)略上講,需要更多實際操作幫助和培訓的企業(yè)設置選擇SAS作為選項。

研究人員和統(tǒng)計學家選擇R作為替代方案,因為它有助于繁重的計算。正如他們所說,R的目的是完成工作而不是簡化您的計算機。

由于其輕量級特性和不斷發(fā)展的社區(qū),Python已成為當今初創(chuàng)公司的明顯選擇。它也是深度學習的最佳選擇。

這是最終的得分表:

文章版權歸作者所有,未經(jīng)允許請勿轉載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉載請注明本文地址:http://www.ezyhdfw.cn/yun/44027.html

相關文章

  • 一份關于人工智能、機器學習和大數(shù)據(jù)的報告

    摘要:為了你最好的未來,請不斷的學習創(chuàng)始人兼首席執(zhí)行官人工智能和機器學習的時代已經(jīng)到來了,這些領域都有可能對印度的行業(yè)產(chǎn)生重大的影響。在印度努力重振生產(chǎn)力增長的同時,人工智能和機器學習有望填補這一空白。 showImg(http://upload-images.jianshu.io/upload_images/13825820-702c6873cd07cfc3.jpg?imageMogr2/...

    Carbs 評論0 收藏0
  • [原]深入對比數(shù)據(jù)科學工具箱:PythonR之爭[2016版]

    摘要:概述在真實的數(shù)據(jù)科學世界里,我們會有兩個極端,一個是業(yè)務,一個是工程。偏向業(yè)務的數(shù)據(jù)科學被稱為數(shù)據(jù)分析,也就是型數(shù)據(jù)科學。所以說,同時學會和這兩把刷子才是數(shù)據(jù)科學的王道。 showImg(https://segmentfault.com/img/bVAgki?w=980&h=596); 概述 在真實的數(shù)據(jù)科學世界里,我們會有兩個極端,一個是業(yè)務,一個是工程。偏向業(yè)務的數(shù)據(jù)科學被稱為數(shù)據(jù)...

    whidy 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<