摘要:主頁腳本頁面單頁面注意下載文件配置中的路徑。一個簡單的操作集群的是不是很簡單。正在新增版深度學(xué)習(xí)功能謝謝支持。
簡書博客: https://www.jianshu.com/u/3fe... 百度云搜索:http://www.lqkweb.com 搜網(wǎng)盤:http://www.swpan.cn 淘寶券搜索:http://www.wodecai.cn 淘寶券:http://www.tbquan.cn 你我搜:http://www.niwosou.cn 開源Flask+Bootstrap網(wǎng)址導(dǎo)航: http://hao.tbquan.cn
開發(fā)交流QQ群: 941879291
SQLflow (python3.6)SQLflow based on python development, support to Spark, as the underlying distributed computing engine, through a set of unified configuration file to complete the batch, flow calculation, the Rest service development.
主頁:
SQLflow 基于python開發(fā), 支持通過寫sql的方式操作分布式集群, 數(shù)據(jù)處理, 機器學(xué)習(xí)、深度學(xué)習(xí)模型訓(xùn)練, 模型部署, 分布式爬蟲, 數(shù)據(jù)可視化等。
Buildpython3.6
git clone https://github.com/lqkweb/sql...
pip install -r requirements.txt
python manage.py
主頁:http://127.0.0.1:5000
腳本頁面:http://127.0.0.1:5000/script
單sql頁面:http://127.0.0.1:5000/sql
【注意:1、下載apache spark文件配置manage.py中的SPARK_HOME路徑。2、data.csv是放到sqlflow/data目錄中】
Usage在腳本執(zhí)行頁面:http://127.0.0.1:5000/script 輸入 select from A limit 3; 或者 select from A limit 3 as B; 生成臨時表A或者B
生成臨時表A數(shù)據(jù):
select * from A limit 3;
生成臨時表B數(shù)據(jù):
select * from A limit 3 as B;
打開單sql執(zhí)行頁面:http://127.0.0.1:5000/sql, 直接就可以用spark sql任意語法操作數(shù)據(jù)表A和數(shù)據(jù)表B了:
desc A select * from A limit 2 select * from B limit 2
[注] "as B" 相當(dāng)于創(chuàng)建了一個 B 臨時表。
一個簡單的sql操作spark集群的Demo,是不是很簡單。
[附] sparksql doc: https://spark.apache.org/docs...
還有更多sql版黑科技,sql版scikitlearn, sqlspider, sqlcharts, sqlkeras深度學(xué)習(xí)平臺正在內(nèi)測中! 正在新增sql版機器學(xué)習(xí)算法功能, 謝謝支持。 正在新增sql版爬蟲功能, 謝謝支持。 正在新增sql版數(shù)據(jù)可視化功能, 謝謝支持。 正在新增sql版keras深度學(xué)習(xí)功能, 謝謝支持。 記得給個star鼓勵一下!Thanks?(?ω?)?文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://www.ezyhdfw.cn/yun/43201.html
摘要:大數(shù)據(jù)除了體積和速度外,數(shù)據(jù)的多樣性和準(zhǔn)確性也是大數(shù)據(jù)的一大特點。這些也被稱為大數(shù)據(jù)的特征。介紹是一個解決大數(shù)據(jù)問題的分布式可伸縮的框架。介紹計算的模型最早出現(xiàn)在谷歌的一篇研究論文中。相關(guān)鏈接介紹是一個通用的分布式編程框架。 本文作者:foochane?本文鏈接:https://foochane.cn/article/2019060601.html 1 大數(shù)據(jù)簡介 大數(shù)據(jù)是這個時代最...
摘要:數(shù)據(jù)科學(xué)任務(wù)主要是數(shù)據(jù)分析領(lǐng)域,數(shù)據(jù)科學(xué)家要負(fù)責(zé)分析數(shù)據(jù)并建模,具備統(tǒng)計預(yù)測建模機器學(xué)習(xí)等方面的經(jīng)驗,以及一定的使用或語言進(jìn)行編程的能力。監(jiān)控運行時性能指標(biāo)信息。 Spark Spark 背景 什么是 Spark 官網(wǎng):http://spark.apache.org Spark是一種快速、通用、可擴展的大數(shù)據(jù)分析引擎,2009年誕生于加州大學(xué)伯克利分校AMPLab,2010年開源,20...
摘要:而道器相融,在我看來,那煉丹就需要一個好的丹爐了,也就是一個優(yōu)秀的機器學(xué)習(xí)平臺。因此,一個機器學(xué)習(xí)平臺要取得成功,最好具備如下五個特點精辟的核心抽象一個機器學(xué)習(xí)平臺,必須有其靈魂,也就是它的核心抽象。 *本文首發(fā)于 AI前線 ,歡迎轉(zhuǎn)載,并請注明出處。 摘要 2017年6月,騰訊正式開源面向機器學(xué)習(xí)的第三代高性能計算平臺 Angel,在GitHub上備受關(guān)注;2017年10月19日,騰...
閱讀 4474·2021-11-22 09:34
閱讀 2759·2021-11-12 10:36
閱讀 802·2021-08-18 10:23
閱讀 2693·2019-08-30 15:55
閱讀 3225·2019-08-30 15:53
閱讀 2137·2019-08-30 15:44
閱讀 1409·2019-08-29 15:37
閱讀 1521·2019-08-29 13:04