亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

Python生成歌詞詞云

junbaor / 3560人閱讀

摘要:上面是生成詞云的方法封裝,還有一些其他方法根據(jù)詞頻生成詞云根據(jù)文本生成詞云根據(jù)詞頻生成詞云根據(jù)文本生成詞云將長(zhǎng)文本分詞并去除屏蔽詞此處指英語(yǔ),中文分詞還是需要自己用別的庫(kù)先行實(shí)現(xiàn),使用上面的對(duì)現(xiàn)有輸出重新著色。

對(duì)于數(shù)據(jù)展示這一塊有時(shí)候會(huì)用到詞云,python中提供的wordcloud模塊可以很靈活的完成
生成詞云除了使用python提供的wordcloud模塊以為還有在線的生成方式https://wordart.com/
安裝wordcloud

安裝wordcloud有兩種方式,一是直接通過(guò)pip install wordcloud
如果一直安裝失敗可以嘗試下面的方式,首先在鏈接中找到對(duì)應(yīng)的版本進(jìn)行下載https://www.lfd.uci.edu/~gohl...
在命令行中找到下載文件對(duì)應(yīng)的目錄進(jìn)行安裝

了解wordcloud

wordcloud 提供生成詞云方法的使用,其實(shí)具體只要看一下參數(shù)就可以

class wordcloud.WordCloud(font_path=None, width=400, height=200, margin=2, ranks_only=None, prefer_horizontal=0.9,mask=None, scale=1, color_func=None, max_words=200, min_font_size=4, stopwords=None, random_state=None,background_color="black", max_font_size=None, font_step=1, mode="RGB", relative_scaling=0.5, regexp=None, collocations=True,colormap=None, normalize_plurals=True)
#對(duì)應(yīng)參數(shù)的意思
font_path : string //字體路徑,需要展現(xiàn)什么字體就把該字體路徑+后綴名寫(xiě)上,如:font_path = "黑體.ttf"如果不指定字體中文字的顯示不出來(lái)
width : int (default=400) //輸出的畫(huà)布寬度,默認(rèn)為400像素
height : int (default=200) //輸出的畫(huà)布高度,默認(rèn)為200像素
prefer_horizontal : float (default=0.90) //詞語(yǔ)水平方向排版出現(xiàn)的頻率,默認(rèn) 0.9 (所以詞語(yǔ)垂直方向排版出現(xiàn)頻率為 0.1 )
mask : nd-array or None (default=None) //如果參數(shù)為空,則使用二維遮罩繪制詞云。如果 mask 非空,設(shè)置的寬高值將被忽略,遮罩形狀被 mask 取代。除全白(#FFFFFF)的部分將不會(huì)繪制,其余部分會(huì)用于繪制詞云。如:bg_pic = imread("讀取一張圖片.png"),背景圖片的畫(huà)布一定要設(shè)置為白色(#FFFFFF),然后顯示的形狀為不是白色的其他顏色??梢杂胮s工具將自己要顯示的形狀復(fù)制到一個(gè)純白色的畫(huà)布上再保存,就ok了。
scale : float (default=1) //按照比例進(jìn)行放大畫(huà)布,如設(shè)置為1.5,則長(zhǎng)和寬都是原來(lái)畫(huà)布的1.5倍。
min_font_size : int (default=4) //顯示的最小的字體大小
font_step : int (default=1) //字體步長(zhǎng),如果步長(zhǎng)大于1,會(huì)加快運(yùn)算但是可能導(dǎo)致結(jié)果出現(xiàn)較大的誤差。
max_words : number (default=200) //要顯示的詞的最大個(gè)數(shù)
stopwords : set of strings or None //設(shè)置需要屏蔽的詞,如果為空,則使用內(nèi)置的STOPWORDS
background_color : color value (default=”black”) //背景顏色,如background_color="white",背景顏色為白色。
max_font_size : int or None (default=None) //顯示的最大的字體大小
mode : string (default=”RGB”) //當(dāng)參數(shù)為“RGBA”并且background_color不為空時(shí),背景為透明。
relative_scaling : float (default=.5) //詞頻和字體大小的關(guān)聯(lián)性
color_func : callable, default=None //生成新顏色的函數(shù),如果為空,則使用 self.color_func
regexp : string or None (optional) //使用正則表達(dá)式分隔輸入的文本
collocations : bool, default=True //是否包括兩個(gè)詞的搭配
colormap : string or matplotlib colormap, default=”viridis” //給每個(gè)單詞隨機(jī)分配顏色,若指定color_func,則忽略該方法。

上面是生成詞云的方法封裝,還有一些其他方法:

fit_words(frequencies)  //根據(jù)詞頻生成詞云
generate(text)  //根據(jù)文本生成詞云
generate_from_frequencies(frequencies[, ...])   //根據(jù)詞頻生成詞云
generate_from_text(text)    //根據(jù)文本生成詞云
process_text(text)  //將長(zhǎng)文本分詞并去除屏蔽詞(此處指英語(yǔ),中文分詞還是需要自己用別的庫(kù)先行實(shí)現(xiàn),使用上面的 fit_words(frequencies) )
recolor([random_state, color_func, colormap])   //對(duì)現(xiàn)有輸出重新著色。重新上色會(huì)比重新生成整個(gè)詞云快很多。
to_array()  //轉(zhuǎn)化為 numpy array
to_file(filename)   //輸出到文件,很多時(shí)候詞云最后都需要保存到圖片中
根據(jù)圖像生成歌詞詞云

首先,詞云可以自己指定大小,也可以顯示到圖像上繪制,圖像在選擇上,盡量不要選擇太復(fù)雜的圖像,簡(jiǎn)單的黑白對(duì)比它識(shí)別的最好,如果沒(méi)有適合的圖片,自己打開(kāi)畫(huà)圖畫(huà)一個(gè)就是,下面我們來(lái)畫(huà)一個(gè)晴天娃娃

這個(gè)有點(diǎn)丑,但是意思就這個(gè),接下來(lái)創(chuàng)建一個(gè)文本文件,把歌詞放進(jìn)去
test.txt 內(nèi)容如下

你的繪畫(huà)凌亂著
在這個(gè)時(shí)刻
我像氣氛純白的白鴿
甜蜜散落了
繼續(xù)莫名的拉扯
我還愛(ài)你呢
而你斷斷續(xù)續(xù)唱著歌
假裝沒(méi)事了
時(shí)間過(guò)了 走了
愛(ài)情面臨選擇
你冷了 倦了 我哭了
一開(kāi)始都不快樂(lè)
你用卡片紙寫(xiě)著
有些愛(ài)只給到這 真的痛了
怎么了 你累了 說(shuō)好的 幸福呢
我懂了 不說(shuō)了 愛(ài)淡了 夢(mèng)遠(yuǎn)了
開(kāi)心與不開(kāi)心依稀數(shù)著你在不舍
那些愛(ài)過(guò)的感覺(jué)都太深刻
我都還記得
你不懂了 說(shuō)好的 幸福呢
我錯(cuò)了 淚干了 放手了 后悔了
只是回憶的音樂(lè)盒還旋轉(zhuǎn)著
要怎么停呢
你的繪畫(huà)凌亂著
在這個(gè)時(shí)刻
我像氣氛純白的白鴿
甜蜜散落了
繼續(xù)莫名的拉扯
我還愛(ài)你呢
而你斷斷續(xù)續(xù)唱著歌
假裝沒(méi)事了
時(shí)間過(guò)了 走了
愛(ài)情面臨選擇
你冷了 倦了 我哭了
一開(kāi)始都不快樂(lè)
你用卡片紙寫(xiě)著
有些愛(ài)只給到這 真的痛了
怎么了 你累了 說(shuō)好的 幸福呢
我懂了 不說(shuō)了 愛(ài)淡了 夢(mèng)遠(yuǎn)了
開(kāi)心與不開(kāi)心依稀數(shù)著你在不舍
那些愛(ài)過(guò)的感覺(jué)都太深刻
我都還記得
你不懂了 說(shuō)好的 幸福呢
我錯(cuò)了 淚干了 放手了 后悔了
只是回憶的音樂(lè)盒還旋轉(zhuǎn)著
要怎么停呢
怎么了 你累了 說(shuō)好的 幸福呢
我懂了 不說(shuō)了 愛(ài)淡了 夢(mèng)遠(yuǎn)了
我都還記得
你不懂了 說(shuō)好的 幸福呢
我錯(cuò)了 淚干了 放手了 后悔了
只是回憶的音樂(lè)盒還旋轉(zhuǎn)著
要怎么停呢

開(kāi)始生成詞云,最后輸出一個(gè)圖片文件

#導(dǎo)入wordcloud模塊
from wordcloud import  WordCloud
from scipy.misc import imread

#讀取一個(gè)txt文件
text = open("C:UsersAdministratorDesktoppython	est.txt","r", encoding="UTF-8").read()
#讀入背景圖片
bg_pic = imread("C:UsersAdministratorDesktoppython3.png")
#生成詞云
wordcloud = WordCloud(font_path="C:WindowsFontssimfang.ttf",mask=bg_pic,background_color="white",scale=1.5).generate(text)
#保存圖片
wordcloud.to_file("test.jpg")

最后文件夾內(nèi)會(huì)多出一個(gè)test.jpg文件,打開(kāi)就是根據(jù)這個(gè)歌詞的文本文件生成好的詞云了

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://www.ezyhdfw.cn/yun/41361.html

相關(guān)文章

  • Python 詞云分析周杰倫《晴天》

    摘要:詞云可以通過(guò)網(wǎng)站紐扣詞云來(lái)制作,然而可以通過(guò)代碼來(lái)實(shí)現(xiàn),下面開(kāi)始吧。 詞云可以通過(guò)網(wǎng)站 https://wordart.com/ 紐扣詞云http://cloud.niucodata.com/ 來(lái)制作,然而 Python 可以通過(guò)代碼來(lái)實(shí)現(xiàn),下面開(kāi)始吧。 showImg(https://segmentfault.com/img/bVQzIx?w=874&h=416); pip inst...

    DoINsiSt 評(píng)論0 收藏0
  • python 生成18年寫(xiě)過(guò)的博客詞云

    摘要:處理文件最終得到的字符串得到所有的文本之后,使用結(jié)巴分詞,處理成單個(gè)的詞語(yǔ)。 文章鏈接:https://mp.weixin.qq.com/s/NmJjTEADV6zKdT--2DXq9Q 回看18年,最有成就的就是有了自己的 博客網(wǎng)站,堅(jiān)持記錄,寫(xiě)文章,累計(jì)寫(xiě)了36篇了,從一開(kāi)始的難以下手,到現(xiàn)在成為一種習(xí)慣,雖然每次寫(xiě)都會(huì)一字一句斟酌,但是每次看到產(chǎn)出,內(nèi)心還是開(kāi)心的,享受這樣的過(guò)...

    xi4oh4o 評(píng)論0 收藏0
  • Python如何生成詞云(詳解)

    摘要:前言今天教大家用模塊來(lái)生成詞云,我讀取了一篇小說(shuō)并生成了詞云,先看一下效果圖效果圖一效果圖二根據(jù)效果圖分析的還是比較準(zhǔn)確的,小說(shuō)中的主人公就是程理,所以出現(xiàn)次數(shù)最多。 前言 今天教大家用wrodcloud模塊來(lái)生成詞云,我讀取了一篇小說(shuō)并生成了詞云,先看一下效果圖: 效果圖一: showImg(https://segmentfault.com/img/remote/1460000015...

    Juven 評(píng)論0 收藏0
  • Python wordcloud庫(kù)學(xué)習(xí)小結(jié)

    摘要:庫(kù)常規(guī)方法方法描述例子向?qū)ο笾屑虞d文本將詞云輸出為圖像文件,或格式應(yīng)用實(shí)例配置對(duì)象參數(shù)加載詞云文本輸出詞云文件分隔以空格分隔單詞統(tǒng)計(jì)單詞出現(xiàn)次數(shù)并過(guò)濾字體根據(jù)統(tǒng)計(jì)配置字號(hào)布局顏色環(huán)境尺寸配置對(duì)象參數(shù)參數(shù)參數(shù)描述例子指定詞云對(duì)象生成圖片的寬度 wordcloud庫(kù)常規(guī)方法 w = wordcloud.WordCloud() 方法 描述 例子 w.generate(txt) 向w...

    Jokcy 評(píng)論0 收藏0
  • 2018微博詞云項(xiàng)目深度解析

    摘要:最初產(chǎn)生這個(gè)項(xiàng)目的想法應(yīng)該是在年月份,當(dāng)時(shí)正在學(xué)習(xí)中,就萌生了這樣一個(gè)想法從一個(gè)用戶這一年發(fā)布的微博數(shù)據(jù)中,提取最有意義的個(gè)關(guān)鍵詞。這些東西提交完就可以提交審核了,微博應(yīng)用審核的速度還算比較快的,一兩天基本差不多會(huì)審核完。 最初產(chǎn)生這個(gè)項(xiàng)目的想法應(yīng)該是在2018年10月份,當(dāng)時(shí)正在學(xué)習(xí)python中,就萌生了這樣一個(gè)想法:從一個(gè)用戶這一年發(fā)布的微博數(shù)據(jù)中,提取最有意義的top50個(gè)關(guān)鍵...

    TANKING 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<