parent
239cbdbf51
commit
2f15c5ea26
@ -1,32 +0,0 @@
|
|||||||
import jieba
|
|
||||||
import matplotlib.pyplot as plt
|
|
||||||
import wordcloud
|
|
||||||
|
|
||||||
txt=open("D:\文本素材\西游记.txt","r",encoding='utf-8').read()
|
|
||||||
|
|
||||||
word = jieba.lcut(txt)
|
|
||||||
data ={}
|
|
||||||
for ch in word:
|
|
||||||
if len(ch)==1:
|
|
||||||
continue
|
|
||||||
elif ch=="行者"or ch=="悟空":
|
|
||||||
ch ="孙悟空"
|
|
||||||
elif ch=="三藏":
|
|
||||||
ch="唐僧"
|
|
||||||
elif ch=="八戒":
|
|
||||||
ch ="猪八戒"
|
|
||||||
else:
|
|
||||||
ch =ch
|
|
||||||
data[ch] = data.get(ch,0)+1
|
|
||||||
item = sorted(data.items(),key=lambda x:x[1],reverse=True)
|
|
||||||
print(item)
|
|
||||||
text =""
|
|
||||||
for i in item:
|
|
||||||
text+=" "+i[0]
|
|
||||||
w =wordcloud.WordCloud(font_path="msyh.ttc",width=400,height=200,background_color="white",max_words=50)
|
|
||||||
w.generate(text)
|
|
||||||
plt.imshow(w)
|
|
||||||
plt.axis('off')
|
|
||||||
plt.show()
|
|
||||||
w.to_file("threekingdoms.png")
|
|
||||||
|
|
Loading…
Reference in new issue