python 西游记
导读:Python是一门广受欢迎的编程语言,而《西游记》是中国一部经典的文学作品。结合二者,我们可以运用Python来处理《西游记》这本巨著。# 导入中文分词库jiebaimport jieba# 读取《西游记》txt文件并分词with open...
Python是一门广受欢迎的编程语言,而《西游记》是中国一部经典的文学作品。结合二者,我们可以运用Python来处理《西游记》这本巨著。
# 导入中文分词库jiebaimport jieba# 读取《西游记》txt文件并分词with open('西游记.txt', 'r', encoding='utf-8') as f:content = f.read()words = jieba.lcut(content)# 统计分词结果中的词频,并输出前20个词频最高的词汇word_freq = { } for word in words:if len(word) == 1:continueelse:word_freq[word] = word_freq.get(word, 0) + 1top20 = sorted(word_freq.items(), key=lambda x:x[1], reverse=True)[:20]for word, freq in top20:print(word, freq)
上述代码使用了中文分词库jieba,将《西游记》文本进行了分词,并统计了词频。运行结果会输出前20个词频最高的词语。
除此之外,我们还可以将Python和可视化相结合,使用词云图呈现《西游记》中常出现的词汇。
# 导入词云库wordcloud和matplotlibfrom wordcloud import WordCloudimport matplotlib.pyplot as plt# 将前1000个词汇作为词云图text = ' '.join(word for word, freq in top1000)wc = WordCloud(font_path='msyh.ttc',max_words=1000,width=800,height=600,background_color='white',colormap='Blues').generate(text)plt.figure(figsize=(10, 8))plt.imshow(wc, interpolation='bilinear')plt.axis('off')plt.show()
这段代码使用了词云库WordCloud,将前1000个高频词汇转换成词云图,并使用matplotlib进行可视化展示。
Python为我们带来了更高效、更便捷的数据处理方式,而结合文学经典作品《西游记》,更是激发了Python的无限创造力。
声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!
若转载请注明出处: python 西游记
本文地址: https://pptw.com/jishu/339697.html