博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
中文词频统计
阅读量:5959 次
发布时间:2019-06-19

本文共 414 字,大约阅读时间需要 1 分钟。

import jiebatxt = open('小说.txt','r',encoding='utf-8').read()for i in ',。、:;“” \u3000':    txt = txt.replace(i,'')words = list(jieba.cut(txt)) dic = {}keys = set(words)for o in keys:    if len(o)==1:        continue    else:          dic[o] = words.count(o)+1 wc =list(dic.items())wc.sort(key=lambda x:x[1],reverse=True) for i in range(20):    print(wc[i])

  

 

转载于:https://www.cnblogs.com/Sun584125503/p/7609597.html

你可能感兴趣的文章
List与数组的相互转换
查看>>
Computer Science Theory for the Information Age-4: 一些机器学习算法的简介
查看>>
socketserver模块使用方法
查看>>
json模块
查看>>
各型号英特尔CUP的功率
查看>>
scanf()中的%c 不能正常输入的问题
查看>>
encodeURIcomponent编码和ASP.NET之间编码转换
查看>>
实验三 区域四连通填充算法
查看>>
关闭selinux服务
查看>>
centos中安装、升级git
查看>>
单元测试基本路径覆盖法(转)
查看>>
十三、栅栏CyclicBarrier
查看>>
简单搭配(Collocation)隐私声明
查看>>
2013编程之美资格赛【传话游戏】
查看>>
关于Dictionary的线程安全问题
查看>>
在python中单线程,多线程,多进程对CPU的利用率实测以及GIL原理分析
查看>>
CentOS6.5+mysql5.1源码安装过程
查看>>
Js 笔记
查看>>
C++: find()函数的注意事项
查看>>
js的事件学习笔记
查看>>