python分析红楼梦出现的虚词词频统计,python对红楼梦的每
⼀章节进⾏词频统计
python对红楼梦的每⼀章节进⾏词频统计
python对红楼梦的每⼀章节进⾏词频统计
import jieba
f=open("G:\\红楼梦.txt","r",encoding="utf-8")tablets中文什么意思
ad()
words=jieba.lcut(txt)#精准模式
ls=[]
for word in words:
a={}javascript弹窗
if word[0] == "第" and word[-1] == "回":
if word in ls:
continue
else:
ls.append(word)
print(ls)
for i in range(len(ls)):
print(ls[i])
a={}
if i
for word in words[words.index(ls[i])+1:words.index(ls[i + 1])]:
if len(word) == 1: # 排除单个字符的统计结果
continue
else:
a[word] = a.get(word, 0) + 1
elif i ==len(ls)-1:#最后⼀回
for word in words[words.index(ls[i])+1:]:
if len(word) == 1: # 排除单个字符的统计结果
continue
else:
a[word] = a.get(word, 0) + 1
items = list(a.items()) # 将字典转换为记录列表
items.sort(key=lambda x: x[1], reverse=True) # 记录第⼆列排序
for i in range(5):
word, count = items[i]
print("{0:<10}{1:>5}".format(word, count))
print("\n")
f.close()
python入门教程非常详细word第⼀步是打开红楼梦.txt⽂件,只读的⽅式,使⽤UTF-8编码⽅式
第⼆步是使⽤精准模式,将单词保存到words列表中,再将“第⼏回”存放到⼀个新的列表中,便于对红楼梦⽂件每⼀回进⾏切⽚,切边的界点便是第多少回这样的字眼,第⼀种统计是第i回到第i+1回的之间的词频统计,还有⼀种就是最后⼀回的词频统计。
使⽤⼀个字典类型a={},统计单词的次数:
for word in words:
if len(word)==1:#排除单个字符的统计结果
continue
else:
a[word]=a.get(word,0)+1
修改滚动条的样式及位置如果字符长度为1则跳过,否则使⽤a.get(word,0)⽅法表⽰:如果word在a中则返回word对应的值,如果word不在a中就返回0。
第三步是对单词的统计的值从⾼到低进⾏排序,输出前5个⾼频词语,并格式化打印输出。由于字典没有顺序,需要将其转换为有顺序的列表类型,再使⽤sort()⽅法和lambda函数配合实现单词出现的次数,对元素进⾏排序。最后输出排序结果前15位的单词。
items=list(a.items())#将字典转换为记录列表
items.sort(key=lambda x:x[1],reverse=True)#记录第⼆列排序
python对红楼梦的每⼀章节进⾏词频统计相关教程
Python爬⾍⼊门实例六之IP地址归属地的⾃动查询
瞧瞧,这样的代码才叫 Pythonic
瞧瞧,这样的代码才叫 Pythonic 作者|写代码的明哥 来源 | Python编程时光(ID:Cool-Python) 头图 |
CSDN下载⾃东⽅IC Python由于语⾔的简洁性,让我们以⼈类思考的⽅式来写代码,新⼿更容易上⼿,⽼鸟更爱不释⼿。 要写出 Pythonic(优雅的、地道的、整洁
最全总结 | 聊聊 Python 办公⾃动化之 Excel(中)
最全总结 | 聊聊 Python 办公⾃动化之 Excel(中) 聊聊 Python 数据处理全家桶(Memca 篇) 点击上⽅“AirPython”,选择“加为星标”第⼀时间关注 Python 技术⼲货! 上⼀篇⽂章中,我们聊到使⽤xlrd、xlwt、xlutils 这⼀组合操作 Excel 的⽅法 最全总结 |
python:Cartopy的基础使⽤
python:Cartopy的基础使⽤ ⽂章⽬录 前⾔ ⼀、基础介绍 ⼆、区域地图的绘制 总结 前⾔ 常⽤地图底图的绘制⼀般由Basemap或者cartopy模块完成,由于Basemap库是基于python2开发的⼀个模块,⽬前已经不开发维护。故简单介绍cartopy模块的⼀些基础操作。⼀、基
使⽤Python创建词云
使⽤Python创建词云 介绍 从开始从事数据可视化⼯作的那⼀天起,我就爱上它了,我总是喜欢从数据中获得有⽤的见解。 在此之前,我只了解基本图表,例如条形图,散点图,直⽅图等,这些基本图表内置在tableau中,⽽Power BI则⽤于数据可视化。通过每天完成此任
Opencv python 漫⽔填充(魔棒处理)
Opencv python 漫⽔填充(魔棒处理) 处理代码 import cv2 as cvimport numpy as npdef main(): # 1.导⼊图⽚ img_org =insert into select from dual
cv.imread(./img.png, cv.IMREAD_COLOR) # 2.设置参数 seed_point = (290, 290) # 坐标 new_val = (255, 255, 255) # 赋新值lower_diff =
OpenCV+python识别并打印HSV颜⾊
accept encoding
OpenCV+python识别并打印HSV颜⾊ import cv2import imutilscap = cv2.VideoCapture(0)## Readimg =
cv2.imread(D:/deng/ppp/3.png)def Detector_color(): while(True): # Capture frame-by-frame ret, frame = ad() frame = size(frame, widt