Python_正则表达式匹配Word⽂档使⽤正则表达式匹配Word⽂档中的所有字符
1、原⽂内容如下:
writelines使用方法python
2、期望得到的结果:
3、源码:
//
from docx import Document
import re
pattern = repile("\d{6}[\u4e00-\u9fff]+") # 正则表达式
# pattern = repile("\d{6}[^A-Za-z0-9\!\%\[\]\,\。]+")
doc =Document('./地区码.docx') # 原⽂件
fo =open('','a') # 保存的⽂件,
for i in doc.paragraphs:# 读取所有的段落
st = pattern.)# 按正则表达式匹配区号和地名
for t in st: # 遍历分离的区号和地名
# print(t)
txt = t[:6]+','+ t[6:]+'\n' # 在区号和地名间加上逗号和换⾏符。
fo.writelines(txt)# 写⼊⽂件
fo.close()