文档介绍:Python读写word
docx
和docx2
txt包示例,python,
使用,实例
简介
doc是微软的专有的文件格式,
docx是Microsoft
Office2007
之后版本使用,其基于Offi
Python读写word
docx
和docx2
txt包示例,python,
使用,实例
简介
doc是微软的专有的文件格式,
docx是Microsoft
Office2007
之后版本使用,其基于OfficeOpenXML标准的压缩文件格式,
比doc文件所占用空间更小。docx格式的文件本质上是一个ZI
P文件,,解压后,里
面的word/,图片文件则保存在word/media里面。
docx包
python-,间接解决方法是在代码里面先把
python-docx,
对象,处理对象。
模块会把word
文档中的段落、文本、字体等看作
?Document
对象:一个
word文档
?Paragraph
对象:word
文档中的一个段落
?Paragraph
对象的text
属性:段落的义本内容
安装
pipinstallpython-docx
使用实例1:读fromdocximportDocument
defreadDocx(fileName):
doc=Document(fileName)
pythonUnicodeEncodeError:'gbk'codeccan'tencodecharacter'\xef'inposi
outFile=open("a."+fileName+".txt",”w
encoding='utf-8')
#:
print()
#每一段的编号、内容
foriinrange(len()):(str(i)+""+
[i].text+"\n")
#表格
tbs=
fortbintbs:
#行
#列
forcell
outFile
:
.write(+"\t")
outFile
.write("\n")
#也可以用下面方法
text=''
:
text+=
print(text)
写
fromdocximportDocument
defcreateDocx():
document=Document()
#添加标题并设置级别,范围0-9,默认1
("Title",0)
p=("aplainparagraphlalalal")
#在段落后面追加文本,并设置样式
#直接