1 / 7
文档名称:

Python读写word文档docx和docx2txt包示例,python,使用,实例.docx

格式:docx   大小:23KB   页数:7页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

文档介绍:Python读写word
docx
和docx2
txt包示例,python,
使用,实例

简介


doc是微软的专有的文件格式,
docx是Microsoft
Office2007
之后版本使用,其基于Offi
Python读写word
docx
和docx2
txt包示例,python,
使用,实例

简介


doc是微软的专有的文件格式,
docx是Microsoft
Office2007
之后版本使用,其基于OfficeOpenXML标准的压缩文件格式,
比doc文件所占用空间更小。docx格式的文件本质上是一个ZI
P文件,所以其实也可以把.docx文件直接改成.zip,解压后,里
面的word/document.xml包含了Word文档的大部分内容,图片文件则保存在word/media里面。
docx包
python-docx不支持.doc文件,间接解决方法是在代码里面先把
doc转为.docxo
python-docx,
对象,处理对象。
模块会把word
文档中的段落、文本、字体等看作
?Document
对象:一个
word文档
?Paragraph
对象:word
文档中的一个段落
?Paragraph
对象的text
属性:段落的义本内容


安装
pipinstallpython-docx
使用实例1:读fromdocximportDocument
defreadDocx(fileName):
doc=Document(fileName)
pythonUnicodeEncodeError:'gbk'codeccan'tencodecharacter'\xef'inposi
outFile=open("a."+fileName+".txt",”w
encoding='utf-8')
#forparaindoc.paragraphs:
print(para.txt)
#每一段的编号、内容
foriinrange(len(doc.paragraphs)):outFile.write(str(i)+""+
doc.paragraphs[i].text+"\n")
#表格
tbs=doc.tables
fortbintbs:
#行
forrowintb.rows
#列
forcell
outFile
inrow.cells:
.write(cell.text+"\t")
outFile
.write("\n")
#也可以用下面方法
text=''
forpincell.paragraphs:
text+=p.text
print(text)

fromdocximportDocument
fromdocx.sharedimportInches
defcreateDocx():
document=Document()
#添加标题并设置级别,范围0-9,默认1
document.add_heading("Title",0)
p=document.add_paragraph("aplainparagraphlalalal")
#在段落后面追加文本,并设置样式
#直接

分享好友

预览全文

Python读写word文档docx和docx2txt包示例,python,使用,实例.docx

上传人:yusuyuan 2022/5/8 文件大小:23 KB

下载得到文件列表

Python读写word文档docx和docx2txt包示例,python,使用,实例.docx

相关文档