python 实现提取PPT中所有的文字
我就废话不多说了,大家还是直接看代码吧~
#导入pptx包 frompptximportPresentation prs=Presentation(path_to_presentation) text_runs=[] forslideinprs.slides: forshapeinslide.shapes: ifnotshape.has_text_frame: continue forparagraphinshape.text_frame.paragraphs: forruninparagraph.runs: text_runs.append(run.text)
补充:使用python-pptx-interface将PPT转换成图片
▌00简单方法
最简单的方法就是使用PPTX的File中的SaveAs命令,将PPTX文件另存为JPEG格式。
▲使用PPT的SaveAs将PPTX存储为JPEG
注意,在最后一步的时候需要选择“所有幻灯片(A)”。
▲选择所有幻灯片
最后,PPTX的每张幻灯片都以独立文件方式保存到文件中。X
这部分的内容可以参照:HowtoExportPowerPointSlidesasJPGorOtherImageFormats中的介绍。
▌01使用Python-PPTX
1.简介
python-pptx是用于创建和更新PointPoint(PPTX)文件的Python库。
一种常用的场合就是从数据库内容生成一个客户定制的PointPoint文件,这个过程通过点击WEB应用上的连接完成。许多开发之通过他们日常管理系统生成工程状态汇报PPT。它也可以用于批量生成PPT或者产品特性说明PPT。
python-pptLicense:
TheMITLicense(MIT)Copyright©2013SteveCanny,https://github.com/scanny
Python-PPTX对应的官方网络网址:Python-PPTXhttps://python-pptx.readthedocs.io/en/latest/user/intro.html#
2.安装
使用pip进行安装:
pipinstallpython-pptx
对于python要求:Python2.7,3.3,3.4,3.6
依赖库:
Python2.6,2.7,3.3,3.4,or3.6 lxml Pillow XlsxWriter(tousechartingfeatures)
▌02测试
下面的例子来自于:GetStart。
1.HelloWord
frompptximportPresentation prs=Presentation() title_slide_layout=prs.slide_layouts[0] slide=prs.slides.add_slide(title_slide_layout) title=slide.shapes.title subtitle=slide.placeholders[1] title.text='Helloworld!' subtitle.text='python-pptxwashere.' prs.save(r'd:\temp\test.pptx') printf("\a")
2.Add_TextBox
frompptximportPresentation frompptx.utilimportInches,Pt prs=Presentation() blank_slide_layout=prs.slide_layouts[6] slide=prs.slides.add_slide(blank_slide_layout) left=top=width=height=Inches(1) txBox=slide.shapes.add_textbox(left,top,width,height) tf=txBox.text_frame tf.text="Thisistextinsideatextbox" p=tf.add_paragraph() p.text="Thisisasecondparagraphthat'sbold" p.font.bold=True p=tf.add_paragraph() p.text="Thisisathirdparagraphthat'sbig" p.font.size=Pt(40) prs.save(r'd:\temp\test1.pptx')
▌03输出JPEG
1.安装python-pptx-interface
pipinstallpython-pptx-interface
2.转换PPTX
注意:转换生成的目录必须使用新的目录。否则就会出现:
Folderd:\temp\pptimagealreadyexists.Setoverwrite_folder=True,ifyouwanttooverwritefoldercontent.
frompptx_toolsimportutils pptfile=r'D:\Temp\如何搭建自己的电子实验室_20210102R10.pptx' png_folder=r'd:\temp\pptimage' utils.save_pptx_as_png(png_folder,pptfile,overwrite_folder=True)
生成后的PPT对应的PNGImage。
▲生成后的PPTX对应的PNG图片
※结论
将PPTX转换成图片,可以便于后期将文件上载到CSDN,或者用于DOP文件的制作。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持毛票票。如有错误或未考虑完全的地方,望不吝赐教。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。