python爬取网页内容转换为PDF文件
本文实例为大家分享了python爬取网页内容转换为PDF的具体代码,供大家参考,具体内容如下
将廖雪峰的学习教程转换成PDF文件,代码只适合该网站,如果需要其他网站的教程,可靠需要进行稍微的修改。
#coding=utf-8
importos
importre
importtime
importpdfkit
importrequests
frombs4importBeautifulSoup
fromPyPDF2importPdfFileMerger
importsys
reload(sys)
sys.setdefaultencoding('utf8')
html_template="""
{content}