当前位置: 首页 > news >正文

Python之PDF小工具

Python之PDF小工具

【穷鬼套餐(买不起WPS会员)】这是一个多功能工具,既可以将EPUB电子书转换为PDF格式,也可以对现有的PDF文件进行拆分。

1-epub_to_pdf

#!/usr/bin/env python3""" epub_to_pdf.py ebooklib>=0.20、weasyprint>=66.0 实测通过 """importosimportsysimportebooklibfromebooklibimportepubfromweasyprintimportHTMLfromweasyprint.text.fontsimportFontConfigurationdefconvert_epub_to_pdf(src_epub:str,dst_pdf:str|None=None)->str|None:"""把单个 epub 转 pdf,返回输出文件路径;失败返回 None"""try:book=epub.read_epub(src_epub)html_parts=[]foriteminbook.get_items():ifitem.get_type()==ebooklib.ITEM_DOCUMENT:html_parts.append(item.get_content().decode('utf-8',errors='ignore'))ifnothtml_parts:raiseValueError('文档不包含可解析章节')# 拼成完整 HTMLfull_html=f""" <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <style> body {{ font-family: "PingFang SC", "Helvetica Neue", "Arial", sans-serif; line-height: 1.6; }} </style> </head> <body>{''.join(html_parts)}</body> </html> """ifdst_pdfisNone:out_dir=os.path.join('.','pdf')os.makedirs(out_dir,exist_ok=True)title=os.path.splitext(os.path.basename(src_epub))[0]dst_pdf=os.path.join(out_dir,f"{title}.pdf")HTML(string=full_html).write_pdf(dst_pdf,font_config=FontConfiguration())print(f"✅ 成功:{dst_pdf}")returndst_pdfexceptExceptionase:print(f"❌ 失败:{src_epub}\n原因:{e}")returnNonedefmain(target):ifos.path.isfile(target)andtarget.lower().endswith('.epub'):convert_epub_to_pdf(target)elifos.path.isdir(target):epub_files=[fforfinos.listdir(target)iff.lower().endswith('.epub')]ifnotepub_files:print('📂 该目录下没有 epub 文件')returnforfinepub_files:convert_epub_to_pdf(os.path.join(target,f))# ----------------------------# 脚本入口# ----------------------------if__name__=='__main__':# if len(sys.argv) != 2:# print('用法:python epub_to_pdf.py <epub文件或文件夹路径>')# sys.exit(1)## target = sys.argv[1]main("/Users/rong/Documents/09-深度学习/epub_book")

2-epub_to_pdf

#!/usr/bin/env python3""" epub_to_pdf.py ebooklib>=0.20、weasyprint>=66.0 实测通过 """importsysimportos# 添加PyPDF2库用于PDF操作try:importPyPDF2 PDF_LIBRARY_AVAILABLE=TrueexceptImportError:PyPDF2=NonePDF_LIBRARY_AVAILABLE=Falsedefsplit_pdf(input_pdf_path:str,output_pdf_path:str,pdf_file_name:str,start_page:int,end_page:int)->bool:"""按指定页码范围拆分PDF文件"""ifnotPDF_LIBRARY_AVAILABLE:print("❌ 错误:缺少PyPDF2库,请安装PyPDF2")returnFalsetry:withopen(input_pdf_path+pdf_file_name,'rb')asinfile:reader=PyPDF2.PdfReader(infile)writer=PyPDF2.PdfWriter()# 检查页码范围是否有效total_pages=len(reader.pages)ifstart_page<1orend_page>total_pagesorstart_page>end_page:print(f"❌ 错误:页码范围无效。总页数:{total_pages},请求范围:{start_page}-{end_page}")returnFalse# 提取指定页面foriinrange(start_page-1,end_page):# 页码从0开始索引writer.add_page(reader.pages[i])# 确保输出目录存在os.makedirs(output_pdf_path,exist_ok=True)# 写入新文件output_file_name=output_pdf_path+str(start_page)+"_"+str(end_page)+"_"+pdf_file_namewithopen(output_file_name,'wb')asoutfile:writer.write(outfile)print(f"✅ 成功拆分PDF:{input_pdf_path}的第{start_page}-{end_page}页已保存到{output_file_name}")returnTrueexceptExceptionase:print(f"❌ 拆分PDF失败:{e}")returnFalsedefmain(pdf_file):split_pdf(pdf_file,"output.pdf",1,10)# ----------------------------# 脚本入口# ----------------------------if__name__=='__main__':input_pdf_path="./pdf/"output_pdf_path="./pdf_split/"input_pdf_name="曾国藩传_张宏杰.pdf"success=split_pdf(input_pdf_path,output_pdf_path,input_pdf_name,1,115)success=split_pdf(input_pdf_path,output_pdf_path,input_pdf_name,115,206)success=split_pdf(input_pdf_path,output_pdf_path,input_pdf_name,206,338)sys.exit(0ifsuccesselse1)

3-项目说明

功能特性

  1. EPUB转PDF转换器
  2. PDF文件按页码范围拆分

安装依赖

pipinstall-r requirements.txt

或者使用uv:

uv pipinstall-r.

使用方法

EPUB转PDF

python main.py<epub文件或文件夹路径>

示例:

# 转换单个EPUB文件python main.py books/example.epub# 转换目录下的所有EPUB文件python main.py books/

拆分PDF文件

python main.pysplit<输入PDF文件><输出PDF文件><起始页码><结束页码>

示例:

# 拆分PDF的第5页到第10页python main.pysplitinput.pdf output.pdf510

依赖库

  • ebooklib: 处理EPUB文件
  • weasyprint: 将HTML转换为PDF
  • PyPDF2: 操作PDF文件
http://www.cnnetsun.cn/news/186473.html

相关文章:

  • Windows驱动存储清理指南:5步释放宝贵磁盘空间
  • 终极QQ空间数据备份方案:GetQzonehistory完整操作指南
  • Display Driver Uninstaller终极指南:彻底清理显卡驱动残留问题
  • 显卡驱动彻底卸载终极解决方案:DDU工具深度使用指南
  • 虚拟显示器终极攻略:5分钟打造专业级多屏工作站
  • 数字电路仿真验证:Proteus示波器配置操作指南
  • DriverStore Explorer终极指南:轻松管理Windows驱动程序释放磁盘空间
  • iOS定制美化新纪元:免越狱个性化工具深度体验指南
  • 数字记忆守护者:一键永久备份你的QQ空间青春档案
  • Windows驱动管理终极指南:简单高效的驱动存储区优化方案
  • 2025终极方案:虚拟显示器高效配置与多场景应用完全指南
  • Display Driver Uninstaller专业使用手册:彻底解决显卡驱动疑难杂症
  • DriverStore Explorer终极指南:快速清理Windows驱动,释放磁盘空间
  • 终极Driver Store Explorer使用指南:Windows驱动管理的5个核心技巧
  • Windows驱动管理神器:DriverStore Explorer深度使用指南
  • 为什么你的电脑越用越慢?这个免费工具能帮你快速释放数GB空间
  • Driver Store Explorer终极指南:5分钟快速掌握Windows驱动管理
  • 仿写Parsec VDD虚拟显示器文章的Prompt
  • 低代码革命:Vite-Vue3-Lowcode如何重塑前端开发范式
  • iOS设备个性化定制完全指南:无需越狱的深度自定义方案
  • Windows驱动管理终极指南:DriverStore Explorer完整教程
  • RimSort终极指南:轻松解决RimWorld模组管理难题
  • Display Driver Uninstaller完全指南:轻松解决显卡驱动残留难题
  • GetQzonehistory完整指南:5分钟学会备份QQ空间所有历史数据
  • Windows驱动存储清理终极指南:10个专业技巧彻底优化系统性能
  • 罗技鼠标宏完整配置手册:轻松实现绝地求生自动压枪
  • 大学生必备!8个免费AI写论文工具:一键生成初稿,AIGC率低至13%
  • 终极Windows驱动清理指南:彻底释放磁盘空间
  • Fansly下载器:你的私人内容收藏管家
  • 强力QQ空间数据备份方案:一键永久保存青春记忆