陈程的技术博客

  • 关于作者
全栈软件工程师
一个专注于技术研究创新的程序员
  1. 首页
  2. python
  3. 正文

批量合并pdf文件

2021年6月8日 711点热度 0人点赞 0条评论
import codecs
import os
import PyPDF2 as PyPDF2

def mergePdf(path,files,saveName): 
    pdfwriter = PyPDF2.PdfFileWriter()
    for item in files:
        pdfreader = PyPDF2.PdfFileReader(open(path + '/' + item,"rb"))
        for page in range(pdfreader.numPages):
            pdfwriter.addPage(pdfreader.getPage(page))
    
    with codecs.open(saveName,"wb") as f:
        pdfwriter.write(f)


def main():
    pdfUrl = "mergefrom"
    pdftoUrl = "mergeto"
    if not os.path.exists(pdftoUrl):
        os.makedirs(pdftoUrl)
    fileList = os.listdir(pdfUrl)
    index = 1
    for itemdir in  fileList:
        files = os.listdir(pdfUrl + "/" + itemdir)
        saveName = pdftoUrl + "/" + itemdir
        if not os.path.exists(saveName):
            os.makedirs(saveName)
        checkfiles = None
        try:
            newfiles = sorted(files,key=lambda d: int(d.split(".pdf")[0]))
            checkfiles = newfiles
        except Exception as e:
            checkfiles = files
        path = pdfUrl + "/" + itemdir
        mergePdf(path,checkfiles,saveName + "/" + itemdir + ".pdf")
        print("合并成功," + str(index))
        index+=1
    print("合并完成成功,请在mergeto文件夹中寻找合并成功的文件")
    input()


if __name__ == "__main__":
    main()

 

标签: pdf python
最后更新:2021年6月8日

博主

全栈工程师,侧重项目技术解决方案规划和开发

打赏 点赞
< 上一篇
下一篇 >

文章评论

取消回复

分类
  • .NET (65)
  • docker (3)
  • linux (12)
  • python (20)
  • web (14)
  • 小程序 (4)
  • 数据库 (2)
  • 未分类 (4)
  • 杂七杂八 (10)
标签聚合
linux DevExpress C# python js nginx winform centos
最新 热点 随机
最新 热点 随机
.NET开发手册标准参考 招募兼职前端开发 Centos安装dotnet6环境 VS上切换分支,vs编译运行出现bug,A fatal error was encountered彻底解决方案 用C#封装一个线程安全的缓存器,达到目标定时定量更新入库 C#通过特性的方式去校验指定数据是否为空
使用NW.js把B/S应用做成跨平台桌面应用 sqlserver 查询数据库名 表名 字段名 字段类型等 paddleX 模型标注后数据集转换 js操作localStorage保存本地json文件的方法 RestSharp 接口请求封装类 C# 采用Automation控制自动化操作第三方软件

COPYRIGHT © 2021 陈程的技术博客. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS