2025年3月27日 星期四 甲辰(龙)年 月廿六 设为首页 加入收藏
rss
您当前的位置:首页 > 计算机 > 编程开发 > Python

python --读pdf详解

时间:08-16来源:作者:点击数:26

python --读pdf详解

pdfminer3k

装包

  • pip install pdfminer3k

详解

  • # -*- encoding: utf-8 -*-
  • from io import StringIO
  • from pdfminer.pdfinterp import PDFResourceManager, process_pdf
  • from pdfminer.converter import TextConverter
  • from pdfminer.layout import LAParams
  • # 读取pdf的函数,返回内容
  • def readPdf(pdf_file):
  • rsrcmgr = PDFResourceManager()
  • retstr = StringIO()
  • laparams = LAParams()
  • device = TextConverter(rsrcmgr=rsrcmgr, outfp=retstr, laparams=laparams)
  • process_pdf(rsrcmgr=rsrcmgr, device=device, fp=pdf_file)
  • device.close()
  • content = retstr.getvalue()
  • retstr.close()
  • return content
  • pdf_file = open(r'C:\Users\EDY\Desktop\2.pdf', 'rb')
  • content = readPdf(pdf_file)
  • print(content)
  • pdf_file.close()
方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门
本栏推荐