您当前的位置:首页 > 计算机 > 编程开发 > Python

python --读pdf详解

时间:08-16来源:作者:点击数:

python --读pdf详解

pdfminer3k

装包

pip install pdfminer3k

详解

# -*- encoding: utf-8 -*-
from io import StringIO

from pdfminer.pdfinterp import PDFResourceManager, process_pdf
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams


# 读取pdf的函数,返回内容
def readPdf(pdf_file):
    rsrcmgr = PDFResourceManager()
    retstr = StringIO()
    laparams = LAParams()
    device = TextConverter(rsrcmgr=rsrcmgr, outfp=retstr, laparams=laparams)

    process_pdf(rsrcmgr=rsrcmgr, device=device, fp=pdf_file)
    device.close()

    content = retstr.getvalue()
    retstr.close()

    return content


pdf_file = open(r'C:\Users\EDY\Desktop\2.pdf', 'rb')
content = readPdf(pdf_file)
print(content)
pdf_file.close()
方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门
本栏推荐