您当前的位置:首页 > 计算机 > 编程开发 > Python

python 用pandleocr批量图片读取表格并且保存为excel

时间:04-07来源:作者:点击数:

导包,这个很重要稍微有点难度噢

pip install opencv-python

pip install paddlepaddle

需要下载一个文件layoutparser-0.0.0-py3-none-any.whl,点击下载

把他保存到我们的文件里面

在这里插入图片描述

然后

pip install layoutparser-0.0.0-py3-none-any.whl

再导包

pip install paddleocr

如果会报错,咱就是说电脑没有安装.NET c++这个的话

官网地址记住是c++

然后创建一个文件夹存放图片,我写的代码的文件名是img

在这里插入图片描述
import cv2
from paddleocr import PPStructure,draw_structure_result,save_structure_res

table_engine = PPStructure(show_log=True)

import os

is_exists = os.listdir("img")#读取图片文件位置
print(is_exists)
for i in is_exists:
    img_path = 'img/'+i
    img = cv2.imread(img_path)
    result = table_engine(img)
    print(result)
    save_structure_res(result, 'where', 'ex01')#存放位置
    print(i)

下面我们以随机百度的图片为主进行测试

在这里插入图片描述

这里也是选取了两张幸运儿

在这里插入图片描述

结果出来了

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

结果嘛可能还是不够好噢,如果说想追求更好的识别效果,可以自己下载模型进行训练

附上官网地址点击进入paddlepaddle文档

在这里插入图片描述

最后有什么问题欢迎留言或者私信能解决的尽量解决,不能的嘛那就,没办法喽

方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门