Python的openpyxl封装实现读取表格数据
数字一律按浮点型输出,日期输出成一串小数,布尔型输出0或1,所以我们必须在程序中做判断处理转换 成我们想要的数据类型 ctype的取值:0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error
#!/usr/bin/env python
# coding=utf-8
# 封装实现读取表格数据
# 2018.11.10增加了如果不传sheet_name默认读取第一个表格的功能
# 2022.1.10 write_excel增加了设置日期格式的单元格,写入日期格式一般是写入公式:=Date(2022,01,02)
# 2022.2.7 dict_data 优化了获取数据的代码
import xlrd,os
from xlrd import xldate_as_tuple
from datetime import datetime
from openpyxl import load_workbook
import re
class ExcelUtil:
def __init__(self, excel_path, sheet_name=None):
self.excel_path = excel_path
self.wb = load_workbook(excel_path,data_only=True)
self.data = xlrd.open_workbook(excel_path)
# 如果sheet_name传入值了并且名字在表格的sheet表名里就用这个名的表,如果没有就默认选择第一个表格
if sheet_name != None and sheet_name in self.wb.sheetnames:
self.table = self.data.sheet_by_name(sheet_name)
self.ws = self.wb[sheet_name]
else:
self.table = self.data.sheets()[0]
self.ws = self.wb.worksheets[0]
try:
# 获取第一行作为key值
self.keys = self.table.row_values(0)
except:
print()
# 获取总行数
self.rowNum = self.table.nrows
# 获取总列数
self.colNum = self.table.ncols
# 获取表格数据
def dict_data(self):
if self.rowNum <= 1:
print("总行数小于1,请核实表格数据!")
os._exit(0)
else:
r = []
# 行数,从第2行取数据,第一行为表头,如果从第一行取数据,1改为0或不写
for row in range(1,self.rowNum):
s = {}
# 列数
for col in range(self.colNum):
ctype = self.table.cell(row,col).ctype
cell = self.table.cell_value(row,col)
# 如果表格中是日期,那么要进行转化
if ctype == 3:
# xldate_as_tuple(cell,0)返回的是一个元组
date = datetime(*xldate_as_tuple(cell,0))
cell = date.strftime('%Y-%m-%d %H:%M')
s[self.keys[col]] = cell
# 如果是整型
elif ctype == 2 and cell % 1 == 0:
s[self.keys[col]] = int(cell)
else:
s[self.keys[col]] = cell
r.append(s)
# j=1代表第二行
# j = 1
# i控制循环次数,也就是取多少行数据
# for i in range(self.rowNum - 1):
# s = {}
# # 从第二行取对应values值
# values = self.table.row_values(j)
# # 列数
# for x in range(self.colNum):
# # 如果表格中是日期,那么要进行转化
# ctype = self.table.cell(j, x).ctype
# cell = self.table.cell_value(j, x)
# if ctype == 3:
# date = datetime(*xldate_as_tuple(cell, 0))
# cell = date.strftime('%Y-%m-%d %H:%M')
# s[self.keys[x]] = cell
# # 如果是整型
# elif ctype == 2 and cell % 1 ==0:
# s[self.keys[x]] = int(cell)
# else:
# s[self.keys[x]] = values[x]
# r.append(s)
# j += 1
return r
# 往表格里写入数据
def write_excel(self,row,col,value,filePath,date_format=None):
# dateCell=self.ws.cell(row,col,value=value)
dateCell=self.ws.cell(row,col)
dateCell.value=value
# 如果是日期格式,单独设置单元格格式
if date_format != None:
print("处理的{}行{}列单元格为日期格式".format(row,col))
dateCell.number_format = 'yyyy/mm/dd;@'
self.wb.save(filePath)
if __name__ == "__main__":
filePath = "../产品.xlsx"
sheetName = "Sheet1"
data = ExcelUtil(filePath,sheetName)
print(data.dict_data())
# data.write_excel(2,7,'是',filePath)
# 写入日期格式一般是写入公式=Date(2022,01,02)
ExpireDate = '2022-01-02'
date = ExpireDate.split("-")
y = date[0]
m = date[1]
d = date[2]
ExpireDate = '=DATE(' + y + ',' + m + ',' + d + ')'
# data.write_excel(2,7,ExpireDate,filePath,date_format='')
使用方法:
from process_excel import ExcelUtil
data = ExcelUtil("./代理IP.xlsx").dict_data()
for i in range(len(data)):
xx = data[i]['表头']
# 修改2行5列数据
ExcelUtil("./代理IP.xlsx").write_excel(2, 5, '有效', filePath)