曾经,在网上下载过一份“学习资料”,zip格式的一份不小的压缩文件。
费劲巴拉的从“某盘”下载,却发现解压需要“密码”,顿时心里有句不当讲的话…
为了破解压缩文件的密码,我在搜索引擎输入“python zip”两个关键词。
经过过一番总结,发现破解的思路都是一样的,暴力破解。
过程如下: 建立密码字典(常用密码)
尝试用每一个密码,来解压文件
解压成功,跳出循环 密码字典
比如,现在一个纯数字的六位密码“050825”
可以从依次遍历“000000”到“999999”,把所有的结果保存到txt文件。
这样的缺点就是比较死板,只能是6位数字,另外就是比较占内存。
于是,有个大神写了个“字典生成器”,你需要做的是传入两个参数“字典的组成元素”和“密码的长度列表”
比如,纯数字的“050825”,你就传入如下的参数:
如此,便可按你的要求得到密码的Python 生成器。我们知道,生成器是不占用内存的。
如果数字不过瘾,比如有的密码是字符串。可以考虑在第一个参数中,加入“a-z”和“A-Z”
zipfile解压文件
zipfile模块是python自带的,用于对zip文件的读、写、追加、解压操作等。
“解压”主要是用到ZipFile对象的extractall()方法
extractall(path=None, members=None, pwd=None)方法主要有三个参数。
我们来看一下每个参数的含义:
贴个代码:
import zipfile
try:
with zipfile.ZipFile('test.zip') as zFile:
# 创建ZipFile对象
# 解压文件
zFile.extractall(path='./',pwd=b'1234')
print('解压成功!')
except:
print('解压失败')
进度条可视化
关于进度条,本程序使用 tqdm扩展库
1、密码迭代器
2、密码总个数
for pwd in tqdm(chain.from_iterable(all_passwd(dictionaries, maxlen) for maxlen in lengths), total=total):
if extract(zfile, pwd): # 记得extract函数返回的是bool类型的哦
break
这是破解的结果:
测试结果:
全部代码:
import time
from typing import List
from tqdm import tqdm
from itertools import chain
from zipfile import ZipFile
start = time.time()
# chr(97) -> 'a' 这个变量保存了密码包含的字符集
# dictionaries = [chr(i) for i in
# chain(range(97, 123), # a - z
# range(65, 91), # A - Z
# range(48, 58))] # 0 - 9
dictionaries = [str(i) for i in range(10)]
# print(dictionaries)
# dictionaries.extend(['.com', 'www.']) # 添加自定义的字符集
file_name =r"./test.zip" # 你的文件路径
def all_passwd(dictionaries: List[str], maxlen: int):
# 返回由 dictionaries 中字符组成的所有长度为 maxlen 的字符串
def helper(temp: list, start: int, n: int):
# 辅助函数,是个生成器
if start == n: # 达到递归出口
yield ''.join(temp)
return
for t in dictionaries:
temp[start] = t # 在每个位置
yield from helper(temp, start + 1, n)
yield from helper([0] * maxlen, 0, maxlen)
zfile = ZipFile(file_name, 'r') # 很像open
def extract(zfile: ZipFile, pwd: str) -> bool:
# zfile: 一个ZipFile类, pwd: 密码
try:
zfile.extractall(path='.', pwd=pwd.encode('utf-8')) # 密码输入错误的时候会报错
now = time.time() # 故使用 try - except 语句
print(f"Password is: {pwd}") # 将正确的密码输出到控制台
return True
except:
return False
# 用 bool 类型的返回值告诉主程序是否破解成功 (意思就是返回 True 了以后就停止)
lengths = [6] # 密码长度
total = sum(len(dictionaries) ** k for k in lengths) # 密码总数
for pwd in tqdm(chain.from_iterable(all_passwd(dictionaries, maxlen) for maxlen in lengths), total=total):
if extract(zfile, pwd): # 记得extract函数返回的是bool类型的哦
break