一小段Python代码,破解加密zip文件的密码
今天的文章来自 盏茶作酒 同学。他在老电脑中发现了一个加密的 zip 文件,于是用 Python 破解了文件密码。在破解的过程中出现了内存爆炸的问题,通过阅读 Python 源代码找到了解决方案。
下面就来给大家分享一下他的操作。
Python 有一个内置模块 zipfile 可以解压 zip 压缩包。先来测试一波:创建一个测试文件,压缩,设置解压密码为123。
![](https://filescdn.proginn.com/54d8f363aa964377d2c84451f4d603be/984f0f92d46f482b3e3e464718a54b7d.webp)
import zipfile
# 创建文件句柄
file = zipfile.ZipFile("测试.zip", 'r')
# 提取压缩文件中的内容,注意密码必须是bytes格式,path表示提取到哪
file.extractall(path='.', pwd='123'.encode('utf-8'))
运行效果如下图所示,提取成功。
![](https://filescdn.proginn.com/fb0067fec25d403e1f7d3c772bc06e1e/c5b86f2857bfe3a64f3ea0caf14d81c1.webp)
既然如此,那我不停尝试所有可能的密码组合去解压缩不就行了嘛~
好了,开始破解老文件的密码。
为了提高速度,我还加了多线程的代码:
import zipfile
import itertools
from concurrent.futures import ThreadPoolExecutor
def extract(file, password):
if not flag: return
file.extractall(path='.', pwd=''.join(password).encode('utf-8'))
def result(f):
exception = f.exception()
if not exception:
# 如果获取不到异常说明破解成功
print('密码为:', f.pwd)
global flag
flag = False
if __name__ == '__main__':
# 创建一个标志用于判断密码是否破解成功
flag = True
# 创建一个线程池
pool = ThreadPoolExecutor(100)
nums = [str(i) for i in range(10)]
chrs = [chr(i) for i in range(65, 91)]
# 生成数字+字母的6位数密码
password_lst = itertools.permutations(nums + chrs, 6)
# 创建文件句柄
zfile = zipfile.ZipFile("加密文件.zip", 'r')
for pwd in password_lst:
if not flag: break
f = pool.submit(extract, zfile, pwd)
f.pwd = pwd
f.pool = pool
f.add_done_callback(result)
然而,事情并没有那简单……
代码跑一会儿,内存爆了!
![](https://filescdn.proginn.com/5609e030c8cb244deb9be338c86dc39b/cc5d925955447df99798fb13f5b6c329.webp)
于是,为了找寻问题所在,我就去查看了一下源码,发现ThreadPoolExecutor默认使用的是无界队列。而程序中尝试密码的速度跟不上生产密码的速度,就会把生产任务无限添加到队列中。导致内存被占满。内存直接飙到95:
![](https://filescdn.proginn.com/d56779247e1694dd0bed06dd229747f9/9893024e1c70d1d217b328cf796cd375.webp)
找到病根儿,剩下的就是对症下药了。
继承并重写了ThreadPoolExecutor类中的_work_queue属性,将无界队列改成有界队列,这样就不会出现内存爆满的问题,看代码:
import queue
from concurrent.futures import ThreadPoolExecutor
class BoundedThreadPoolExecutor(ThreadPoolExecutor):
def __init__(self, max_workers=None, thread_name_prefix=''):
super().__init__(max_workers, thread_name_prefix)
self._work_queue = queue.Queue(self._max_workers * 2) # 设置队列大小
用自定义的BoundedThreadPoolExecutor类替代前面代码中的ThreadPoolExecutor。
再次执行……
程序输入如下图内容:
![](https://filescdn.proginn.com/bd55a4c5c397baed4f78491e0fc3c25a/692d79137b4eaf3fade17efc996fd0fe.webp)
![](https://filescdn.proginn.com/8978fff0fd47203b7f1bbc993669029e/2f9531197215d62b2531163038cfdd18.webp)
推荐阅读:
入门: 最全的零基础学Python的问题 | 零基础学了8个月的Python | 实战项目 |学Python就是这条捷径
干货:爬取豆瓣短评,电影《后来的我们》 | 38年NBA最佳球员分析 | 从万众期待到口碑扑街!唐探3令人失望 | 笑看新倚天屠龙记 | 灯谜答题王 |用Python做个海量小姐姐素描图 |
趣味:弹球游戏 | 九宫格 | 漂亮的花 | 两百行Python《天天酷跑》游戏!
AI: 会做诗的机器人 | 给图片上色 | 预测收入 | 碟中谍这么火,我用机器学习做个迷你推荐系统电影
年度爆款文案