您当前的位置:首页 > 计算机 > 编程开发 > Python

Python批量检查网页是否被注入其他页面

时间:09-09来源:作者:点击数:

代码思路:对于给定的文件夹中所有网页文件,读取其内容,然后使用正则表达式检查该文件中是否包含iframe框架,如果有的话就返回文件名和iframe代码,表示是一个怀疑对象,但这并不意味着网页被攻击。使用代码快速挑选出所有的怀疑对象,最后再人工确认一下。

import os

import re

def detectIframe(fn):

    #存放网页文件内容的列表

    content = []

    with open(fn, encoding='utf8') as fp:

        #读取文件所有行,删除两侧的空白字符,然后添加到列表中

        for line in fp:

            content.append(line.strip())

    #把所有内容连接成字符串

    content = ' '.join(content)

    #正则表达式

    m = re.findall(r'<iframe\s+src=.*?></iframe>', content)

    if m:

        #返回文件名和被嵌入的框架

        return {fn:m}

    return False

#遍历当前文件夹中所有html和htm文件并检查是否被嵌入框架

for fn in (f for f in os.listdir('.') if f.endswith(('.html','.htm'))):

    r = detectIframe(fn)

    if not r:

        continue

    #输出检查结果

    for k, v in r.items():

        print(k)

        for vv in v:

            print('\t', vv)

方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门