首页文章资讯技术文章正文

我要投稿

用 Python 脚本批量检测网页是否能有效访问

fxecc 技术文章

2023-02-15 0 1,419

环境准备

Python 3 环境

测试脚本

新建一个url.txt的记事本文件，将需要检测的网址写在记事本里，每行一个网址，网址要用http://或者https://开头。

然后新建一个go2url.py的 Python 脚本，复制粘贴以下代码：

# -*-coding: utf-8 -*-
 
import requests,re
import urllib3
import logging
logging.captureWarnings(True)
from concurrent.futures import ThreadPoolExecutor
import argparse
import time
#import ssl
from requests.packages.urllib3.exceptions import InsecureRequestWarning
#ssl._create_default_https_context = ssl._create_unverified_context
requests.packages.urllib3.disable_warnings(InsecureRequestWarning)
 
def parser_args():
    parser = argparse.ArgumentParser()
    parser.add_argument("-f","--file",help="指定domain文件")
    return parser.parse_args()
 
f = open("result.csv", "a", encoding='utf-8')
f.write("源地址"+","+"跳转地址"+","+"状态码"+","+"标题"+'\n')
f = f.close()
 
start = time.time()
def getTitle(url):
    f = open("result.csv", "a", encoding='utf-8')
    header = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36',
    }
 
    try:
        res = requests.get(url, headers=header, verify=False, allow_redirects=True, timeout=10)
        code = res.status_code
    except Exception as error:
        code = "无法访问"
 
    code1 = str(code)
 
    if code1 != "无法访问":
        try:
            urllib3.disable_warnings()
            res = requests.get(url, headers=header, verify=False, allow_redirects=True,timeout=10)
            res.encoding = res.apparent_encoding
            title = re.findall("(?<=\<title\>)(?:.|\n)+?(?=\<)", res.text, re.IGNORECASE)[0].strip()
        except :
            title = "[ ]"
        f.write(url+","+res.url+","+code1+","+title+'\n')
        print(url+","+res.url+","+code1+","+title)
    else:
        title = " "
        f.write(url + "," + " " + "," + code1 + "," + title + '\n')
        print(url + "," + " " + "," + code1 + "," + title)
 
    f = f.close()
 
a = vars(parser_args())
file = a['file']
try:
    with ThreadPoolExecutor(max_workers=100) as executor:
        for i in open(file, errors="ignore").readlines():
            executor.submit(getTitle, i.strip().strip('\\'))
except:
    print('-f 指定domain文件')
end = time.time()
print("总耗时:",end - start,"秒")

保存脚本后，记得将.txt文件和.py文件放在同一个文件目录下，打开终端执行以下命令：

python go2url.py -f url.txt

测试完记事本里的所有网址后，脚本会自动创建一个名为result.csv的表格文件，所有的测试结果都保存在这个表格文件里。

附录：批量转换网址脚本

有时候我们拿到的网址缺少http://或者https://开头的信息，用以下 Python 脚本就可以批量给网址加上必要的开头。

先新建一个名为ip.txt的记事本文件，将缺少头部信息的网址填进去，每行一个网址。

然后新建一个名为ip2url.py的 Python 脚本，复制粘贴以下代码：

# -*-coding: utf-8 -*-
 
with open("ip.txt","r") as f:
    line = f.readlines()
 
with open("ip.txt","w") as f2:
    for i in line:
        f2.write('http://'+i)
 
# 是否另起一行生成 https 开头的地址
 
with open("ip.txt","a+") as f3:
    f3.write('\n')
 
with open("ip.txt","a+") as f4:
    for i in line:
        f4.write('https://'+i)

保存后打开终端执行以下命令：

python ip2url.py

命令执行完后重新打开ip.txt的记事本文件，就可以看到网址前面加上了必要的信息了。

以上。

资源下载

如您遇到资源链接失效，请您通过评论或工单的方式通知管理员！

收藏 (0) 打赏

感谢您的支持，我会继续努力的!

打开USDT(trc-20)扫一扫，即可进行扫码打赏哦，分享从这里开始，精彩与您同在

点赞 (0)

Ts:本站所有内容均为互联网收集整理和网友上传。仅限于学习研究，请必须在24小时内删除。否则由此引发的法律纠纷及连带责任本站概不承担。

如侵犯到您的合法权益，请联系我们删除侵权资源！

分享驿站技术文章用 Python 脚本批量检测网页是否能有效访问 https://www.fxe.cc/2813.html

fxecc

上一篇： CentOS 7 查找挂载新数据盘并设置开机自启动挂载

下一篇： TPshop商城 Getshell后门文件分析与复现

常见问题

网站安装常见问题总结

如何遇到网站源码不会安装，可以尝试搜索“程序名称教程”，如dedecms 教程。也可以查看网站安装常见问题总结。

查看详情

购买后可以退款吗？

由于下载服务的特殊性，一旦您购买使用了下载服务，就不接受退款申请。详情请参考《分享驿站服务》条例。

查看详情

相关文章

利用群辉Docker搭建开源人力资源管理系统OrangeHRM

利用群辉Docker搭建开源人力资源管理系统OrangeHRM

技术文章

guest

1年前 1,049

Win11无网络安装解决方法：绕过强制联网和账号登录

Win11无网络安装解决方法：绕过强制联网和账号登录

技术文章

duoma

1年前 1,515

视频压缩技巧：如何最大限度减小文件大小，同时保持优质画质？

视频压缩技巧：如何最大限度减小文件大小，同时保持优质画质？

技术文章

ni

1年前 1,151

解决123网盘无法使用IDM下载的妙招：一步步取消代理，轻松畅享下载

解决123网盘无法使用IDM下载的妙招：一步步取消代理，轻松畅享下载

技术文章

fxecc

1年前 3,844

猜你喜欢

利用群辉Docker搭建开源人力资源管理系统OrangeHRM 2024-01-06
Win11无网络安装解决方法：绕过强制联网和账号登录 2023-12-19
视频压缩技巧：如何最大限度减小文件大小，同时保持优质画质？ 2023-12-17
解决123网盘无法使用IDM下载的妙招：一步步取消代理，轻松畅享下载 2023-11-18
来搭建免费不限量的DeepLX翻译服务吧！ 2023-11-15
子比zibi主题修复易支付mapi接口无法使用的教程 2023-10-24
Windows沙盒替换注册文件将默认英文语言改中文 2023-09-29
ServerBee 桌面系统监控、数据可视化 2023-09-26
Uptime Kuma：自托管的高级监控工具 2023-09-01
微信抓不到包？根本不存在！—-一招搞定微信内置浏览器抓包 2023-08-27

官方客服团队

为您解决烦忧 - 24小时在线专业服务

联系官方团队在线提交工单