百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

Spider详解

yuyutoo 2025-01-14 18:41 1 浏览 0 评论

简介

Spider的功能主要使用于大型的应用系统测试,它能在很短的时间内帮助我们快速地对一个应用程序的内容、功能、系统的结构和分布情况进行了解。

Control

右键进行爬取数据使用spider功能。

在Spider模块中可以进行查看spider功能是否已经正常运行,清除未发送的请求和排队的表格。Spider Scope主要用来控制Spider的抓取范围。一种使用Targer Scope 一种使用自定义。

自定义作用域与Target Scope的配置一致。

Options

Crawler Setting

check robots.txt:检测robot.txt文件

Detect custom "not found" responese:检测404应答

ignore links to non-text content:忽略文本为空的链接。

request the root of all directories:爬取根目录下的所有文件和目录。

make a non-parameterized request to each dynamic page:对每个动态页面进行非参数化的请求。如果这个选项被选中,Burp Spider 会对在范围内的所有执行动作的 URL 进行无参数的 GET 请求。如果期待的参数没有被接收, 动态页面会有不同的响应,这个选项就能成功地探测出额外的站点内容和功能。

Maximum link depth:最大链接深度

Maximum parameterized requests per URL:最大请求URL参数数目

Passive Spidering

Passively spider as you browse:如果这个选项被选中,爬取时通过Burp Proxy。

link depth to associate with proxy requests:控制代理的链接深度。默认为0,表示无限深度。

Form Submission

主要用来控制在蜘蛛抓取过程中,对于form表单的处理方式。

individuate forms:对form表单域的处理内容做控制。默认同时处理请求的url、请求方式Get或者Post、包含哪些属性名以及属性值。可以单独选择。

Don't submit:爬虫抓取数据的时候不会提交任何表单。

prompt for guidance:爬虫抓取表单时,在你提交每一个确认的表单前,Burp Suite 都会为你指示引导。这允许你根据需要在输入域中填写自定义的数据提交到服务器的哪一个区域。

automatically submit:自动提交。如果选中,Burp Spider 通过使用定义的规则来填写输入域的文本值然后自动地进行提交。

set unmatched fields to:设置不匹配的字段。

application login

控制爬虫抓取时,登陆页面的处理方式

don't submit login forms:不提交登录表单。

prompt for guidance:手工确认登录信息。Burp能为你提示引导。

handle as ordinary forms:普通表单处理。

automatically submit these credentials:自动提交自定义的数据。

Spider Engine

Number of threads - 设置请求线程。控制并发请求数。

Number of retries on network failure - 如果出现连接错误或其他网络问题失败时候重试的次数。

Pause before retry - 当请求失败的时候,Burp会等待指定的时间(以毫秒为单位),然后重试。

Throttle between requests:在每次请求之前等待一个指定的延迟(以毫秒为单位)。此选项很有用,以避免超载应用程序。

Add random variations to throttle:添加随机的变化到请求中。

Request Headers

用来设置http请求的消息头,可以设置移动设备、windows、浏览器等。

Use HTTP version 1.1 :在爬虫请求中使用HTTP/1.1,不选中则使用HTTP/1.0.

Use Referer header:当从一个页面访问另一个页面是加入Referer头,这将更加相似与浏览器访问。

相关推荐

.NET Core 中推荐使用的10大优秀库,你用到过几个?

概述:Microsoft的.NETCore生态系统中的中间件已经发生了重大变化,包括无缝集成到应用程序管道中的内置和第三方组件,协调客户端和服务器之间的数据流。它通过身份验证、日志记录和路由等...

机器学习中英文对照表

10-1LossFunction0-1损失函数2Accept-RejectSamplingMethod接受-拒绝抽样法/接受-拒绝采样法3AccumulatedErrorBa...

反应式编程之Spring Web-Flux/Project Reactor

介绍反应式编程代表了我们对应用程序执行模型的看法的改变。在响应式应用程序中,执行不遵循一个请求由一个线程处理的线性模型,而是以事件驱动和非阻塞的方式处理多个请求。...

Spider详解

简介Spider的功能主要使用于大型的应用系统测试,它能在很短的时间内帮助我们快速地对一个应用程序的内容、功能、系统的结构和分布情况进行了解。Control右键进行爬取数据使用spider功能。在Sp...

WebUI 如何高效进行测试

1.选择合适的浏览器驱动ChromeDriver:对于大多数情况,推荐使用ChromeDriver,因为它与Chrome浏览器的兼容性好,并且性能较好。...

《成为Rust专家》五、单元测试 (2)

6.3测试框架Rust的单元测试不包括其他单元测试框架中可能找到的辅助函数、夹具、测试框架或参数化测试功能。对于这些功能,你需要自己编写代码或者尝试一些库。对于基本的参数化测试,parameteri...

JUnit5学习之一:基本操作

欢迎访问我的GitHubhttps://github.com/zq2599/blog_demos内容:所有原创文章分类和汇总,及配套源码,涉及Java、Docker、Kubernetes、DevOPS...

511基于C# Thread类的大漠多线程模板游戏实战

如果你的游戏检测易语言,或者,客户反馈你的脚本被频繁报毒,加入黑名单,那么我们选择微软的C#来写一个大漠的多线程模板是最好的选择。...

如何深度理解mybatis?

深度自定义mybatis回顾mybatis的操作的核心步骤...

.NET 6 多线程的几种打开方式

前言多线程无处不在,平常的开发过程中,应该算是最常用的基础技术之一了。以下通过Thread、ThreadPool、再到Task、Parallel、线程锁、线程取消等方面,一步步进行演示多线程的一些基础...

C# 多 线 程。

一、基本概念1、进程...

C#多线程

1.概念进程,线程,应用程序的定义网上有很多资料,但是有些抽象。通俗的来讲,进程就是一旦一个应用程序开始运行,那么这个应用程序就会存在一个属于这个应用程序的进程。线程就是进程中的基本执行单元,每个进...

多线程在C# (.NET) 中的应用

在实际项目应用中我们难免会用到多线程、多进程编程方式,C#中的多线程允许你在同一时间内执行多个线程,每个线程都可以独立地执行不同的任务或者处理不同的部分。这可以帮助提高应用程序的响应性和性能。通过这...

如何使?C#创建?个线程?

在C#中,可以通过多种方式创建和启动一个线程。以下是常用的方式及其具体实现。1.使用Thread类创建线程...

在C#中,如何创建并启动?个新的线程?请举例说明

在C#中,可以使用System.Threading.Thread类创建并启动一个新的线程。以下是创建和启动线程的方式以及示例代码:创建并启动线程的步骤...

取消回复欢迎 发表评论: