python教程:爬虫模拟用户请求详细教程
yuyutoo 2025-01-17 13:59 1 浏览 0 评论
今天我们来说一下如何模拟用户请求,因为大多数网站都是有防爬虫措施的
学习爬虫要了解web知识,我们需要通过http请求头来伪装自己爬虫程序
1.修改请求头
这里要用到python的urllib.request的模块,首相介绍一下http请求头,它就是你每次在访问网页时,向服务器传输的一组属性和配置信息。下面有七个字段被大多数浏览器用来初始化网络请求。
这是是用户在访问网页时所发出的host请求(表格中是我的电脑发起的请求,打开F12可查看自己的host请求)。下面看一下为不加请求头时python爬虫发出的请求。
下面我们通过python代码来模拟一下用户请求
2.设置爬取间隔时间
如果访问网址过于频繁会被有些服务器的反爬虫程序认为是被爬虫恶意请求,这时候我们就要设置爬取数据的频率
比如说最简单的方式用如下代码
3.使用HTTP代理
有时候即使设置了爬取的间隔时间,还是会被服务器判别是爬虫程序,是因为我们的爬虫程序都是通过自己的ip地址发起请求,同一个ip访问次数过多会被服务器反爬虫机制直接拒绝
这时候我们要设置http代理去发起请求
proxy_ip是我们的http代理,可以根据需求选择厂商。
4.人机验证
目前遇到人机验证、验证码的需要采用第三方的识别验证码方式
5.ajax请求
有些网页一请求并没有数据,是通过ajax异步获取来的数据,这时候就需要我们模拟ajax请求来抓取数据
6.参数js加密
7.cookie限制
打开浏览器按f12,把cookie复制,放入请求头
本文来源转载
原文链接:
https://blog.csdn.net/qq_41389354/article/details/111472608
若有侵权,请联系作者及时删除,谢谢!!
- 上一篇:网站反爬虫常见方法
- 下一篇:使用Socks5代理加强爬虫的网络安全
相关推荐
- 走进Maven世界
-
Maven作为一个构建工具,不仅能帮我们自动化构建,还能够抽象构建过程,提供构建任务的具体实现,自动测试、打包、生成文档和报表;它跨平台,同时提供了中央仓库,只需要在pom.xml中配置下所需的jar...
- Maven配置中profile在POM和settings区别
-
Maven配置中profile在POM和settings区别上一节文章...
- Maven的下载与配置
-
1.Maven官网地址首页:https://maven.apache.org/...
- Maven入门,读完这篇就够了
-
前言夜空中最亮的星,2021请照亮我前行~Maven是我们日常开发都会用到的,五一过后,我把看过的Maven基础概念做了整理,作为入门和查阅使用。正文Maven概念...
- maven发包踩坑
-
出现...
- MAVEN详解
-
Maven概述看完本篇文章后相信你对Maven的理解能更进一步常规项目开发存在的问题通常Web项目开发只会创建一个工程,然后所有的jar包都会存放到WEB-INF/lib目录下,如...
- 深圳尚学堂:Maven的安装及配置
-
Maven是一个项目管理的Java工具,在JavaEE中,我们可以使用Maven方便地管理团队合作的项目,现在我们在学习JavaEE框架,使用Maven可以管理类库,有效方便地供团队中的其他人员使用...
- 学Maven,这篇万余字的教程,真的够用了
-
1Maven介绍1.1为什么使用Maven由于Java的生态非常丰富,无论你想实现什么功能,都能找到对应的工具类,这些工具类都是以jar包的形式出现的,例如Spring,Spring...
- java工具篇-Maven安装配置及优化
-
开发springboot和springcloud项目,maven是必不可少的插件。关于maven就不做过多介绍,简单理解,可以理解为一个jar包管理工具,当然,没有这么简单,想了解的可以搜下相关资...
- 快速上手maven
-
Maven的作用在开发过程中需要用到各种各样的jar包,查找和下载这些jar包是件费时费力的事,特别是英文官方网站,可以将Maven看成一个整合了所有开源jar包的合集,我们需要jar包只需要从Mav...
- 看大佬对Maven讲解有多深,Maven setting.xml文件 了解一下
-
通常我们安装了Maven之后会对Mavensetting.xml(Maven的配置文件做一些自定义),本章我们将详细地学习一下Mavensetting.xml文件。文件位置一般存在与Maven安装...
- 最全!最强大!Maven知识大全
-
一、什么是MavenMaven是Apache的一款开源的项目管理工具,是Apache基于ANT进行升级后,研发出了全新的自动化构建工具。Maven使用项目对象模型(POM-ProjectObject...
- 做开发这么久了,还不会搭建服务器Maven私有仓库?这也太Low了吧
-
大家好,我是冰河~~...
- Maven解析让你从新手到高手
-
背景本文从实战角度出发,笔者多年经验总结,能让你快速理解Maven,知其然且知其所以然,全是干货,让我们开始吧。文章概览...
- 后台服务工具maven:maven安装配置
-
1、maven下载下载地址:https://archive.apache.org/dist/maven/maven-3/3.3.9/binaries/apache-maven-3.3.9-bin.t...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- mybatis plus (70)
- scheduledtask (71)
- css滚动条 (60)
- java学生成绩管理系统 (59)
- 结构体数组 (69)
- databasemetadata (64)
- javastatic (68)
- jsp实用教程 (53)
- fontawesome (57)
- widget开发 (57)
- vb net教程 (62)
- hibernate 教程 (63)
- case语句 (57)
- svn连接 (74)
- directoryindex (69)
- session timeout (58)
- textbox换行 (67)
- extension_dir (64)
- linearlayout (58)
- vba高级教程 (75)
- iframe用法 (58)
- sqlparameter (59)
- trim函数 (59)
- flex布局 (63)
- contextloaderlistener (56)