User-Agent（用户代理）是什么

2年前 (2024-04-27)

User-Agent 即用户代理，简称“UA”，它是一个特殊字符串头。网站服务器通过识别 “UA”来确定用户所使用的操作系统版本、CPU 类型、浏览器版本等信息。而网站服务器则通过判断 UA 来给客户端发送不同的页面。

我们知道，网络爬虫使用程序代码来访问网站，而非人类亲自点击访问，因此爬虫程序也被称为“网络机器人”。绝大多数网站都具备一定的反爬能力，禁止网爬虫大量地访问网站，以免给网站服务器带来压力。本节即将要讲解的 User-Agent 就是反爬策略的步。

网站通过识别请求头中 User-Agent 信息来判断是否是爬虫访问网站。如果是，网站首先对该 IP 进行预警，对其进行重点监控，当发现该 IP 超过规定时间内的访问次数，将在一段时间内禁止其再次访问网站。

常见的 User-Agent 请求头，如下所示：

常见的 User-Agent 汇总表
系统	浏览器	User-Agent字符串
Mac	Chrome	Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.75 Safari/537.36
Mac	Firefox	Mozilla/5.0 (Macintosh; Intel Mac OS X 10.12; rv:65.0) Gecko/20100101 Firefox/65.0
Mac	Safari	Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/12.0.3 Safari/605.1.15
Windows	Edge	Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36 Edge/18.17763
Windows	IE	Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko
Windows	Chrome	Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36
iOS	Chrome	Mozilla/5.0 (iPhone; CPU iPhone OS 7_0_4 like Mac OS X) AppleWebKit/537.51.1 (KHTML, like Gecko) CriOS/31.0.1650.18 Mobile/11B554a Safari/8536.25
iOS	Safari	Mozilla/5.0 (iPhone; CPU iPhone OS 8_3 like Mac OS X) AppleWebKit/600.1.4 (KHTML, like Gecko) Version/8.0 Mobile/12F70 Safari/600.1.4
Android	Chrome	Mozilla/5.0 (Linux; Android 4.2.1; M040 Build/JOP40D) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.59 Mobile Safari/537.36
Android	Webkit	Mozilla/5.0 (Linux; U; Android 4.4.4; zh-cn; M351 Build/KTU84P) AppleWebKit/534.30 (KHTML, like Gecko) Version/4.0 Mobile Safari/534.30

使用上表中的浏览器 UA，我们可以很方便的构建出 User-Agent。通过在线识别工具，可以查看本机的浏览器版本以及 UA 信息，如下所示：

当前浏览器UA信息
浏览器名称	Chrome
浏览器版本	88.0.4324.182
系统平台	Windows
UA信息	Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.182 Safari/537.36

若想更多地了解浏览器 UA 信息(包含移动端、PC端)可参考《常用浏览器User-Agent》。

爬虫程序UA信息

下面，通过向 HTTP 测试网站（http://httpbin网站站点" rel="nofollow" />

#导入模块

import urllib.request

#向网站发送get请求

response=urllib.request.urlopen('http://httpbin网站站点" rel="nofollow" />

{

"args": {},

#请求头信息

"headers": {

"Accept-Encoding": "identity",

"Host": "httpbin网站站点" rel="nofollow" /> "User-Agent": "Python-urllib/3.7", #UserAgent信息包含在请求头中！

"X-Amzn-Trace-Id": "Root=1-6034954b-1cb061183308ae920668ec4c"

"origin": "121.17.25.194",

"url": "http://httpbin网站站点" rel="nofollow" /> urllib.request.Request()方法重构 User-Agent 信息，代码如下所示：

from urllib import request
# 定义变量：URL 与 headers
url = 'http://httpbin网站站点" rel="nofollow"  /> 
{
"args": {},
"headers": {
"Accept-Encoding": "identity",
"Host": "httpbin网站站点" rel="nofollow"  /> "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10.12; rv:65.0) Gecko/20100101 Firefox/65.0",
"X-Amzn-Trace-Id": "Root=1-6034a52f-372ca79027da685c3712e5f6"
},
"origin": "121.17.25.194",
"url": "http://httpbin网站站点" rel="nofollow"  /> 
随机文章
风儿(风儿轻轻的吹)
饿了么红包怎么用(饿了么红包怎么用微信支付)
儿童教育文章(儿童教育)
光遇花手先祖位置(安卓光遇手花先祖)
广州4a广告公司(广州4a广告公司创意总监年薪)
xboxones(xboxone手柄怎么配对主机)
陈武简历
帆船比赛(帆船比赛视频)
海猫鸣泣之时游戏(海猫鸣泣之时游戏在哪玩)
儋州市第二中学(儋州市第二中学录取分数线)
鬼泣5攻略(鬼泣5攻略第三关怎么跳)
地球日主题(2020年世界地球日主题)
和柳亚子(和柳亚子先生于田)
冰客(冰客果汁)
yy魔兽(yy魔兽世界)
国外成人游戏(国外成人游戏注册需要visa信用卡)
充值卡代理(充值卡代理加盟)
拆奶罩
郭妮小说(恶魔的法则郭妮小说)
杭同(杭同培训中心怎么样)
大松电饭煲(美的大松电饭煲)
疯狂填字(疯狂填字5)
点对点短信息(点对点短信息费是什么意思)
杜星霖(杜星霖图片)
查传倜(查传倜个人生活)
广州晓港公园(广州晓港公园正门图片)
钢筋等级符号(钢筋等级符号电脑怎么输入)
常州天宁寺(常州天宁寺求什么灵验)
河源巴伐利亚(河源巴伐利亚庄园)
风云三国(风云三国2.8作弊指令Ctrl)