百度蜘蛛如何识别

编程教程 > SEO (1201) 2024-11-26 14:39:04

一、查看UA信息

如果UA信息不对,可以直接判断该蜘蛛为非百度搜索的蜘蛛

目前UA分为移动、PC、和小程序三个应用场景,分别如下:

【移动UA】

Mozilla/5.0(Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko)Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)
Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html) 

 

【PC UA】

Mozilla/5.0(compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
Mozilla/5.0(compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

 

【小程序UA】

Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;Smartapp; +http://www.baidu.com/search/spider.html)

二、双向DNS解析认证

第一步:DNS反查IP

开发者可以对日志中访问服务器的IP地址进行反向DNS查找,判断某只spider是否来自百度搜索引擎,Baiduspider的hostname以*.baidu.com或*.baidu.jp 的格式命名,非*.baidu.com或*.baidu.jp即为冒充

 

在Linux/Windows/OS三种平台下,验证方法分别如下:

 

1) 在Linux平台下,可以使用host IP命令反解IP来判断该抓取是否来自Baiduspider。

 

2) 在Windows平台或者IBM OS/2平台下,可以使用nslookup IP命令反解IP:打开命令处理器,输入nslookup xxx.xxx.xxx.xxx(IP地址)就能解析IP,判断该抓取是否来自Baiduspider。

 

3) 在macOS平台下,可以使用dig命令反解IP:打开命令处理器输入dig -x xxx.xxx.xxx.xxx(IP地址)就能解析IP,判断该抓取是否来自Baiduspider。

 


第二步:对域名运行正向DNS查找

 

对第一步中通过命令检索到的域名运行正向DNS查找,验证该域名与日志中访问服务器的原始IP地址是否一致,IP地址一致可确认spider来自百度搜索引擎,IP地址不一致即为冒充

 

【示例】
 

> host 111.206.198.69 

69.198.206.111. in-addr.arpa domain name pointer baiduspider-111-206-198-69.crawl.baidu.com. 



>hostbaiduspider-111-206-198-69.crawl.baidu.com 

baiduspider-111-206-198-69.crawl.baidu.com has address 111.206.198.69

评论
User Image
提示:请评论与当前内容相关的回复,广告、推广或无关内容将被删除。

相关文章
一、查看UA信息如果UA信息不对,可以直接判断该蜘蛛为非百度搜索的蜘蛛。目前UA分为移动、PC、和小程序三个应用场景,分别如下:
百度云网盘百度网盘介绍       百度网盘(原百度云)是百度推出的一项云存储服务,已覆盖主流PC和手机操作系统,包含Web版、Windows版、Mac版、Android版、iPhone版和Wi...
都2024了,各位使用百度搜索的时候第一个结果很多情况下遇到百度智能回答或百度智能文章吧。例如,在百度中收索jdk安装配置第一篇就是百度的智能文章,下面来看看具
问题描述AList百度网盘下载报错,错误信息{"error_code":31362,"error_msg":"sign error","error_info":
前言       在写作前,作者也百度查了很多Spring boot 301重定向资料
前言在写这篇文章前,我百度了很多教程,大多数都是相似的,结果都是失败
Java通过sourceafis比对指纹图片的相似度判断指纹,sourceafis,Java指纹图片
1.新增nginx屏蔽配置文件文件暂时为/etc/nginx/conf.d/deny_ua.config说明:文件名deny_ua.config,后缀为.config非.conf,原因是.con...
这里主要讲解如何通过调用api自动推送URL到bing站长平台,让Bing蜘蛛及时抓取你发布的内容。随着Windows 10 Windows11 全面推广后,自带的edge浏览器也越来越流行。默...
最近一大佬好心,送了一枚已经刷入群晖ds119j的猫盘给我玩,到手第一步就是拆机,拆机就难题来了不知道怎么拆以为是旋转中间哟,百度了半天才找的一个文字描述的说要下脚垫,我之前也扣过不过太紧就扣不...
这几个月技术圈聊的最火的就是ChatGPT这个项目,目前ChatGPT已经掌握了互联网大部分公开信息并进行了分析处理。通过提问可以快速的从ChatGPT得到答案,对于用户来说非常方便,比搜索引擎...
网页项目集成扫码枪设备实现一/二维码扫码识别,可以吧扫码枪当成是和键盘一样的输入设备理解,然后进行下面的学习路径
jsp页面无法识别el表达式的解决方案,今天在写一个springmvc的小demo时,碰到一个问题,在jsp页面中书写为user.username的表达式语言,在浏览器页面中仍然显示为{user...
jsp
闲聊最近需要谷歌浏览器,去某度搜了一下,然后居然不小心下载了三个地方的都不是官方版,下载下来都是什么双核浏览器