百度蜘蛛spider如何识别

发布时间:2020-08-06 11:41:26 作者:Leah
来源:亿速云 阅读:172

这篇文章将为大家详细讲解有关百度蜘蛛spider如何识别,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。


  经常有开发者问百度蜘蛛是什么?最近百度蜘蛛来的太频繁服务器抓爆了!最近百度蜘蛛都不来了怎么办?还有很多站点想得到百度蜘蛛的IP段,想把IP加入白名单,但IP地址范围动态变化不固定,我们无法对外公布。


  如何才能识别正确的百度蜘蛛呢?正确识别百度蜘蛛的方法:


  一、查看UA信息


  如果UA信息不对,可以直接判断为非百度搜索的蜘蛛。目前UA分为移动、PC、和小程序三个应用场景,这三个渠道UA分别如下:

百度蜘蛛spider如何识别

  二、双向DNS解析认证


  第一步:DNS反查IP


  开发者通过对日志中访问服务器的IP地址运行反向DNS查找,判断某只spider是否来自百度搜索引擎,Baiduspider的hostname以*.baidu.com或*.baidu.jp 的格式命名,非*.baidu.com或*.baidu.jp即为冒充。


  根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:


  1).在linux平台下,您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。


  2).在windows平台或者IBM OS/2平台下,您可以使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookup xxx.xxx.xxx.xxx(IP地址)就能解析ip,来判断是否来自Baiduspider的抓取。


  3).在macos平台下,您可以使用dig命令反解ip来判断是否来自Baiduspider的抓取。打开命令处理器输入dig -x xxx.xxx.xxx.xxx(IP地址)就能解析ip,来判断是否来自Baiduspider的抓取。


  第二步:对域名运行正向DNS查找


  对第一步中通过命令检索到的域名运行正向DNS查找,验证该域名与您日志中访问服务器的原始IP地址是否一致,IP地址一致可确认spider来自百度搜索引擎,IP地址不一致即为冒充。

百度蜘蛛spider如何识别

关于百度蜘蛛spider如何识别就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

推荐阅读:
  1. 阿里蜘蛛池
  2. 获取百度语音识别token

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

百度蜘蛛 spider %d

上一篇:FasterDFS基础配置

下一篇:SSH与Telnet密码加密登录

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》