专注分享网络精品资源平台

robots.txt协议中应该禁止哪些爬虫?

易秋资源网 值得一看 0

大部分的常见的蜘蛛爬虫百度 搜狗 360 必应等都是搜索引擎的爬虫无需设置禁止访问,有些比如:AhrefsBot/SemrushBot这些是网站营销的爬虫我们可以在爬虫协议中写上禁止该爬虫访问爬取。但是对于很多站长基本都会知道,协议只是一个基本道德互联网爬取选择,并不可以直接让爬虫选择不爬取。这相当于警告,大部分爬虫都是遵循该类协议选择,有些爬虫是无视这些的,直接爬取我们网站的内容信息。
我们可以选择用宝塔的IP限制黑名单,让这些IP段的营销爬虫无法访问即可。
AhrefsBot是一个营销网站的爬取蜘蛛,负责分析网站信息。(建议禁止这些IP)
爬虫IP:
54.36.148.1 ~ 54.36.148.254
54.36.149.1 ~ 54.36.149.254
54.36.150.1 ~ 54.36.150.254
SemrushBot也是一个营销网站的爬取蜘蛛,负责分析网站信息。(建议禁止这些IP)
爬虫IP:
46.229.168.136 ~ 46.229.168.162

标签:

暂无标签

免责声明:

本站提供的资源,都来自网络,版权争议与本站无关,所有内容及软件的文章仅限用于学习和研究目的。不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负,我们不保证内容的长久可用性,通过使用本站内容随之而来的风险与本站无关,您必须在下载后的24个小时之内,从您的电脑/手机中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。侵删请致信E-mail: yiqiuwl@126.com

同类推荐
评论列表
签到