网站禁止垃圾搜索引擎爬虫访问的方法-资源工坊

服务器Nginx屏蔽禁止

Nginx屏蔽爬虫方法：通过修改Nginx的配置文件nginx.conf，禁止网络爬虫的user_agent，返回403。具体操作方法是：

1、进入nginx的配置目录，例如cd /usr/local/nginx/conf

2、添加agent_deny.conf配置文件 vim agent_deny.conf

配置文件的Server里面进行添加如下代码：

#forbidden UA
        if ($http_user_agent ~* "Bytespider|Googlebot|PetalBot|AhrefsBot|Barkrowler") {
        	return 403;
        }

其实垃圾爬虫不仅仅这几个，我们整理了常见的一些垃圾爬虫及对应的配置代码，供大家参考：

#禁用垃圾爬虫
    if ($http_user_agent ~* "RepoLookoutBot|BLEXBot|Bytespider|DotBot|DataForSeoBot|SemrushBot|Googlebot|PetalBot|AhrefsBot|Barkrowler|MJ12bot|FeedDemon|JikeSpider|Indy Library|AskTbFXTV|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|python-requests|lightDeckReports Bot|YYSpider|DigExt|YisouSpider|HttpClient|heritrix|EasouSpider|Ezooms") 
    {
        return 403;
    }

1 本网站名称：资源工坊
2 本站永久网址：https://www.aopk.cn
3 本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长或作者进行删除处理。
4 本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6 本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。
7 文章版权归作者所有，未经允许请勿转载。资源工坊是为访客提供游戏开服、资源下载、模组开发汉化等技术文章分享,本站内所有文章为站长总结以及部分网络资源转载或网友投稿,若有侵权行为,请携带相关证明联系站长。

THE END

维护分享

网站禁止垃圾搜索引擎爬虫访问的方法

服务器Nginx屏蔽禁止

请登录后发表评论