nginx里面有很多的爬虫日志,会影响到后期的数据分析,所以一般会去掉。
nginx排除配置:
location / { #去掉爬虫 Start if ($http_user_agent ~* "bot|spider") { access_log off; } #去掉爬虫 end proxy_pass http://cdel_jxjy; ...... }
如果特别想要爬虫日志,也可以讲爬虫日志放到指定的文件中
location / { if ($http_user_agent ~* "bot|spider") { access_log /var/log/nginx/spider.access.log; } ...... }
nginx 日志过滤网络爬虫访问日志
时间: 2024-11-09 22:22:21