宝塔面板根据访问协议头屏蔽字节跳动爬虫

网站技巧
2024-09-19 19:44:28
编辑

网站技巧

简介最近，字节跳动搜索引擎的爬虫疯狂爬取全网资源，导致一些小网站服务器不堪重负，严重的直接使网站宕机。我们有很多方法可屏蔽掉爬虫，比如robot.txt,但是貌似字节跳动旗下的今日头条爬虫比较流氓，他不遵守这个！还有一个通过屏蔽IP的方式，但是一般爬虫的IP地址比较多，这个也挺麻烦。这里站长图库介绍一种方法，有一定的效果，如下：nginx在站点的设置，配置文件中server{}中添加#禁止爬虫工具的抓

最近，字节跳动搜索引擎的爬虫疯狂爬取全网资源，导致一些小网站服务器不堪重负，严重的直接使网站宕机。

我们有很多方法可屏蔽掉爬虫，比如 robot.txt ,但是貌似字节跳动旗下的今日头条爬虫比较流氓，他不遵守这个！还有一个通过屏蔽IP的方式，但是一般爬虫的IP地址比较多，这个也挺麻烦。

这里站长图库介绍一种方法，有一定的效果，如下：

nginx在站点的设置，配置文件中 server{ } 中添加

#禁止爬虫工具的抓取if($http_user_agent~*"Bytespider|YisouSpider"){return403;}

注：Bytespider 为字节跳动爬虫的协议头

Apache:

在伪静态里设置这里以thinkphp为例！

<IfModulemod_rewrite.c>RewriteEngineonRewriteCond%{REQUEST_FILENAME}!-dRewriteCond%{REQUEST_FILENAME}!-fRewriteRule^(.*)$index.php[L,E=PATH_INFO:$1]#禁止爬虫工具的抓取RewriteCond%{HTTP_USER_AGENT}"^.*Bytespider.*|.*YisouSpider.*$"[NC]RewriteRule^(.*)$-[R=404,L]</IfModule>

以上，就是根据访问协议头屏蔽字节跳动爬虫的方法，希望能对大家有所帮助！

下载链接：网站源码/小程序源码/网站模板下载

{{userData.name}}已认证

宝塔面板根据访问协议头屏蔽字节跳动爬虫

苹果CMS批量替换字段内容

PHP常用函数之根据生日计算年龄功能示例

抖音零基础教学视频(抖音零基础教学视频怎么弄)

适用的小程序源码开发小程序

渝欧跨境发展现状解析优势与前景展望

支持访问各类网址的浏览器推荐

开源游戏下载网站源码源码论坛

c面试高级开发工程师问题(高级c++开发)

关于我们

加入我们

版权声明

用户协议

网站地图

认证服务

{{userData.name}}已认证

苹果CMS批量替换字段内容

PHP常用函数之根据生日计算年龄功能示例

抖音零基础教学视频(抖音零基础教学视频怎么弄)

适用的小程序源码 开发小程序

渝欧跨境发展现状解析 优势与前景展望

支持访问各类网址的浏览器推荐

开源游戏下载网站源码 源码论坛

c面试高级开发工程师问题(高级c++开发)

关于我们

加入我们

版权声明

用户协议

网站地图

认证服务

适用的小程序源码开发小程序

渝欧跨境发展现状解析优势与前景展望

开源游戏下载网站源码源码论坛