怎么禁止Deepseek抓取网站内容

阿烨
阿烨
管理员
67
文章
0
粉丝
建站百科评论60阅读模式

怎么禁止Deepseek抓取网站内容
要禁止 Deepseek 抓取你的网站内容,可以通过配置 robots.txt 文件来实现。Deepseek 是一个新兴的 AI 搜索引擎,通常会遵守 robots.txt 协议,因此你可以通过以下方式屏蔽它。

✅ 步骤:在网站根目录添加/修改 robots.txt
1. 编辑你网站根目录下的 robots.txt 文件(例如:https://example.com/robots.txt)
2. 添加以下内容:
User-agent: DeepseekBot
Disallow: /

🔍 说明:
User-agent: DeepseekBot 是 Deepseek 搜索引擎的爬虫名称(bot 名称)。
Disallow: / 表示禁止其抓取网站下的所有页面。

📌 附加建议(防止未知爬虫)
如果你想更严格一点,可以禁止所有未知爬虫:
User-agent: *
Disallow: /
但这会影响其他搜索引擎(如 Google、Bing)的正常抓取,谨慎使用。

✅ 检查 Deepseek 爬虫名称
截至目前,Deepseek 使用的爬虫名一般为 DeepseekBot。可以通过分析访问日志(如 Nginx 或 Apache 的日志)确认其 User-Agent。
示例 User-Agent:
Mozilla/5.0 (compatible; DeepseekBot/1.0; +https://www.deepseek.com/bot)

🚫 更彻底的方式(如有需要)
如果你不信任它是否遵守 robots 协议,可以在服务器层面进行屏蔽,例如:
Apache 示例(.htaccess):
RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} DeepseekBot [NC]
RewriteRule ^.* - [F,L]

Nginx 示例:
if ($http_user_agent ~* "DeepseekBot") {
return 403;
}

 
阿烨
  • 本文由 阿烨 发表于2025年7月2日 12:46:45
  • 转载请务必保留本文链接:https://www.webicp.com/zen-me-jin-zhi-deepseek-zhua-qu-wang-zhan-nei-rong.html
  • 禁止Deepseek抓取
匿名

发表评论

匿名网友
:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:
确定

拖动滑块以完成验证