使用nginx屏蔽搜索引擎访问phpcms和PBootCMS程序中的搜索模块

点击复制标题网址

——温馨提示——

已复制到剪贴板，可粘贴到下一处。

时间：2025-12-18 查看：1094

编者按：

站内搜索是给“人”用的功能，不是给“搜索引擎”看的内容。让爬虫抓取搜索结果页，就像把图书馆的“检索终端屏幕截图”当成正式出版物提交给国家图书馆——不仅无用，还会污染整个系统。同时还可降低搜索引擎无效访问搜索模块带来的带宽占用。

站内搜索是给“人”用的功能，不是给“搜索引擎”看的内容。

让爬虫抓取搜索结果页，就像把图书馆的“检索终端屏幕截图”当成正式出版物提交给国家图书馆——不仅无用，还会污染整个系统。同时还可降低搜索引擎无效访问搜索模块带来的带宽占用。下面给出实现代码：

# 屏蔽爬虫访问 PHPCMS (m=search) 和 PBootCMS (keyword=) 搜索接口

if ($args ~* "(m=search|keyword=)") {

set $block_search 1;

}

# 匹配常见爬虫/自动化工具特征（不区分大小写）

if ($http_user_agent ~* "(bot|spider|crawler|crawl|slurp|wget|curl|python|java|httpclient|scrapy|puppeteer|headless|selenium|fetch|scan|spider|spider)" ) {

set $block_search "${block_search}1";

}

# 如果两个条件都满足（URL 含搜索参数 + 是爬虫），则拦截

if ($block_search = "11") {

return 410;

}

发表评论：

评论记录：

未查询到任何数据！

本文标签：

法律咨询

————受人之托，忠人之事————

邓杰律师

专业

专注执业领域事务

尽责

全力办理委托事项

务实

扎实维护合法权益

邓杰系深耕于数据合规领域复合型资深专业律师，其律师执业证号为14403201810022100。邓杰律师现（曾）任WEB前端开发工程师、WEB服务器维护工程师、计算机信息网络安全员、深圳市人民政府听证员、深圳市政府采购评审专家（法律类）、深圳市某区政府系统公职律师，在网络领域和政府系统从业多年，深刻理解网络前沿技术和行政程序运行规则，十分擅长互联网+平台领域数据合规法律实务，可为政府、企业和个人在数据合规领域提供富有针对性的非诉、诉讼、仲裁、执行等法律风险防控解决方案，能有效维护当事人的各类合法权益。