技术日志

记录分享邓杰律师从事网络技术工作点点滴滴。

位置:首页>资讯动态>技术日志

使用nginx屏蔽搜索引擎访问phpcms和PBootCMS程序中的搜索模块

点击复制标题网址

——温馨提示——

已复制到剪贴板,可粘贴到下一处。


时间:2025-12-18   访问量:1015

编者按:站内搜索是给“人”用的功能,不是给“搜索引擎”看的内容。让爬虫抓取搜索结果页,就像把图书馆的“检索终端屏幕截图”当成正式出版物提交给国家图书馆——不仅无用,还会污染整个系统。同时还可降低搜索引擎无效访问搜索模块带来的带宽占用。

站内搜索是给“人”用的功能,不是给“搜索引擎”看的内容。

让爬虫抓取搜索结果页,就像把图书馆的“检索终端屏幕截图”当成正式出版物提交给国家图书馆——不仅无用,还会污染整个系统。同时还可降低搜索引擎无效访问搜索模块带来的带宽占用。下面给出实现代码:

# 屏蔽爬虫访问 PHPCMS (m=search) 和 PBootCMS (keyword=) 搜索接口

if ($args ~* "(m=search|keyword=)") {

    set $block_search 1;

}

# 匹配常见爬虫/自动化工具特征(不区分大小写)

if ($http_user_agent ~* "(bot|spider|crawler|crawl|slurp|wget|curl|python|java|httpclient|scrapy|puppeteer|headless|selenium|fetch|scan|spider|spider)" ) {

    set $block_search "${block_search}1";

}

# 如果两个条件都满足(URL 含搜索参数 + 是爬虫),则拦截

if ($block_search = "11") {

    return 410;

}


本文标签:

发表评论:

评论记录:

未查询到任何数据!
关于律师
————受人之托,忠人之事————
深圳数据合规律师
邓杰律师

专业

专注执业领域事务

尽责

全力办理委托事项

务实

扎实维护合法权益

邓杰系深耕于数据合规领域复合型资深专业律师,其律师执业证号为14403201810022100。邓杰律师现(曾)任WEB前端开发工程师、WEB服务器维护工程师、计算机信息网络安全员、深圳市人民政府听证员、深圳市政府采购评审专家(法律类)、深圳市某区政府系统公职律师,在网络领域和政府系统从业多年,深刻理解网络前沿技术和行政程序运行规则,十分擅长互联网+平台领域数据合规法律实务,可为政府、企业和个人在数据合规领域提供富有针对性的非诉、诉讼、仲裁、执行等法律风险防控解决方案,能有效维护当事人的各类合法权益。

扫一扫,存名片

深圳数据合规律师名片

律师名片

QQ扫一扫

深圳数据合规律师qq

QQ咨询

电话咨询

邓杰律师电话:13715198118

请输入您的联系电话,座机请加区号

电话咨询

微信扫一扫

深圳数据合规律师微信

微信联系