位置: 编程技术 - 正文

Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件)

编辑:rootadmin

推荐整理分享Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:linux 查找nginx,linux查看nginx进程命令,linux 查找nginx,查看nginx命令,linux如何查看nginx日志,linux nginx版本查看命令,linux查看nginx配置文件,linux查看nginx,内容如对您有帮助,希望把文章链接给更多的朋友!

摘要

做好网站SEO优化的第一步就是首先让蜘蛛爬虫经常来你的网站进行光顾,下面的Linux命令可以让你清楚的知道蜘蛛的爬行情况。下面我们针对nginx服务器进行分析,日志文件所在目录:/usr/local/nginx/logs/access.log,access.log这个文件记录的应该是最近一天的日志情况,首先请看看日志大小,如果很大(超过MB)建议别用这些命令分析,因为这些命令很消耗CPU,或者更新下来放到分析机上执行,以免影响网站的速度。

Linux shell命令

1. 百度蜘蛛爬行的次数

cat access.log | grep Baiduspider | wc

最左面的数值显示的就是爬行次数。

2. 百度蜘蛛的详细记录(Ctrl C可以终止)

cat access.log | grep Baiduspider

也可以用下面的命令:

cat access.log | grep Baiduspider | tail -n cat access.log | grep Baiduspider | head -n

只看最后条或最前条,这用就能知道这个日志文件的开始记录的时间和日期。

3. 百度蜘蛛抓取首页的详细记录

cat access.log | grep Baiduspider | grep “GET / HTTP”

百度蜘蛛好像对首页非常热爱每个钟头都来光顾,而谷歌和雅虎蜘蛛更喜欢内页。

Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件)

4. 百度蜘蛛派性记录时间点分布

cat access.log | grep “Baiduspider ” | awk ‘{print $4}'

5. 百度蜘蛛爬行页面按次数降序列表

cat access.log | grep “Baiduspider ” | awk ‘{print $7}' | sort | uniq -c | sort -r

文中的Baiduspider 改成Googlebot都可以查看谷歌的数据,鉴于大陆的特殊性,大家应该对百度的log更为关注。

附:(Mediapartners-Google)Google adsense蜘蛛的详细爬行记录

cat access.log | grep Mediapartners

Mediapartners-Google是什么呢&#;Google adsense广告之所以能与内容相关,因为每个包含着adsense的广告被访问后,很快就有个Mediapartners-Google蜘蛛来到这个页面,所以几分钟后再刷新就能显示相关性广告了,真厉害啊!

ps:linux下nginx如何启用网站日志,查看蜘蛛爬虫

默认的路径是你安装时候指定的

如果用的LNMP之类的安装包

你可以在SHELL下

whereisnginx

找到相应的路径之后

在NGINX下的CONF文件夹里看配置文件,日志文件如果记录了话

在配置文件里有路径的~

Linux Shell脚本面试问集合 Q:1Shell脚本是什么、它是必需的吗答:一个Shell脚本是一个文本文件,包含一个或多个命令。作为系统管理员,我们经常需要使用多个命令来完成一项任务

iredmail下安装脚本分析(一)---get_all.sh 文件所在目录为PKGS iredmail是一套以postfix为核心的整合邮件系统的安装脚本,可以达到快速部署邮件服务器的目的。经过上面的一系列分析后,进入到获取安装包的步骤,

exit(-1)或者return(-1)shell得到的退出码为什么是 下面我写了一个helloworld程序,一起看看吧://filename:main.c#includestdio.hintmain(void){printf("hellowolrd!n");return(-);}编译执行:gccmain.c&&./a.out现在我们看看在当前s

标签: linux查看nginx配置文件

本文链接地址:https://www.jiuchutong.com/biancheng/368685.html 转载请保留说明!

上一篇:浅谈:linux cron 计划任务常用符号小结(浅谈一下新冠的好处)

下一篇:Windows命令行bat批处理延迟sleep方法(批处理延时)(Windows命令行删除文件夹)

  • 累计赡养老人专项扣除6000
  • 建安企业企业所得税核定
  • 营改增后电力行业非正常损失怎么做会计处理?
  • 出口退税银行账户备案
  • 生物性资产是什么
  • 亏损企业所得税汇算清缴怎么做
  • 计入成本的有哪些科目
  • 当期出售其他权益怎么算
  • 买车预付款怎么记账
  • 版权许可授权书
  • 哪些情况需要补钙
  • 个税多缴纳如何低下个月的税
  • musirc4.71.exe - musirc4是什么进程文件 有什么作用
  • 最贵的耳机排名
  • 交易性金融资产包括哪些项目
  • nodejs解压
  • javascript postmessage
  • phprestfulapi框架
  • 资产负债表的资产方能够提供的信息包括
  • 金融企业利息收入增值税
  • 盘亏结转
  • 小程序的生命周期函数有哪些
  • 不得从销项税额中抵扣的是
  • nsloopup命令
  • 发票金额和打款金额不一致怎么办
  • 低值易耗品五五摊销法怎么计算
  • 帝国cms视频教程
  • phpcms默认密码
  • mysql入门很简单
  • python中with语句的用法
  • python 熵值法
  • 什么叫境外所得
  • 差旅费抵扣进项税额
  • 电子发票该怎么打印出来
  • 办公室装修费多少钱可以一次性入账
  • 适用5%征收率的范围
  • sql3表连接查询
  • 营业外支出的会计要素
  • 收到退回的增值税,应当作为营业外收入核算对吗
  • 去税务局开增值税专用发票流程
  • 利润分配账务处理例题
  • 工程在建期间的招待费计入什么科目
  • 微信收款要收费吗?
  • 生产企业库存商品怎么做分录
  • 优惠券抵扣账务处理流程
  • 购入固定资产计累计盈余
  • 企业转让固定资产属于什么收入
  • 稀释股权违法吗
  • 公司固定资产报废申请范文
  • 残疾人就业保障金征收使用管理办法
  • 垫付的开办费怎么做账
  • 现金收款凭证的填制日期应当是
  • 解析关于sql语句的实现
  • mysql 5.7.11 winx64安装配置方法图文教程
  • Mysql5.7在Centos6中的安装方法
  • mysql优化sql有哪些
  • 微软在印度的投资
  • linux日志类型
  • windows7很卡
  • win8系统怎么取消屏保
  • rhel6.5安装
  • win10 6个文件夹
  • elementtree修改节点属性
  • Unity Spine Skeleton Animation 2D骨骼动画 For Game 介绍
  • jquery如何获取input的值
  • linux每隔1s执行一次命令
  • css网页布局中注释是什么
  • unity3d应用开发
  • android studio警告
  • python利用matplotlib库绘制六边形
  • javascript post语法
  • 异地社保如何在本地使用医保
  • 收到红字信息表不能直接开具
  • 江西烟草公司局长
  • 沈阳地方税务局原局长
  • 如何查询纳税信用等级证明
  • 化妆品的消费税率为
  • 为什么我电脑登微信显示二维码失效
  • 用于直接销售消费品的消费税计入
  • 认缴制什么时候开始的?
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设