位置: 编程技术 - 正文

Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件)

编辑:rootadmin

推荐整理分享Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:linux 查找nginx,linux查看nginx进程命令,linux 查找nginx,查看nginx命令,linux如何查看nginx日志,linux nginx版本查看命令,linux查看nginx配置文件,linux查看nginx,内容如对您有帮助,希望把文章链接给更多的朋友!

摘要

做好网站SEO优化的第一步就是首先让蜘蛛爬虫经常来你的网站进行光顾,下面的Linux命令可以让你清楚的知道蜘蛛的爬行情况。下面我们针对nginx服务器进行分析,日志文件所在目录:/usr/local/nginx/logs/access.log,access.log这个文件记录的应该是最近一天的日志情况,首先请看看日志大小,如果很大(超过MB)建议别用这些命令分析,因为这些命令很消耗CPU,或者更新下来放到分析机上执行,以免影响网站的速度。

Linux shell命令

1. 百度蜘蛛爬行的次数

cat access.log | grep Baiduspider | wc

最左面的数值显示的就是爬行次数。

2. 百度蜘蛛的详细记录(Ctrl C可以终止)

cat access.log | grep Baiduspider

也可以用下面的命令:

cat access.log | grep Baiduspider | tail -n cat access.log | grep Baiduspider | head -n

只看最后条或最前条,这用就能知道这个日志文件的开始记录的时间和日期。

3. 百度蜘蛛抓取首页的详细记录

cat access.log | grep Baiduspider | grep “GET / HTTP”

百度蜘蛛好像对首页非常热爱每个钟头都来光顾,而谷歌和雅虎蜘蛛更喜欢内页。

Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件)

4. 百度蜘蛛派性记录时间点分布

cat access.log | grep “Baiduspider ” | awk ‘{print $4}'

5. 百度蜘蛛爬行页面按次数降序列表

cat access.log | grep “Baiduspider ” | awk ‘{print $7}' | sort | uniq -c | sort -r

文中的Baiduspider 改成Googlebot都可以查看谷歌的数据,鉴于大陆的特殊性,大家应该对百度的log更为关注。

附:(Mediapartners-Google)Google adsense蜘蛛的详细爬行记录

cat access.log | grep Mediapartners

Mediapartners-Google是什么呢&#;Google adsense广告之所以能与内容相关,因为每个包含着adsense的广告被访问后,很快就有个Mediapartners-Google蜘蛛来到这个页面,所以几分钟后再刷新就能显示相关性广告了,真厉害啊!

ps:linux下nginx如何启用网站日志,查看蜘蛛爬虫

默认的路径是你安装时候指定的

如果用的LNMP之类的安装包

你可以在SHELL下

whereisnginx

找到相应的路径之后

在NGINX下的CONF文件夹里看配置文件,日志文件如果记录了话

在配置文件里有路径的~

Linux Shell脚本面试问集合 Q:1Shell脚本是什么、它是必需的吗答:一个Shell脚本是一个文本文件,包含一个或多个命令。作为系统管理员,我们经常需要使用多个命令来完成一项任务

iredmail下安装脚本分析(一)---get_all.sh 文件所在目录为PKGS iredmail是一套以postfix为核心的整合邮件系统的安装脚本,可以达到快速部署邮件服务器的目的。经过上面的一系列分析后,进入到获取安装包的步骤,

exit(-1)或者return(-1)shell得到的退出码为什么是 下面我写了一个helloworld程序,一起看看吧://filename:main.c#includestdio.hintmain(void){printf("hellowolrd!n");return(-);}编译执行:gccmain.c&&./a.out现在我们看看在当前s

标签: linux查看nginx配置文件

本文链接地址:https://www.jiuchutong.com/biancheng/368685.html 转载请保留说明!

上一篇:浅谈:linux cron 计划任务常用符号小结(浅谈一下新冠的好处)

下一篇:Windows命令行bat批处理延迟sleep方法(批处理延时)(Windows命令行删除文件夹)

  • 视同销售的增值税怎么申报
  • 什么叫社会化纳税服务?
  • 个税app正式启用
  • 缴纳以前年度所得税在今年汇算清缴怎么填报
  • 包装物押金计入成本吗
  • 取用备用金要188分
  • 最近的火车票代售点
  • 资本公积金转增股本所获取的收益属于
  • 行政单位往来款项长期未清理
  • 多出来的费用
  • 产品置换广告费
  • 基本生产车间领用周转材料会计分录
  • 支付专家劳务费什么意思
  • 生产成本里面的工会经费
  • 税率与征收率有关系吗
  • 开错税率怎么报税
  • 多计提的社保费,可否计入营业外收入
  • 商品流通企业采购商品的进货费用金额较小的
  • 办理环评费用
  • 安装设备领用原材料应该用成本还是公允
  • 企业所得税一季度盈利二季度亏损
  • 非金融企业之间的借款合同要交印花税吗
  • 神州战神笔记本怎么进入不了bios
  • 间断性断网
  • 无法收回的保证金计入营业外支出汇算清缴调增填其他吗
  • u启动怎么装机
  • 苹果系统公测版
  • phpstudy的ftp
  • 索尼体积最小的微单
  • php有很多流行的mvc框架,这些框架可以
  • 生产费用在完工产品和在产品之间
  • 湘菜尖椒炒肉的做法
  • 小企业会计准则调整以前年度费用分录
  • 建筑企业异地预缴企业所得税
  • php使用自定义函数编程求半径r的圆的周长和面积
  • 网络分割算法
  • 不仅仅是喜欢原唱
  • php获取服务器ip和客户端ip的方法
  • 零申报有哪些
  • 企业开具劳务费发票怎么开,税率多少
  • 外购产品的会计分录
  • 银行收付款凭证是什么
  • 帝国cms8.0
  • 怎么开电子专用增值税发票
  • 税控发票如何入账
  • 社保减免财务账务处理
  • 属于原始凭证的有( )
  • sql查询服务器硬件信息
  • SQL Server中的XML数据进行insert、update、delete操作实现代码
  • 小规模开票多少成一般纳税人
  • 一般纳税人购买汽车会计分录
  • 企业承担个人所得税分录怎么做
  • 为什么留存收益不考虑筹资费用
  • 普票抵扣
  • ゆうちょ银行转账步骤
  • 商业企业费用科目
  • mysql分页性能
  • mac查找序列号
  • 新疆喀什地区身份证号码开头
  • LINUX操作系统的主要组成部分有
  • fedora s7
  • debian启用ssh
  • win8.1企业版激活密钥最新
  • win10 禁用驱动
  • macbook key
  • 苹果电脑bim
  • 苹果Mac OS X通知中心提示音怎么修改 OS X通知中心提示音更换方法图解
  • pln是什么文件
  • 基于socket的聊天程序
  • msoobe命令
  • 文本框几种常用属性
  • unity script api
  • javascript命名空间
  • 基于python的系统
  • js window.screen
  • Python运行报错此段代码无法访问
  • 公司地址变更后社保要改吗
  • 公司账户注销了,是不是网银也注销了
  • 青椒课堂怎么激活登录
  • 增值税与个人的区别
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设