位置: 编程技术 - 正文

Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件)

编辑:rootadmin

推荐整理分享Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:linux 查找nginx,linux查看nginx进程命令,linux 查找nginx,查看nginx命令,linux如何查看nginx日志,linux nginx版本查看命令,linux查看nginx配置文件,linux查看nginx,内容如对您有帮助,希望把文章链接给更多的朋友!

摘要

做好网站SEO优化的第一步就是首先让蜘蛛爬虫经常来你的网站进行光顾,下面的Linux命令可以让你清楚的知道蜘蛛的爬行情况。下面我们针对nginx服务器进行分析,日志文件所在目录:/usr/local/nginx/logs/access.log,access.log这个文件记录的应该是最近一天的日志情况,首先请看看日志大小,如果很大(超过MB)建议别用这些命令分析,因为这些命令很消耗CPU,或者更新下来放到分析机上执行,以免影响网站的速度。

Linux shell命令

1. 百度蜘蛛爬行的次数

cat access.log | grep Baiduspider | wc

最左面的数值显示的就是爬行次数。

2. 百度蜘蛛的详细记录(Ctrl C可以终止)

cat access.log | grep Baiduspider

也可以用下面的命令:

cat access.log | grep Baiduspider | tail -n cat access.log | grep Baiduspider | head -n

只看最后条或最前条,这用就能知道这个日志文件的开始记录的时间和日期。

3. 百度蜘蛛抓取首页的详细记录

cat access.log | grep Baiduspider | grep “GET / HTTP”

百度蜘蛛好像对首页非常热爱每个钟头都来光顾,而谷歌和雅虎蜘蛛更喜欢内页。

Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件)

4. 百度蜘蛛派性记录时间点分布

cat access.log | grep “Baiduspider ” | awk ‘{print $4}'

5. 百度蜘蛛爬行页面按次数降序列表

cat access.log | grep “Baiduspider ” | awk ‘{print $7}' | sort | uniq -c | sort -r

文中的Baiduspider 改成Googlebot都可以查看谷歌的数据,鉴于大陆的特殊性,大家应该对百度的log更为关注。

附:(Mediapartners-Google)Google adsense蜘蛛的详细爬行记录

cat access.log | grep Mediapartners

Mediapartners-Google是什么呢&#;Google adsense广告之所以能与内容相关,因为每个包含着adsense的广告被访问后,很快就有个Mediapartners-Google蜘蛛来到这个页面,所以几分钟后再刷新就能显示相关性广告了,真厉害啊!

ps:linux下nginx如何启用网站日志,查看蜘蛛爬虫

默认的路径是你安装时候指定的

如果用的LNMP之类的安装包

你可以在SHELL下

whereisnginx

找到相应的路径之后

在NGINX下的CONF文件夹里看配置文件,日志文件如果记录了话

在配置文件里有路径的~

Linux Shell脚本面试问集合 Q:1Shell脚本是什么、它是必需的吗答:一个Shell脚本是一个文本文件,包含一个或多个命令。作为系统管理员,我们经常需要使用多个命令来完成一项任务

iredmail下安装脚本分析(一)---get_all.sh 文件所在目录为PKGS iredmail是一套以postfix为核心的整合邮件系统的安装脚本,可以达到快速部署邮件服务器的目的。经过上面的一系列分析后,进入到获取安装包的步骤,

exit(-1)或者return(-1)shell得到的退出码为什么是 下面我写了一个helloworld程序,一起看看吧://filename:main.c#includestdio.hintmain(void){printf("hellowolrd!n");return(-);}编译执行:gccmain.c&&./a.out现在我们看看在当前s

标签: linux查看nginx配置文件

本文链接地址:https://www.jiuchutong.com/biancheng/368685.html 转载请保留说明!

上一篇:浅谈:linux cron 计划任务常用符号小结(浅谈一下新冠的好处)

下一篇:Windows命令行bat批处理延迟sleep方法(批处理延时)(Windows命令行删除文件夹)

  • 中了单位大奖要缴个税吗?
  • 应收出口退税金额无法收回怎么做账?
  • 工商年报中的社保缴费基数怎么填
  • 补缴的税款和罚款的会计处理
  • 转出未交增值税借方
  • 公司费用票
  • 工程结算扣罚款怎么开票
  • 职工差旅费现金流出属于
  • 融资租赁业务的账务处理
  • 厂房推倒重建房产税
  • 其他流动资产的构成
  • 结转安装费用的会计分录
  • 发票抵税是指哪些内容
  • 免租期租金能否确认递延所得税吗?
  • 所得税预缴资产怎么算
  • 差旅补助需要计提吗
  • 五险会计分录会计处理
  • 公司欠法人钱
  • 公司人格否认制度构成要件
  • linux怎么打开文本文件
  • php技巧
  • linux怎么操作
  • linux系统备份整个硬盘的命令
  • 广告费与业务宣传费扣除给企业带来的好处
  • wordpress自定义文章类型
  • PHP:image2wbmp()的用法_GD库图像处理函数
  • wordpress用什么语言编写
  • 加计扣除符合的条件
  • 跨地区经营增值税预缴
  • 详解 HttpServletResponse
  • svc语法
  • 溢价收购股权会计处理案例
  • framework3.5启用
  • 个体户查账征收2023新政策是什么
  • 手把手教你用Excel制作考勤表
  • 原生ajax和axios的区别
  • ps卸载没反应
  • 出纳会计和现金会计的区别
  • 帝国cms商城教程
  • 一般计税和简易计税可以合并征税吗
  • 房屋租赁发票品目填写规范
  • 怎样识别真假增值税发票
  • 管理费用冲减其他应付款分录
  • 个人所得税如何扣税
  • 其他应收款收不回来怎么写情况说明
  • 残保金用人单位在职职工人数
  • 购买会计软件如何入账
  • 费用发票可以不抵扣进项税吗
  • 发票报销抵扣税点是给谁
  • 车辆加油费会计分录
  • 运输费计入什么科目里面
  • 坏账准备具有哪些特征
  • 建设项目财务费用包括哪些
  • 公司员工聚餐属于什么费用
  • 个体工商户记账报税教程
  • 转账手续费怎么入账
  • 供货商做产品配送怎么做
  • centos如何添加用户
  • 笔记本电脑bios更新
  • linux动态链接库怎么调用
  • centos6.10安装教程
  • win xp 虚拟内存
  • Linux系统root密码忘记怎么重置
  • windows 查看补丁
  • linux charon
  • 64位win7安装kb3038314补丁更新失败临时解决方法
  • 网卡破解
  • linux三种用户权限
  • win8注销在哪里
  • Cocos2dx3.2 Crazy Tetris 绘制不规则方块 遮罩(ClippingNode的使用)
  • unity例子
  • IE、FF、Chrome浏览器中的JS差异介绍
  • jq获取节点属性
  • javascript学到什么程度
  • 文化事业建设费是什么税
  • 委托代销清单怎么写
  • 新车交了购置税后给什么凭证
  • 贵州税务开票系统登录
  • 九江五室新楼盘
  • 国内货物运输代理行业代码是多少
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设