位置: 编程技术 - 正文

Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件)

编辑:rootadmin

推荐整理分享Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:linux 查找nginx,linux查看nginx进程命令,linux 查找nginx,查看nginx命令,linux如何查看nginx日志,linux nginx版本查看命令,linux查看nginx配置文件,linux查看nginx,内容如对您有帮助,希望把文章链接给更多的朋友!

摘要

做好网站SEO优化的第一步就是首先让蜘蛛爬虫经常来你的网站进行光顾,下面的Linux命令可以让你清楚的知道蜘蛛的爬行情况。下面我们针对nginx服务器进行分析,日志文件所在目录:/usr/local/nginx/logs/access.log,access.log这个文件记录的应该是最近一天的日志情况,首先请看看日志大小,如果很大(超过MB)建议别用这些命令分析,因为这些命令很消耗CPU,或者更新下来放到分析机上执行,以免影响网站的速度。

Linux shell命令

1. 百度蜘蛛爬行的次数

cat access.log | grep Baiduspider | wc

最左面的数值显示的就是爬行次数。

2. 百度蜘蛛的详细记录(Ctrl C可以终止)

cat access.log | grep Baiduspider

也可以用下面的命令:

cat access.log | grep Baiduspider | tail -n cat access.log | grep Baiduspider | head -n

只看最后条或最前条,这用就能知道这个日志文件的开始记录的时间和日期。

3. 百度蜘蛛抓取首页的详细记录

cat access.log | grep Baiduspider | grep “GET / HTTP”

百度蜘蛛好像对首页非常热爱每个钟头都来光顾,而谷歌和雅虎蜘蛛更喜欢内页。

Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件)

4. 百度蜘蛛派性记录时间点分布

cat access.log | grep “Baiduspider ” | awk ‘{print $4}'

5. 百度蜘蛛爬行页面按次数降序列表

cat access.log | grep “Baiduspider ” | awk ‘{print $7}' | sort | uniq -c | sort -r

文中的Baiduspider 改成Googlebot都可以查看谷歌的数据,鉴于大陆的特殊性,大家应该对百度的log更为关注。

附:(Mediapartners-Google)Google adsense蜘蛛的详细爬行记录

cat access.log | grep Mediapartners

Mediapartners-Google是什么呢&#;Google adsense广告之所以能与内容相关,因为每个包含着adsense的广告被访问后,很快就有个Mediapartners-Google蜘蛛来到这个页面,所以几分钟后再刷新就能显示相关性广告了,真厉害啊!

ps:linux下nginx如何启用网站日志,查看蜘蛛爬虫

默认的路径是你安装时候指定的

如果用的LNMP之类的安装包

你可以在SHELL下

whereisnginx

找到相应的路径之后

在NGINX下的CONF文件夹里看配置文件,日志文件如果记录了话

在配置文件里有路径的~

Linux Shell脚本面试问集合 Q:1Shell脚本是什么、它是必需的吗答:一个Shell脚本是一个文本文件,包含一个或多个命令。作为系统管理员,我们经常需要使用多个命令来完成一项任务

iredmail下安装脚本分析(一)---get_all.sh 文件所在目录为PKGS iredmail是一套以postfix为核心的整合邮件系统的安装脚本,可以达到快速部署邮件服务器的目的。经过上面的一系列分析后,进入到获取安装包的步骤,

exit(-1)或者return(-1)shell得到的退出码为什么是 下面我写了一个helloworld程序,一起看看吧://filename:main.c#includestdio.hintmain(void){printf("hellowolrd!n");return(-);}编译执行:gccmain.c&&./a.out现在我们看看在当前s

标签: linux查看nginx配置文件

本文链接地址:https://www.jiuchutong.com/biancheng/368685.html 转载请保留说明!

上一篇:浅谈:linux cron 计划任务常用符号小结(浅谈一下新冠的好处)

下一篇:Windows命令行bat批处理延迟sleep方法(批处理延时)(Windows命令行删除文件夹)

  • 企业所得税属于地方税吗
  • 税友财务软件一年多少钱
  • 债券的利益
  • 行政单位固定资产管理制度
  • 土地增值税清算方法与技巧
  • 高铁票抵扣增值税
  • 全额抵扣的发票怎么申报增值税
  • 企业哪些做法违背了营销道德
  • 资产减值损失借贷方向
  • 个体户查账征收怎么交税?
  • 存在银行保证金计入什么会计科目
  • 代收代付如何进行账务处理?
  • 抵减以前年度多缴企业所得税分录
  • 上月未抵扣完的进项税本月可以抵扣吗
  • 应纳税所得额应纳税额公式
  • 加班误餐费应该怎么走账?
  • 水电费发票可以开吗
  • 分项结转法怎么结转
  • 票据质押后如何行使质权
  • 会计帐务处理程序
  • 笔记本恢复出厂设置后和新的一样吗
  • 鸿蒙智能充电模式怎么用
  • win11怎么用
  • 开启浏览器模式
  • 间接费用是什么费用
  • 如何在数据透视表中增加一行
  • phpserialize
  • scm wms
  • 为什么WIN10系统打在画面进不去
  • 公司买的手机怎么入账科目
  • 房地产公司股权收购
  • 错账改正方法
  • 担保余值包括
  • php curl_init
  • 预计负债的所得税怎么算
  • 前端男神尤雨溪传奇
  • php新手入门
  • 电子缴款凭证能代替完税证明吗
  • 社保比例调整后多久生效
  • 模拟电子技术基础知识点总结
  • 基建账如何并入会计科目
  • defaultpool
  • Web 1.0、Web 2.0 和 Web 3.0 之间的比较
  • php数据统计源码
  • 电力系统培训计划
  • 境外企业在境内投资是否备案
  • 办营业执照怎么填写经营范围
  • 织梦cms官网
  • mongodb morphia
  • 成本类科目怎么记账
  • 第四季度报表和年报对不上
  • 企业所得税的营业收入包括营业外收入吗
  • 小微企业的资产负债率一般为多少
  • 合营企业和联营企业都是权益法吗
  • 车辆购置税收优惠
  • 纳税人应按照当期可抵扣进项税额的10%
  • MySQL中distinct语句的基本原理及其与group by的比较
  • 预缴增值税附加税需要计提吗
  • 住宿费开的增值税专用发票怎么记账
  • 个人如何成立公司
  • win10开机内存就占了70 解决方法
  • macos安装pip
  • 如何打开mac系统终端
  • windows intel
  • windows10怎么老是蓝屏
  • GhostXP_SP3活力版V3.0_系统之家首发
  • windows8功能设置
  • 驱动人生公司怎么样
  • win8.1卸载系统自带应用工具
  • 简单解析空中三角测量的意义
  • 用python循环语句
  • python 数独破解器
  • javascript例题
  • 怎么用python画图具体步骤
  • 如果我中了双色球
  • 打印发票需要什么信息
  • 福建税务局网上办税
  • 国税发票查询能查出什么项目
  • 行政事业单位自办食堂规定
  • 怎样以实际行动争取入团
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设