位置: 编程技术 - 正文

Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件)

编辑:rootadmin

推荐整理分享Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:linux 查找nginx,linux查看nginx进程命令,linux 查找nginx,查看nginx命令,linux如何查看nginx日志,linux nginx版本查看命令,linux查看nginx配置文件,linux查看nginx,内容如对您有帮助,希望把文章链接给更多的朋友!

摘要

做好网站SEO优化的第一步就是首先让蜘蛛爬虫经常来你的网站进行光顾,下面的Linux命令可以让你清楚的知道蜘蛛的爬行情况。下面我们针对nginx服务器进行分析,日志文件所在目录:/usr/local/nginx/logs/access.log,access.log这个文件记录的应该是最近一天的日志情况,首先请看看日志大小,如果很大(超过MB)建议别用这些命令分析,因为这些命令很消耗CPU,或者更新下来放到分析机上执行,以免影响网站的速度。

Linux shell命令

1. 百度蜘蛛爬行的次数

cat access.log | grep Baiduspider | wc

最左面的数值显示的就是爬行次数。

2. 百度蜘蛛的详细记录(Ctrl C可以终止)

cat access.log | grep Baiduspider

也可以用下面的命令:

cat access.log | grep Baiduspider | tail -n cat access.log | grep Baiduspider | head -n

只看最后条或最前条,这用就能知道这个日志文件的开始记录的时间和日期。

3. 百度蜘蛛抓取首页的详细记录

cat access.log | grep Baiduspider | grep “GET / HTTP”

百度蜘蛛好像对首页非常热爱每个钟头都来光顾,而谷歌和雅虎蜘蛛更喜欢内页。

Linux/Nginx如何查看搜索引擎蜘蛛爬虫的行为(linux查看nginx配置文件)

4. 百度蜘蛛派性记录时间点分布

cat access.log | grep “Baiduspider ” | awk ‘{print $4}'

5. 百度蜘蛛爬行页面按次数降序列表

cat access.log | grep “Baiduspider ” | awk ‘{print $7}' | sort | uniq -c | sort -r

文中的Baiduspider 改成Googlebot都可以查看谷歌的数据,鉴于大陆的特殊性,大家应该对百度的log更为关注。

附:(Mediapartners-Google)Google adsense蜘蛛的详细爬行记录

cat access.log | grep Mediapartners

Mediapartners-Google是什么呢&#;Google adsense广告之所以能与内容相关,因为每个包含着adsense的广告被访问后,很快就有个Mediapartners-Google蜘蛛来到这个页面,所以几分钟后再刷新就能显示相关性广告了,真厉害啊!

ps:linux下nginx如何启用网站日志,查看蜘蛛爬虫

默认的路径是你安装时候指定的

如果用的LNMP之类的安装包

你可以在SHELL下

whereisnginx

找到相应的路径之后

在NGINX下的CONF文件夹里看配置文件,日志文件如果记录了话

在配置文件里有路径的~

Linux Shell脚本面试问集合 Q:1Shell脚本是什么、它是必需的吗答:一个Shell脚本是一个文本文件,包含一个或多个命令。作为系统管理员,我们经常需要使用多个命令来完成一项任务

iredmail下安装脚本分析(一)---get_all.sh 文件所在目录为PKGS iredmail是一套以postfix为核心的整合邮件系统的安装脚本,可以达到快速部署邮件服务器的目的。经过上面的一系列分析后,进入到获取安装包的步骤,

exit(-1)或者return(-1)shell得到的退出码为什么是 下面我写了一个helloworld程序,一起看看吧://filename:main.c#includestdio.hintmain(void){printf("hellowolrd!n");return(-);}编译执行:gccmain.c&&./a.out现在我们看看在当前s

标签: linux查看nginx配置文件

本文链接地址:https://www.jiuchutong.com/biancheng/368685.html 转载请保留说明!

上一篇:浅谈:linux cron 计划任务常用符号小结(浅谈一下新冠的好处)

下一篇:Windows命令行bat批处理延迟sleep方法(批处理延时)(Windows命令行删除文件夹)

  • 增值税开票软件怎么升级最新版
  • 个人卖给公司车需要什么手续
  • 公司购买了地板可以退吗
  • 粗纤维测定仪使用方法
  • 实际上缴税费总额怎么算
  • .申报表税源编码怎么填
  • 代扣代缴增值税纳税义务发生时间
  • 对于子女继承父母的评价
  • 会计核算体系的建立
  • 退还增值税留抵税额是什么政策
  • 帮客人清关的费用如何做会计核算合适呢?
  • 大型医用设备维修效益成本分析 课件ppt
  • 加工费发票怎么做账务处理
  • 全年一次性奖金计税方式
  • 职工报销差旅费会计科目
  • 员工午餐补贴可以入福利费吗?
  • 清算时土地增值税计税依据
  • 电子普通发票进什么科目
  • key介质费入哪个科目?
  • 车辆违章罚款怎么入账
  • 企业所得税年报过了申报期还能修改吗
  • 财务报表未分配利润为负数
  • 稿酬所得怎么纳税
  • 收到财政厅的补助怎么办
  • 公司收到政府科技创新奖
  • 上海个人所得税计算器
  • 笔记本电脑应该关机还是睡眠
  • 清除cookies有什么用
  • 防水工程质量问题
  • 对于接受捐赠的资产价值,应计入当期损益
  • php判断ua
  • 预收账款为什么不属于金融负债
  • 企业发生的哪些费用可以结转
  • 企业自行搬迁需要交税吗
  • wifi增强器1200m的是不是比较好
  • 资产证券化会计信息披露规范
  • 存货包括其他业务成本吗
  • 广告费和业务宣传费调增还是调减
  • 促销品的账务处理按售价算吗
  • php用正则匹配网页的logo
  • 付出对价的公允
  • ChatGPT会让6个低端岗位失业
  • nmblookup安装
  • 工会筹备金不缴可以吗
  • 待抵扣进项税额转出会计分录
  • 未达起征点销售额怎么填申报表
  • 劳务派遣人员保险
  • 自行建造的固定资产达到预定可使用状态
  • 企业银行存款的利息收入计入财务费用的借方A对B错
  • 三证合一指的是什么意思
  • 对公账户转私人账户
  • 管理不善造成的存货盘亏损失计入什么科目
  • 建造合同收入
  • 获取sqlserver密码
  • sql,join
  • mysql函数用法
  • mysqldump导出csv文件
  • the bluetooth device is ready to pale
  • server core安装完成后按什么进行登录
  • 怎么u盘装系统win10
  • win8开机启动项怎么关闭
  • hke是什么意思
  • 已停止工作win7
  • linux系统修改
  • ExtJS4利根据登录后不同的角色分配不同的树形菜单
  • android通知消息
  • sqlite3 not found 解决方案
  • 用javascript
  • java script入门
  • jquery给表单赋值
  • js实现复制文本
  • 安卓通用代码
  • 土地增值税按什么价格
  • 4s店买车需要驾驶证吗
  • 酒席发票
  • 发票在地税能查到,但是国税查不到
  • 车辆购置税是国家收还是地方收
  • 固定资产折旧的影响因素
  • 车辆购置税多久能退回来
  • 消费税,资源税,城市建设维护税
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设