位置: 编程技术 - 正文

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

编辑:rootadmin

推荐整理分享NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:node爬虫框架puppeteer,nodejs做爬虫,node.js写爬虫,node python 爬虫,nodejs爬取数据,node.js写爬虫,nodejs做爬虫,node js爬虫,内容如对您有帮助,希望把文章链接给更多的朋友!

书接上回,我们需要修改程序以达到连续抓取个页面的内容。也就是说我们需要输出每篇文章的标题、链接、第一条评论、评论用户和论坛积分。

如图所示,$('.reply_author').eq(0).text().trim();得到的值即为正确的第一条评论的用户。

{<1>}

在eventproxy获取评论及用户名内容后,我们需要通过用户名跳到用户界面继续抓取该用户积分

在eventproxy这一次中,我们要找到score是放在哪里(class="big")。

{<2>}

找到classname就好办了,我们先试着把结果输出一下

运行程序,这段代码得到的结果。

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

{<3>}

但是问题来了,我们在.end()的回调函数中能正确输出结果,但是不能正确的输出outcome。仔细一看,需要输出的outcome是一个Request对象。这是因为粗心犯的错的,.end()函数并不会传递返回值给Request对象,需要将结果返回到上一层(users)。

把users好好地输出发现除了score1其他是正确值。仔细调试发现,程序是先进行了console.log(),然后再进行.map()。更准确地说,在.map()函数内,.get()的回调函数并没有执行完赋值score,return 返回值就进行了。这就是回调函数的异步,而外层的同步操作是不会等待回调函数做完操作的。

{<4>}

我的做法就是eventproxy再emit一层消息,伴随着消息把需要的数据一起传递给接收消息操作.after(),只有当消息全部接收完毕,再打印出传递的参数(结果)。

{<6>}

这个问题解决了,但score1的数值好像太大了点吧。再一看,原来class='big'有两个,用户的话题收藏也是属于这个class。我们得通过cheerio的.slice( start, [end] )来切取第一个元素,即将score 修改为 score = $('.big').slice(0).eq(0).text().trim();。正确结果如图。

{<7>}

sails框架的学习指南 上周通过搭建CMS系统接触到了sails框架,知道一些ORM的概念。这周开始深入后台数据交互,发现twenty框架的数据结构在sails上又设计了一番(比如node、cat

node.js开机自启动脚本文件 #!/bin/bash###BEGININITINFO#Provides:xiyoulib#Required-Start:$all#Required-Stop:$all#Default-Start:#Default-Stop:#Short-Description:Startdaemonatboottime#Description:Enableserviceprovidedbydaem

node.js中的path.extname方法使用说明 方法说明:返回path路径文件扩展名,如果path以‘.'为结尾,将返回‘.',如果无扩展名又不以'.'结尾,将返回空值。语法:path.extname(p)由于该方法属于pa

标签: nodejs爬虫框架crawler

本文链接地址:https://www.jiuchutong.com/biancheng/374216.html 转载请保留说明!

上一篇:NodeJS制作爬虫全过程(node.js写爬虫)

下一篇:sails框架的学习指南(spiral框架)

  • 捐赠免税会计分录
  • 什么是税收滞纳金请举例说明
  • 不含税的销售额乘以税率等于什么
  • 施工单位企业所得税
  • 办公室空调维修报告
  • 免退税企业结转怎么操作
  • 收到公司退货会计分录
  • 年初未分配利润借方增加还是减少
  • 承包费收入如何交增值税
  • 退休人员基本养老金调整幅度需要综合考虑什么因素
  • 租赁房租备案要多久
  • 营改增后取得土地转让
  • 工业企业该怎样建账?
  • 递延资产摊销属于什么科目
  • 拿到购房发票
  • 电信增值税发票怎么抵扣
  • 人身意外保险费可以扣除企业所得税吗
  • 房企的预收账款是什么
  • 谨慎性原则的具体体现有哪些
  • 工程用的东西有什么
  • 应付职工薪酬账户结构
  • 三证合一后的税务登记证查询方法
  • 销售免费样品账务处理
  • 非限定性净资产相当于哪个科目
  • php中session的作用
  • 代开增值税发票沒有付款怎么做账?
  • win10改头像怎么删除以前的头像
  • PHP:pg_options()的用法_PostgreSQL函数
  • 其他应付款结转什么科目
  • 提前支付的费用记账
  • php 文件上传类型限制
  • js编写一个标准的单例模式类
  • 企业发放误餐补助需要票据吗
  • 生产企业可以抵扣进项税的
  • 尚品汇在哪
  • wordpress使用教程
  • 支付押金无法收取怎么办
  • 利润分配和所有权的关系
  • 租赁公司车转到私人名下
  • 织梦网站停止使用了还侵权吗
  • 业务招待费的列支范围
  • 购车预付款交了可以退吗
  • 赞助费入账需要多久
  • 融资租赁本金和租金的区别
  • 产品出库检验报告单格式
  • 终端运行mysql
  • java如何连接sql
  • T-SQL中使用正则表达式函数
  • win8关闭触屏
  • window2008 64位系统没有office组件问题分析及解决
  • cosplay步骤
  • ubuntu上安装qt
  • centos关闭kdump
  • 在windows下把绿色程序添加到鼠标右键的方法
  • win7旗舰版系统怎么样
  • windowsxp的磁盘管理在哪
  • centos安装虚拟机教程
  • win10怎么这只让任务栏图标居中显示?
  • win10总连不上网
  • js实现功能
  • 定制家具加盟品牌
  • .android
  • bat批处理脚本教程
  • python的判断语句
  • javascript+css3开发打气球小游戏完整代码
  • 微信小程序实现人脸识别
  • jquerycdn
  • sql服务3417
  • jquery mobile
  • shell中setenv
  • 智能图片制作
  • python调用python代码
  • javascript中的对象用于
  • 安卓 触摸屏
  • python环境及基础语法
  • 湖南省电子国税
  • 税务干部转正工作总结
  • 河北电子税务局网上登录
  • 运输类税点
  • 小规模纳税季度申报
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设