位置: 编程技术 - 正文

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

编辑:rootadmin

推荐整理分享NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:node爬虫框架puppeteer,nodejs做爬虫,node.js写爬虫,node python 爬虫,nodejs爬取数据,node.js写爬虫,nodejs做爬虫,node js爬虫,内容如对您有帮助,希望把文章链接给更多的朋友!

书接上回,我们需要修改程序以达到连续抓取个页面的内容。也就是说我们需要输出每篇文章的标题、链接、第一条评论、评论用户和论坛积分。

如图所示,$('.reply_author').eq(0).text().trim();得到的值即为正确的第一条评论的用户。

{<1>}

在eventproxy获取评论及用户名内容后,我们需要通过用户名跳到用户界面继续抓取该用户积分

在eventproxy这一次中,我们要找到score是放在哪里(class="big")。

{<2>}

找到classname就好办了,我们先试着把结果输出一下

运行程序,这段代码得到的结果。

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

{<3>}

但是问题来了,我们在.end()的回调函数中能正确输出结果,但是不能正确的输出outcome。仔细一看,需要输出的outcome是一个Request对象。这是因为粗心犯的错的,.end()函数并不会传递返回值给Request对象,需要将结果返回到上一层(users)。

把users好好地输出发现除了score1其他是正确值。仔细调试发现,程序是先进行了console.log(),然后再进行.map()。更准确地说,在.map()函数内,.get()的回调函数并没有执行完赋值score,return 返回值就进行了。这就是回调函数的异步,而外层的同步操作是不会等待回调函数做完操作的。

{<4>}

我的做法就是eventproxy再emit一层消息,伴随着消息把需要的数据一起传递给接收消息操作.after(),只有当消息全部接收完毕,再打印出传递的参数(结果)。

{<6>}

这个问题解决了,但score1的数值好像太大了点吧。再一看,原来class='big'有两个,用户的话题收藏也是属于这个class。我们得通过cheerio的.slice( start, [end] )来切取第一个元素,即将score 修改为 score = $('.big').slice(0).eq(0).text().trim();。正确结果如图。

{<7>}

sails框架的学习指南 上周通过搭建CMS系统接触到了sails框架,知道一些ORM的概念。这周开始深入后台数据交互,发现twenty框架的数据结构在sails上又设计了一番(比如node、cat

node.js开机自启动脚本文件 #!/bin/bash###BEGININITINFO#Provides:xiyoulib#Required-Start:$all#Required-Stop:$all#Default-Start:#Default-Stop:#Short-Description:Startdaemonatboottime#Description:Enableserviceprovidedbydaem

node.js中的path.extname方法使用说明 方法说明:返回path路径文件扩展名,如果path以‘.'为结尾,将返回‘.',如果无扩展名又不以'.'结尾,将返回空值。语法:path.extname(p)由于该方法属于pa

标签: nodejs爬虫框架crawler

本文链接地址:https://www.jiuchutong.com/biancheng/374216.html 转载请保留说明!

上一篇:NodeJS制作爬虫全过程(node.js写爬虫)

下一篇:sails框架的学习指南(spiral框架)

  • 借贷利息怎么算
  • 一般纳税人销售自己使用过的汽车
  • 通过固定资产科目核算
  • 工伤保险应该计入什么科目
  • 电子税务局自然人怎么切换到企业
  • 工厂宿舍的水电安装规范图
  • 投标保证金退回规定
  • 自来水开出发票的税率是多少
  • 销售土地如何交增值税
  • 长期待摊费用可以转入费用或者成本吗
  • 调整以前年度多计提的工资
  • 收到免税发票怎么做账务处理
  • 已审核已过账已经生成凭证还能修改吗?
  • 发行债券到期一次还本付息和按月付息哪个发行价格低
  • 行政单位的会计要素
  • 冲回多提所得税
  • 合伙企业可以弥补以前年度亏损吗
  • 刻章后的发票要打印吗
  • 小规模纳税人2018
  • 新办企业地税要备案吗
  • 以前年度亏损可以税前扣除吗
  • 纳税人转让2016年以后的土地使用权
  • 企业职工不稳定,还能享受小微企业所得税优惠吗?
  • 二手房产增值税率
  • 食堂非税收入怎么申报
  • 土地平整费计入什么科目
  • 有合同未收到租金税务如何处理?
  • 企业收到现金支票
  • 水利基金返还分录怎么写
  • linux hdparm
  • agent程序
  • 前端实现拖拽拉动图片
  • 股权转让要交什么税举例
  • 识别税收风险点是什么
  • Yii使用技巧大汇总
  • 融资租入固定资产是什么意思
  • 事业单位资产管理中存在的问题及整改措施
  • 金蝶财务软件总监是谁
  • php设置header参数
  • 管理不善造成的货物损失进项税可以抵扣吗
  • 企业现金支付的范围
  • 工程项目开票金额和合同金额统计表
  • 新公司筹建期要做账吗
  • db2数据库管理的工具
  • 固定资产未转固属于什么问题
  • 新会计准则印花税需要计提吗
  • 权益法的股权比例
  • 承租方承担的税费有哪些
  • 存货期末计提减值准备影响当期所得税费用
  • 跨月发票红冲还要交税吗
  • 建筑业异地预交税款最新规定
  • 支付的员工餐费怎么记账
  • 股权激励费用如何计提
  • 私立医院怎么做不被骗的事情
  • 固定资产原价的含义
  • 在建工程的人工费会计分录
  • 土地增值税怎么预交税款
  • 跨行收报属于什么科目
  • 餐饮业怎样做账
  • 企业会计准则和小企业准则的区别
  • 新旧收入准则对比区别表
  • centos虚拟机怎么用
  • win 10如何安装
  • 大白菜u盘备份win10教程
  • windows7开机黑屏安全模式也进不去
  • linux系统中的用户大体可分为三组
  • centos failed to start login service
  • U盘硬装WIN7 64位旗舰系统,是怎样练成的(妹子装机衔接篇)
  • xp系统如何共享文件夹怎么弄
  • win7旗舰版更改适配器没有蓝牙连接
  • win10共享打印机win7连不上
  • css-1
  • 安装perl模块
  • windows常用网络命令的使用
  • html超链接打开本地文件
  • three.js typescript
  • vuex按需加载
  • 地税局工作人员工资标准多少
  • 深圳国税网上申报流程图
  • 增值税发票税控盘开票软件怎么下载
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设