位置: 编程技术 - 正文

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

编辑:rootadmin

推荐整理分享NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:node爬虫框架puppeteer,nodejs做爬虫,node.js写爬虫,node python 爬虫,nodejs爬取数据,node.js写爬虫,nodejs做爬虫,node js爬虫,内容如对您有帮助,希望把文章链接给更多的朋友!

书接上回,我们需要修改程序以达到连续抓取个页面的内容。也就是说我们需要输出每篇文章的标题、链接、第一条评论、评论用户和论坛积分。

如图所示,$('.reply_author').eq(0).text().trim();得到的值即为正确的第一条评论的用户。

{<1>}

在eventproxy获取评论及用户名内容后,我们需要通过用户名跳到用户界面继续抓取该用户积分

在eventproxy这一次中,我们要找到score是放在哪里(class="big")。

{<2>}

找到classname就好办了,我们先试着把结果输出一下

运行程序,这段代码得到的结果。

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

{<3>}

但是问题来了,我们在.end()的回调函数中能正确输出结果,但是不能正确的输出outcome。仔细一看,需要输出的outcome是一个Request对象。这是因为粗心犯的错的,.end()函数并不会传递返回值给Request对象,需要将结果返回到上一层(users)。

把users好好地输出发现除了score1其他是正确值。仔细调试发现,程序是先进行了console.log(),然后再进行.map()。更准确地说,在.map()函数内,.get()的回调函数并没有执行完赋值score,return 返回值就进行了。这就是回调函数的异步,而外层的同步操作是不会等待回调函数做完操作的。

{<4>}

我的做法就是eventproxy再emit一层消息,伴随着消息把需要的数据一起传递给接收消息操作.after(),只有当消息全部接收完毕,再打印出传递的参数(结果)。

{<6>}

这个问题解决了,但score1的数值好像太大了点吧。再一看,原来class='big'有两个,用户的话题收藏也是属于这个class。我们得通过cheerio的.slice( start, [end] )来切取第一个元素,即将score 修改为 score = $('.big').slice(0).eq(0).text().trim();。正确结果如图。

{<7>}

sails框架的学习指南 上周通过搭建CMS系统接触到了sails框架,知道一些ORM的概念。这周开始深入后台数据交互,发现twenty框架的数据结构在sails上又设计了一番(比如node、cat

node.js开机自启动脚本文件 #!/bin/bash###BEGININITINFO#Provides:xiyoulib#Required-Start:$all#Required-Stop:$all#Default-Start:#Default-Stop:#Short-Description:Startdaemonatboottime#Description:Enableserviceprovidedbydaem

node.js中的path.extname方法使用说明 方法说明:返回path路径文件扩展名,如果path以‘.'为结尾,将返回‘.',如果无扩展名又不以'.'结尾,将返回空值。语法:path.extname(p)由于该方法属于pa

标签: nodejs爬虫框架crawler

本文链接地址:https://www.jiuchutong.com/biancheng/374216.html 转载请保留说明!

上一篇:NodeJS制作爬虫全过程(node.js写爬虫)

下一篇:sails框架的学习指南(spiral框架)

  • 应纳税所得额100万以内,税负2.5%是什么意思
  • 公司注销涉及哪些税务部门
  • 企业税前扣除凭证包括增值税发票吗
  • 代第三方收取的款项作为什么处理
  • 行政单位要不要税号
  • 车险 保险金额
  • 借贷必相等为什么是错的
  • 利息收入为什么不能在贷方
  • 汇算清缴上年度金额怎么填
  • 签章是签字还是盖章z还是手印
  • 中外合资经营企业法
  • 超过三个月开发票
  • 发票专用章备案需要什么资料
  • 销售方销售折让的会计处理
  • 开发票冲销
  • 专票电话写错了怎么办
  • 管理费用劳务费包括什么
  • mac应用程序安装权限在哪找
  • 企业计提的坏帐会计分录
  • 驱动备份和还原工具软件有哪些
  • linux禁用root用户
  • 优酷路由宝是什么东西
  • 水利基金返还分录怎么写
  • php mb_convert_encoding
  • linux检测
  • 哪些企业需进行预算管理
  • php23种设计模式
  • 生产型企业出口退税会计分录
  • 债券的回购
  • 固定资产自行建造的会计处理
  • framework7教程
  • 报废的设备怎么处理
  • 育空河24102
  • 国内外人工智能发展现状,及最新的人工智能应用?
  • vue常用
  • smarty模板引擎
  • 付临时工工资需要什么材料
  • 为什么其他权益工具投资不计提减值准备
  • 视频制作发票属于什么经营范围
  • 对公账户的资金怎么转出
  • 利润分配的账务处理会计分录
  • 增值税电子发票怎么领用
  • 跨年的增值税普通发票怎么冲红
  • 增值税免税收入账务处理
  • 定期存款怎么入门
  • 织梦cms怎么样
  • 收到抵扣发票怎么做分录
  • 个人所得税隔月交么
  • 工会账以固定资产投资
  • 企业哪些情况下需要报税
  • 公允价值变动损益影响利润吗
  • 企业所得税入账凭证
  • 在建工程前期投标流程
  • 开了20万销项进项为0交多少税
  • 营改增的增值税
  • sql server错误和使用情况报告
  • sql数据库对象
  • mysql优化实战
  • 安装win8系统需要什么条件
  • 微软软件怎么用
  • 对Windows Server 2008系统自带的磁盘分区进行无损分区的教程图文介绍
  • vcpkgsrv.exe是什么进程
  • centos中用户的基本属性
  • windows8怎么设置
  • mac迁移助理是什么意思啊
  • 电脑window8系统怎么样
  • windows8 应用商店
  • 使用linux的电脑
  • python3m
  • js中鼠标经过事件
  • unityui动画
  • js能写贪吃蛇游戏是什么水平
  • Android系统服务
  • 简并税率是什么意思
  • 江苏省发票查询电话
  • 税务局有哪些职务名称
  • 缴款单号怎么交学费
  • 税务局大厅咨询台
  • 河南省税务局系统最新消息
  • 生产企业出口退税账务处理会计分录
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设