位置: 编程技术 - 正文

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

编辑:rootadmin

推荐整理分享NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:node爬虫框架puppeteer,nodejs做爬虫,node.js写爬虫,node python 爬虫,nodejs爬取数据,node.js写爬虫,nodejs做爬虫,node js爬虫,内容如对您有帮助,希望把文章链接给更多的朋友!

书接上回,我们需要修改程序以达到连续抓取个页面的内容。也就是说我们需要输出每篇文章的标题、链接、第一条评论、评论用户和论坛积分。

如图所示,$('.reply_author').eq(0).text().trim();得到的值即为正确的第一条评论的用户。

{<1>}

在eventproxy获取评论及用户名内容后,我们需要通过用户名跳到用户界面继续抓取该用户积分

在eventproxy这一次中,我们要找到score是放在哪里(class="big")。

{<2>}

找到classname就好办了,我们先试着把结果输出一下

运行程序,这段代码得到的结果。

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

{<3>}

但是问题来了,我们在.end()的回调函数中能正确输出结果,但是不能正确的输出outcome。仔细一看,需要输出的outcome是一个Request对象。这是因为粗心犯的错的,.end()函数并不会传递返回值给Request对象,需要将结果返回到上一层(users)。

把users好好地输出发现除了score1其他是正确值。仔细调试发现,程序是先进行了console.log(),然后再进行.map()。更准确地说,在.map()函数内,.get()的回调函数并没有执行完赋值score,return 返回值就进行了。这就是回调函数的异步,而外层的同步操作是不会等待回调函数做完操作的。

{<4>}

我的做法就是eventproxy再emit一层消息,伴随着消息把需要的数据一起传递给接收消息操作.after(),只有当消息全部接收完毕,再打印出传递的参数(结果)。

{<6>}

这个问题解决了,但score1的数值好像太大了点吧。再一看,原来class='big'有两个,用户的话题收藏也是属于这个class。我们得通过cheerio的.slice( start, [end] )来切取第一个元素,即将score 修改为 score = $('.big').slice(0).eq(0).text().trim();。正确结果如图。

{<7>}

sails框架的学习指南 上周通过搭建CMS系统接触到了sails框架,知道一些ORM的概念。这周开始深入后台数据交互,发现twenty框架的数据结构在sails上又设计了一番(比如node、cat

node.js开机自启动脚本文件 #!/bin/bash###BEGININITINFO#Provides:xiyoulib#Required-Start:$all#Required-Stop:$all#Default-Start:#Default-Stop:#Short-Description:Startdaemonatboottime#Description:Enableserviceprovidedbydaem

node.js中的path.extname方法使用说明 方法说明:返回path路径文件扩展名,如果path以‘.'为结尾,将返回‘.',如果无扩展名又不以'.'结尾,将返回空值。语法:path.extname(p)由于该方法属于pa

标签: nodejs爬虫框架crawler

本文链接地址:https://www.jiuchutong.com/biancheng/374216.html 转载请保留说明!

上一篇:NodeJS制作爬虫全过程(node.js写爬虫)

下一篇:sails框架的学习指南(spiral框架)

  • 金税开票软件下载安装
  • 累计交税如何计算?
  • 生产车间领用材料,用于产品生产
  • 企业缴纳的社保可以税前扣除吗
  • 城建税纳税申报表
  • 应税劳务和应税服务不合理列支的有哪些
  • 增值税专用发票税额怎么抵扣
  • 劳务报酬所得如何计税
  • 法人的投资款如何拿出来
  • 增值税代开扣款怎么报税?
  • 其他综合收益是利润表项目吗
  • 企业所得税弥补亏损年限
  • 物业公司营改增税务筹划方案
  • 燃油税改革了谁的钱包
  • 季度报税每个月还用计提吗
  • 存货的计税价格是什么
  • 工会经费给税务局交税比例
  • 企业的不征税收入用于支出所形成
  • 对方公司只能开发票吗
  • 企业季度所得税可以弥补以前年度亏损吗
  • 文件类型错误请重新选择
  • 如何修改鼠标指示灯颜色
  • 常见转移支付事项有哪些情况
  • php判断为空的方法有哪些
  • 房地产企业开发成本
  • 贷款房屋评估费怎么收
  • PHP:stream_register_wrapper()的用法_Stream函数
  • 老板垫资如何做账务处理
  • thinkphp vue
  • 哈雷6号
  • 行走在奥卡万戈河中的大象,博茨瓦纳,非洲南部 (© Markus Pavlowsky/Getty Images)
  • 资产负债表应交税费计算公式
  • java上传文件 multipartfile
  • 零基础舞蹈培训
  • 前端实际开发
  • sybaris插件包
  • 土地增值税的扣除项目金额怎么算
  • 认缴出资和注册资本
  • 机票行程单可以在到达地打印吗
  • 金融资产发生的相关费用计入初始入账金额有那些
  • 总分公司汇总申报计算
  • 小规模个体户国税怎么算
  • 投资收益借贷方代表什么
  • 营业收入在财务报表上用什么字母表示
  • win10下安装win7启动不了
  • microsoft SQL server 2008有什么用
  • 对公账户的钱都可以取吗
  • 资产负债表里的固定资产是原值还是净值
  • 水处理设备行业发展
  • 企业股权转让收入会计处理
  • 公司车过户给个人多久不用补税
  • 商业会计和财务会计
  • 所得税费用要结转本年利润吗
  • 工程承建方给予什么赔偿
  • 预付账款用途
  • 工程结算一般由什么等方式
  • 科目汇总表一张几行啊
  • 如何理解其他权益工具
  • centos安装ntfs 3g
  • windows无法安装所需的文件,请确保所需的所有文件可用
  • whagent.exe - whagent是什么进程
  • win10系统应用和浏览器控制需要启用吗
  • mac dock栏不见了
  • svchos1.exe - svchos1是什么教程 有什么作用
  • 教大家一些实用的技巧方法
  • 如何让xp系统崩溃
  • linux扫描硬件
  • win8更改账户
  • liunx改时间命令
  • python金融大数据 全流程详解
  • shell 数组变量
  • 安卓摄像头设置在哪里
  • 简述javascript的主要特点
  • javascript随机生成数字
  • 怎样看业务序号
  • 百望税控盘电子发票怎么打
  • 一般纳税人获得自产自销免税发票怎么处理
  • 国家税务局申报系统操作步骤说明在哪里看
  • 个人所得税选择那种方式更好
  • 双流税务总局电话
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设