位置: 编程技术 - 正文

基于node.js制作简单爬虫教程(node. js教程)

编辑:rootadmin

推荐整理分享基于node.js制作简单爬虫教程(node. js教程),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:node.js视频教程,node怎么做,node.js视频教程,node.js怎么用,node怎么做,node.js怎么用,node.js怎么用,node怎么做,内容如对您有帮助,希望把文章链接给更多的朋友!

前言:最近想学习node.js,突然在网上看到基于node的爬虫制作教程,所以简单学习了一下,把这篇文章分享给同样初学node.js的朋友。

目标:爬取 网站的所有门店发型师的基本信息。

思路:访问上述网站,通过chrome浏览器的network对网页内容分析,找到获取各个门店发型师的接口,对参数及返回数据进行分析,遍历所有门店的所有发型师,直到遍历完毕,同事将信息存储到本地。

步骤一:安装node.js

下载并安装node,此步骤比较简单就不详细解释了,有问题的可以直接问一下度娘。

步骤二:建立工程

1)打开dos命令条,cd进入想要创建项目的路径(我将此项目直接放在了E盘,以下皆以此路径为例);

2)mkdir node (创建一个文件夹用来存放项目,我这里取名为node);

3)cd 进入名为node的文件夹,并执行npm init初始化工程(期间会让填写一些信息,我是直接回车的);

步骤三:创建爬取到的数据存放的文件夹

1)创建data文件夹用来存放发型师基本信息;

2)创建image文件夹用来存储发型师头像图片;

  此时工程下文件如下: 

步骤四:安装第三方依赖包(fs是内置模块,不需要单独安装)

1)npm install cheerio ?save

基于node.js制作简单爬虫教程(node. js教程)

2)npm install superagent ?save

3)npm install async ?save

4)npm install request ?save

分别简单解释一下上面安装的依赖包:

cheerio:是nodejs的抓取页面模块,为服务器特别定制的,快速、灵活、实施的jQuery核心实现,则能够对请求结果进行解析,解析方式和jQuery的解析方式几乎完全相同;

superagent:能够实现主动发起get/post/delete等请求;

async:async模块是为了解决嵌套金字塔,和异步流程控制而生,由于nodejs是异步编程模型,有一些在同步编程中很容易做到的事情,现在却变得很麻烦。Async的流程控制就是为了简化这些操作;

request:有了这个模块,http请求变的超简单,Request使用简单,同时支持https和重定向;

步骤五:编写爬虫程序代码

打开hz.js,编写代码:

步骤六:运行爬虫程序

输入node hz.js命令运行爬虫程序,效果图如下:

运行成功后,发型师基本信息以html文件的形式存储在data文件夹中,发型师头像图片存储在image文件夹下:

后记:到此一款基于node.js制作的简单爬虫就大功告成了,由于我也是初学者,好多地方也不是很理解,但好在是自己完成了,不足之处敬请谅解。

代码下载地址:

十大 Node.js 的 Web 框架(快速提升工作效率) Node.js系统含有多种不同的结构,如MVC、全栈、RESTAPI和生成器等。这些结构不仅提升了Web应用的开发效率,也优化了开发过程。在这里,我们收集整理了

NodeJS实现图片上传代码(Express) 文件上传是每个网站不可避免的,最近需要做些上传图片的功能,主要解决两个问题,一个是文件上传样式和服务端路径保存,功能很简单,做起来倒

node.js + socket.io 实现点对点随机匹配聊天 真心佩服那些可以经常发布笔记的人,其实我也想经常发来的,奈何技术不够加上懒,要向大神们多多学习了,前段时间有用bomb平台自带的socket写一个

标签: node. js教程

本文链接地址:https://www.jiuchutong.com/biancheng/382124.html 转载请保留说明!

上一篇:详解如何使用Node.js编写命令工具——以vue-cli为例(noodoe如何使用)

下一篇:十大 Node.js 的 Web 框架(快速提升工作效率)(node.js权威指南)

  • 购买金税盘和维税盘区别
  • 土地增值税会计核算
  • 收入准则范围内
  • 公允价值变动损益属于什么科目
  • 成品油红字发票开错了
  • 机票的抵扣进项怎么抵扣
  • 台账和明细账的区别
  • 已付的账款叫什么
  • 收据可以盖发票专用章吗有效吗
  • 增值税普通发票几个点
  • 土地增值税多交了怎么处理
  • 预收房租增值税税率
  • 出口转内销补交关税
  • 不动产发票怎么填写
  • 银行手续费没拿可以退吗
  • 转出多交增值税借方余额表示
  • 免租金政策
  • 账本印花税计税金额或件数怎么申报2023
  • 企业出售房产的账务处理
  • 小规模税务30万免税政策
  • 外购物品用于计提折旧吗
  • 多计提的冲回如何记账?
  • 净资产属于政府预算会计要素吗
  • 不是公司员工可以买原始股吗
  • 税务机构
  • 中小企业信用服务平台
  • 房屋出租预收租金房产税纳税义务发生时间
  • 收到股改代扣代缴税款
  • 上海个人所得税计算器
  • 提升一下网速
  • 开具给个人的发票哪里查询
  • 以前年度应当取得而未取得的发票
  • 提取的坏账准备使用完后如何处理
  • thinkphpcount查询
  • 财务的几张报表
  • Midjourney之外21款免费的AI Image画图网站集合
  • 帝国cms怎么上传图片
  • 国税网如何下载申报后的财务报表
  • python中sys模块
  • mysql中regexp_instr函数的使用
  • 可供出售金融资产的会计处理
  • 日记账对方科目是什么意思
  • 非正常损失的增值税进项税额转出
  • 生育津贴如何做帐
  • 减免税额和抵免税额是什么意思
  • 四种股利分配政策及适用情况
  • 个税申报错误怎么退税
  • 一般纳税人技术服务费几个点
  • 罚款支出计入什么费用
  • sqlserver2008导出表结构和表数据
  • 免征增值税的会计处理 小企业会计准则
  • 外币账户的设置在哪里
  • 年应税销售额是指纳税人在连续不超过12个月或四个季度
  • 香港发票在内地认可吗
  • 预交企业所得税税率
  • 销售废旧物资计入哪个科目
  • 营业税金及附加和税金及附加有什么区别
  • sql中出现将截断字符串或二进制
  • windows怎么彻底删除
  • windows vista home basic
  • ios自定义应用图标
  • xp系统乱了,怎么恢复
  • linux工具包
  • win10如何创建系统分区
  • win7中Windows Time时间服务错误1060怎么办?
  • 蓝牙鼠标不能动了
  • [置顶]电影名字《收件人不详》
  • jquery ajax异步提交表单数据的方法
  • android开发环境的搭建步骤
  • perl中\s+
  • 简单的小创意
  • 批处理 输出换行
  • 超详细的!!!2023澳门六开彩
  • 国家税务系统
  • 税务个人廉洁谈话记录内容
  • 网上申领的电子发票如何读入金税盘
  • 云南省国家税务局电子税务局
  • 税费算在房价里
  • 蓬莱市税务局
  • 电信业八大争议事件
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设