位置: 编程技术 - 正文

如何采集微信公众号历史消息页(公众号采集文章手机操作)

编辑:rootadmin

推荐整理分享如何采集微信公众号历史消息页(公众号采集文章手机操作),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:微信公众号数据采集,微信公众平台怎么采集文章,如何采集微信公众号的文章,如何采集微信公众号的文章,如何采集微信公众号视频,微信公众平台怎么采集文章,如何采集微信公众号视频,如何采集微信公众号的文章,内容如对您有帮助,希望把文章链接给更多的朋友!

采集微信文章和采集网站内容一样,都需要从一个列表页开始。而微信文章的列表页就是公众号里的查看历史消息页。现在网络上的其它微信采集器有的是利用搜狗搜索,采集方式虽然简单多了,但是内容不全。所以我们还是要从最标准最全面的公众号历史消息页来采集。

因为微信的限制,我们能复制到的链接是不完整的,在浏览器中无法打开看到内容。所以我们需要通过上一篇文章介绍的方法,使用anyproxy获取到一个完整的微信公众号历史消息页面的链接地址。

其中localhost可以替换成自己的IP地址或域名。从列表中找到getmasssendmsg开头的记录,点击之后右侧就会显示出这条记录的详情:

红框部分就是完整的链接地址,将微信公众平台这个域名拼接在前面之后就可以在浏览器中打开了。

如何采集微信公众号历史消息页(公众号采集文章手机操作)

然后将页面向下拉,到html内容的结尾部分,我们可以看到一个json的变量就是历史消息的文章列表:

我们将msgList的变量值拷贝出来,用json格式化工具分析一下,我们就可以看到这个json是以下这个结构:

简要的分析一下这个json(这里只介绍一些重要的信息,其它的被省略):

在这里还要提到一点就是如果希望获取到时间更久远一些的历史消息内容,就需要在手机或模拟器中将页面向下拉,当拉到最底下的时候,微信将自动读取下一页的内容。下一页的链接地址和历史消息页的链接地址同样是getmasssendmsg开头的地址。但是内容就是只有json了,没有html了。直接解析json就可以了。

这时可以通过上一篇文章介绍的方法,使用anyproxy将msgList变量值正则匹配出来之后,异步提交到服务器,再从服务器上使用php的json_decode解析json成为数组。然后遍历循环数组。我们就可以得到每一篇文章的标题和链接地址。

如果只需要采集单一公众号的内容,完全可以在每天群发之后,通过anyproxy获取到完整的带有key和pass_ticket的链接地址。然后自己制作一个程序,手动将地址提交给自己的程序。使用例如php这样的语言来正则匹配到msgList,然后解析json。这样就不用修改anyproxy的rule,也不需要制作一个采集队列和跳转页面了。

php提取身份证号码中的生日日期以及验证是否为成年人的函数 php提取身份证号码中的生日日期以及确定是否成年的一个函数。可以同时确定位和位的身份证,经本人亲测,非常好用,分享函数代码如下:php//用ph

php猜单词游戏 直接复制本地运行就可以了phpsession_start();header("Content-type:text/html;charset=utf-");$url='

Session 失效的原因汇总及解决丢失办法 昨天去GTSC面试,有面试官问我关于Session丢失之后怎么查的问题,说老实话,开发到现在很少碰到这样的情况,唯一想到的就是Session超时,还有就是做Se

标签: 公众号采集文章手机操作

本文链接地址:https://www.jiuchutong.com/biancheng/275970.html 转载请保留说明!

上一篇:PHP写微信公众号文章页采集方法(php推送微信公众号客户消息)

下一篇:php提取身份证号码中的生日日期以及验证是否为成年人的函数(身份证信息提取python)

  • 销售货物提供运输是否分别核酸的例题
  • 对本次疫情有什么看法
  • 工会经费发放奖金需要代扣个税吗
  • 建筑业差额纳税怎么算
  • 2021年超市发票税率是多少
  • 商业用房出租税率是多少
  • 培训产生的费用
  • 银行代发工资户允许有余额吗
  • 交易性金融资产公允价值变动计入
  • 税务1236600短信
  • 收到的房租增值税专用发票可以抵扣吗
  • 工业企业生产费用要素一般有哪些
  • 公司注销时长期投资怎么处理
  • 签订代销合同的人有没有退货权
  • 税前利润总额的计算公式
  • 公户转私户的钱几天能到账
  • 营业外收入是否报增值税
  • 雇主责任险可以税前扣除吗
  • 什么是简易征收办法征收增值税
  • 小规模纳税人出售不动产征收率
  • 小微企业减半征收印花税代码
  • 研发部门的办公费属于研发费的哪个类别
  • 没有购销合同怎么申报印花税
  • 房地产预收账款是什么
  • mac如何改变用户名
  • 内部交易逆流如何算利润
  • 管理费用部分科目怎么填
  • php的教程
  • 存货跌价后销售会计分录
  • PHP:mcrypt_encrypt()的用法_Mcrypt函数
  • 收到税务局退增值税及附加税怎么做账
  • PHP:imageistruecolor()的用法_GD库图像处理函数
  • 印花税哪里买
  • 犹他州现神秘物体
  • mksysb命令
  • 微信公众号实现对应查询
  • php 图片
  • 危废处理需要哪些手续
  • 使用微软必应需要哪些条件
  • php微信公众号开源框架
  • thinkphp 分页
  • 建筑行业预缴个税怎么算
  • 帝国cms导航站模板
  • 织梦怎样实现文件上传
  • 房企预缴增值税
  • 出口退税抵减应纳税额
  • 采用工作底稿法编制现金流量表是以工作底稿为
  • 没有发票的福利支出如何入帐
  • sql2000错误9003
  • 承兑能随便给别人看吗
  • 出口货物关税完税价格包括哪些
  • 农民扶贫款到哪去领
  • 收不到物业费不想干了
  • 航天金税服务费发票在哪打印
  • 生产成本工时怎么算
  • 信用代码证过期了6年怎么办理
  • 数据库表的行数
  • 电脑安装了安卓系统没用
  • broadcom网卡配置
  • 奇兔刷机可以救砖吗
  • 新版itunes怎么导入音乐
  • mac刻录工具
  • linux文件压缩和备份实验
  • Linux操作系统中怎么永久设置环境变量?
  • linux userdel
  • jquery 动态添加列表元素
  • 人物动画声音随声而动
  • jQuery插件库
  • unity移动
  • 使用灭火器人要站在上风口还是下风口
  • 用js自动判断浏览记录
  • js自定义指令
  • 委托代销清单怎么写
  • 国家税务定额发票票样
  • 现行增值税税率表2023
  • 税务部门政务公开
  • 税务局的人为什么那么拽
  • 给税务局说明怎写
  • 重庆职高学校推荐
  • 没工作个人所得税怎么交
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设