如何抓取微信公共号的推送内容

最近业务需要,大体就是从一些相关的微信公共号来抓取每日推送的内容来。

想来想去没有什么思路,好在前几天看到搜狗可以搜索微信公共号,一看果然有戏。

这样一来就能看到该微信号完整的历史信息了。哈哈,然后果断用jsoup抓之

但是高兴的好像早了点,发现网页的渲染用的是jsonp,貌似jsoup不能执行js,然后分析了一下来源。

发现数据来自这样一个链接

http://weixin.sogou.com/gzhjs?cb=sogou.weixin.gzhcb&openid=oIWsFtz7I769OeSHNhnxcWbsas8s&page=1&t=1421556435543

返回的格式如下

然后剩下的事情就简单啦,直接从里面拿到第一个文章的链接就行啦。

为了方便大家,我把我写的程序打成了一个jar包,方便大家调用。

由于本人不是写java的,可能有更好的实现方式,稍等把源码上传到OSchina上,欢迎大家指正

jar包下载地址 点此,可以获文章的标题,内容,图片的url以及时间等等。

使用方法非常简单

//openId
		WechatSpider spider = new WechatSpider("oIWsFt1cKphwPhDydMD0b_fi7n80");
		System.out.println(spider.getTitle());

欢迎大家指证。

时间: 2024-12-10 16:41:27

如何抓取微信公共号的推送内容的相关文章

使用fiddler抓取微信公众号文章的阅读数、点赞数、评论数

1 设置fiddler支持https 打开fiddler,在菜单栏中依次选择 [Tools]->[Options]->[HTTPS],勾上如下图的选项: 单击Actions,选择Export Root Certificate to Desktop(导出证书到桌面)选项: 安装证书: 在桌面上找到FiddlerRoot.cer文件,双击进行安装直到导入成功. 2 配置fiddler抓取规则 在菜单栏中依次选择 [Rules]->[Customize Rules] 弹出Fiddler Scr

Python 抓取微信公众号账号信息

搜狗微信搜索提供两种类型的关键词搜索,一种是搜索公众号文章内容,另一种是直接搜索微信公众号.通过微信公众号搜索可以获取公众号的基本信息及最近发布的10条文章,今天来抓取一下微信公众号的账号信息( 爬虫 首先通过首页进入,可以按照类别抓取,通过"查看更多"可以找出页面链接规则: import requests as req import re reTypes = r'id="pc_\d*" uigs="(pc_\d*)">([\s\S]*?)

如何在微信服务号每天推送消息?

公众号粉丝48小时内不断推送信息,如何设置,我看别人一天给我发了十几次信息 #微号帮平台48小时信息推送,实现微信服务号每天推送消息 原文地址:https://blog.51cto.com/14397880/2418160

微信公众号接收推送

因为需要一个新的公众平台,所以又去弄了一个.照着以前的那个公众号对上去的.注册公众号的时候,有些域名填写,就写一级域名,只有那些接收网址需要精确的. 因为使用三方授权,所以呢,公众号本身的信息推送,有些忘记了.其功能开启就是在下图中的位置里面.在做的时候,一直没接收到信息推送,一直以为是因为和另外一个公众号冲突(因为所用的域名是同一个),还以为信息推送错了. 改了图文素材的图片,结果微信那边回复的,仍然是以前的图片信息,这就造成了错觉.后来,还是修改了发送的文字内容,才断定,推送信息没有问题,而

php简陋版实现微信公众号主动推送消息

推荐一个网站www.itziy.com csdn免积分下载器.pudn免积分下载器.51cto免积分下载器www.verypan.com 百度网盘搜索引擎www.94cto.com 编程相关视频教程.电子书.源码.开发工具.文档手册模拟登录微信公共平台,实现主动信息发送: 突破订阅号一天只能发送一条信息的限制. 使用编码UTF-8代码地址:https://github.com/itziy/wechat使用方法: $arr = array( 'account' => '公众平台帐号', 'pass

微信公众号之推送消息

首先进入网站: 微信公众号 2.输入账号密码(微信或QQ皆可) 没有注册的先注册,OK 注意一个问题,选好任意一种类型以后,不能修改,千万注意 3.群发功能以及推送完就行了.

如何利用Python网络爬虫抓取微信朋友圈的动态(上)

今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌,小编在网上找到了第三方工具,它可以将朋友圈进行导出,之后便可以像我们正常爬虫网页一样进行抓取信息了. [出书啦]就提供了这样一种服务,支持朋友圈导出,并排版生成微信书.本文的主要参考资料来源于这篇博文:https://www.cnblogs.com/sheng-jie/p/7776495.html

微信公共号的PHP开发(基础篇)——玩一下

最近没事儿开了个微信号,写点东西给家人啊什么的看,你们想看的话就这个嘛: 然后就意外的看到imooc上的微信公众号开发相关了.每天科研的累累的,做点这个不是很累的东西吧. 微信公共号开发 一.基础 1.1 数据交互流程 用户<————>微信服务器<————>第三方服务器: 且,由左向右都是request,由右向左都是response: 1.2 API --配置 接入API 输入这两个——所以,要事先准备好服务器,我用的是腾讯的,反正都是一家的,更方便一点吧. $timestamp=

php 抓取微信列表中的最新的一组微信消息

<?php $_G['wx_g'] = array('init' => array( "wx_content" => array("weixin_user" => "微信号码", "weixin_pass" => "微信密码") ) ); wx_login(); $messge_list = get_message_list(); $file_id=$messge_list['