[No000090]微信公众号网络爬虫接口分析1

一直想做个公众号的网络爬虫,网上的好多接口都依赖于"瘦狗",不过微信接口一直在变,现在"瘦狗"也只允许查看10条历史记录,所以今天趁着下雨,研究了一下apk内部的东西,但是怕微信又改,我透漏的不能太多,有兴趣可以私下交流。

  1. 从微信上复制出来的url:https://mp.weixin.qq.com/mp/getmasssendmsg?__biz=MzI4OTA5MDgxNw==#wechat_webview_type=1&wechat_redirect

    用浏览器打开,

    What a f**k!!

  2. 分析它到底干了什么。

    <!DOCTYPE HTML>
    <html>
        <meta charset="utf-8">
        <head>
            <title>验证</title>
            <meta charset="utf-8">
            <meta id="viewport" name="viewport" content="width=device-width,initial-scale=1.0,maximum-scale=1.0,user-scalable=0" />
        </head>
        <style>
            body{
                margin:0;
                padding:10px;
                background-color:#E1E0DE;
                font:12px/18px "Lucida Grande", "Lucida Sans Unicode", Helvetica, Arial, Verdana, sans-serif;
            }
            p{
                font-size:16px;
                line-height:1.3em;
                color:#000;
                text-align:center;
                font-weight:bold;
                text-shadow:0px 1px 0px #EFEFED;
                margin:0px;
                margin-top:20px;
                margin-bottom:18px;
            }
        </style>
    
        <body>
                                    <p>请在微信客户端打开链接。</p>        <script>
                (function(){
    
                    document.addEventListener(‘WeixinJSBridgeReady‘, function onBridgeReady() {
                        var appId = ‘‘,
                            imgUrl = ‘‘
                            link = ‘http://mp.weixin.qq.com/mp/conference/default/share‘,
                            title = ‘失效的验证页面‘
                            desc = ‘你暂无权限查看此页面内容。‘,
                            content = ‘#微信分享#,你暂无权限查看此页面内容。‘;
    
                        // 发送给好友
                        WeixinJSBridge.on(‘menu:share:appmessage‘, function(argv){
                            WeixinJSBridge.invoke(‘sendAppMessage‘,{
                                                 "appid":appId,
                                                 "img_url":imgUrl,
                                                 "img_width":"640",
                                                 "img_height":"640",
                                                 "link":link,
                                                 "desc":desc,
                                                 "title":title
                                                 }, function(res) {})
                        });
                        // 分享到朋友圈
                        WeixinJSBridge.on(‘menu:share:timeline‘, function(argv){
                            WeixinJSBridge.invoke(‘shareTimeline‘,{
                                                 "img_url":imgUrl,
                                                 "img_width":"640",
                                                 "img_height":"640",
                                                 "link":link,
                                                 "desc": desc,
                                                 "title":title
                                                 }, function(res) {
                                                 });
                        });
    
                        // 分享到微博
                        var weiboContent = ‘‘;
                        WeixinJSBridge.on(‘menu:share:weibo‘, function(argv){
                            WeixinJSBridge.invoke(‘shareWeibo‘,{
                                                 "content":content,
                                                 "url":link,
                                                 }, function(res) {
                                                 });
                        });
                        // 隐藏右上角的选项菜单入口
                        WeixinJSBridge.call(‘hideOptionMenu‘);
                    }, false);
                })();
            </script>
        </body>
    </html>

    果然有验证,接下来就是分析呗,过程私聊,直接给你真实结果:

    https://mp.weixin.qq.com/mp/getmasssendmsg?__biz=MzI4OTA5MDgxNw==&uin=MTE4NjQ2OTAwOA%3D%3D&key=b28b03434249256b3bbf18f4bca361bc755cd003fc3889c807a72c84a4b3bd64d09e2a9f86560b40db8b73f0c132a022&devicetype=Windows+10&version=62000058&lang=zh_CN&pass_ticket=33LjxIBTymwM%2Bb6OYJEhSAPOzss0kGr%2FKOiCTNu80tSkPwpfeNWQfHPAS4I75UPr#wechat_webview_type=1

    不过注意,这个结果是有时间限制的,过了一定时间就失效了。

    简单分为这几个参数:

    uin=MTE4NjQ2OTAwOA==

    key=b28b03434249256b3bbf18f4bca361bc755cd003fc3889c807a72c84a4b3bd64d09e2a9f86560b40db8b73f0c132a022

    devicetype=Windows 10

    version=62000058

    lang=zh_CN

    pass_ticket=33LjxIBTymwM+b6OYJEhSAPOzss0kGr/KOiCTNu80tSkPwpfeNWQfHPAS4I75UPr

    #wechat_webview_type=1

  其中,key是与时间相关的参数回变动,devicetype是你的系统,其他不会变动。

时间: 2024-10-24 02:14:56

[No000090]微信公众号网络爬虫接口分析1的相关文章

基于搜狗搜索的微信公众号爬虫实现(C#版本)

Author: Hoyho Luo Email: [email protected] Source Url:http://here2say.me/11/ 转载请保留此出处 本文介绍基于搜狗的微信公众号定向爬虫,使用C#实现,故取名WeGouSharp.本文中的项目托管在Github上,你可以戳WeGouSharp获取源码,欢迎点星.关于微信公共号爬虫的项目网上已经不少,然而基本大多数的都是使用Python实现 鉴于鄙人是名.NET开发人员,于是又为广大微软系同胞创建了这个轮子,使用C#实现的微信

【网络爬虫】微信公众号采集

# WeixinCrawler 根据搜狗搜索 关键词采集 微信公众号和相应推文 采集策略:深度搜索采集 核心代码: package main; import java.io.File; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOException; import java.net.MalformedURLException; import java.text.Si

第三百三十节,web爬虫讲解2—urllib库爬虫—实战爬取搜狗微信公众号

第三百三十节,web爬虫讲解2-urllib库爬虫-实战爬取搜狗微信公众号 封装模块 #!/usr/bin/env python # -*- coding: utf-8 -*- import urllib from urllib import request import json import random import re import urllib.error def hq_html(hq_url): """ hq_html()封装的爬虫函数,自动启用了用户代理和ip

[Python爬虫] 之十五:Selenium +phantomjs根据微信公众号抓取微信文章

借助搜索微信搜索引擎进行抓取 抓取过程 1.首先在搜狗的微信搜索页面测试一下,这样能够让我们的思路更加清晰 在搜索引擎上使用微信公众号英文名进行“搜公众号”操作(因为公众号英文名是公众号唯一的,而中文名可能会有重复,同时公众号名字一定要完全正确,不然可能搜到很多东西,这样我们可以减少数据的筛选工作, 只要找到这个唯一英文名对应的那条数据即可),即发送请求到'http://weixin.sogou.com/weixin?type=1&query=%s&ie=utf8&_sug_=n&

微信公众号 文章的爬虫系统

差不多俩个星期了吧,一直在调试关于微信公众号的文章爬虫系统,终于一切都好了,但是在这期间碰到了很多问题,今天就来回顾一下,总结一下,希望有用到的小伙伴可以学习学习. 1.做了俩次爬虫了,第一次怕的凤凰网,那个没有限制,随便爬,所以也就对自动化执行代码模块放松了警惕,觉得挺简单的,但是其实不是这样的,我被这个问题困扰了好几天,差不多4天的一个样子,因为搜狗做的限制,同一个ip获取的次数多了,首先是出现验证码,其次是就是访问限制了,直接就是不能访问,利用 request得到的就是访问次数过于频繁,这

九 web爬虫讲解2—urllib库爬虫—实战爬取搜狗微信公众号—抓包软件安装Fiddler4讲解

封装模块 #!/usr/bin/env python # -*- coding: utf-8 -*- import urllib from urllib import request import json import random import re import urllib.error def hq_html(hq_url): """ hq_html()封装的爬虫函数,自动启用了用户代理和ip代理 接收一个参数url,要爬取页面的url,返回html源码 "

Python爬虫实现的微信公众号文章下载器

平时爱逛知乎,收藏了不少别人推荐的数据分析.机器学习相关的微信公众号(这里就不列举了,以免硬广嫌疑).但是在手机微信上一页页的翻阅历史文章浏览,很不方便,电脑端微信也不方便. 所以我就想有什么方法能否将这些公众号文章下载下来.这样的话,看起来也方便.但是网上的方法要么太复杂(对于我这个爬虫入门新手来说),要么付费. 但我的需求其实却很简单--"方便的查找 / 检索 / 浏览相关公众号的任意文章",所以,一番学习检索后,上手做了一个小工具(打包成可执行文件了),虽然方法和代码相当简单,但

从Python爬虫到SAE云和微信公众号:二、新浪SAE上搭建微信服务

目的:用PHP在SAE上搭建一个微信公众号的服务器. 1.申请一个SAE云账号 SAE申请地址:http://sae.sina.com.cn/  可以使用微博账号登陆,SAE是新浪的云服务,时间也比较长了,功能比较多. 特点:免费使用,对于学习者而言已经够用了,长时间用充点云豆也花不了多少钱(最低每天10云豆消费),几十块钱(1元=100云豆)玩一年还是可以的. AWS:如果使用aws免费的空间,很容易用超免费额度,而且用超了额度不会停止,而是从信用卡扣费,以美元计价价格对于学习者而言非常昂贵!

微信公众号开发

1. 企业号,服务号,订阅号的区别 消息次数限制:每分钟群发200次.每月主动发送消息不超过4条.每天群发一条. 验证关注者身份:通讯录成员可关注.任何微信用户扫码即可关注.任何微信用户扫码即可关注. 消息保密:消息可转发.分享,支持保密消息,防成员转发.消息可转发.分享.消息可转发.分享. 定制应用:可根据需要定制应用,多个应用聚合成一个企业号.不支持,新增服务号需要重新关注.不支持,新增服务号需要重新关注.2. 2. 个人订阅号 功能(编辑模式&&开发模式):群发功能.添加自动回复,消