根据微信号来抓取微信文章

<script type="text/javascript">
//计算字符串长度
String.prototype.strLen = function() {
    var len = 0;
    for (var i = 0; i < this.length; i++) {
        if (this.charCodeAt(i) > 255 || this.charCodeAt(i) < 0) len += 2; else len ++;
    }
    return len;
}
//将字符串拆成字符,并存到数组中
String.prototype.strToChars = function(){
    var chars = new Array();
    for (var i = 0; i < this.length; i++){
        chars[i] = [this.substr(i, 1), this.isCHS(i)];
    }
    String.prototype.charsArray = chars;
    return chars;
}
//判断某个字符是否是汉字
String.prototype.isCHS = function(i){
    if (this.charCodeAt(i) > 255 || this.charCodeAt(i) < 0)
        return true;
    else
        return false;
}
//截取字符串(从start字节到end字节)
String.prototype.subCHString = function(start, end){
    var len = 0;
    var str = "";
    this.strToChars();
    for (var i = 0; i < this.length; i++) {
        if(this.charsArray[i][1])
            len += 2;
        else
            len++;
        if (end < len)
            return str;
        else if (start < len)
            str += this.charsArray[i][0];
    }
    return str;
}
//截取字符串(从start字节截取length个字节)
String.prototype.subCHStr = function(start, length){
    return this.subCHString(start, start + length);
}

    function parseXML(text,field){
        try{
            xmlDoc=new ActiveXObject("Microsoft.XMLDOM");
            xmlDoc.async="false";
            xmlDoc.loadXML(text);
        }catch(e){
          try{
              parser=new DOMParser();
              xmlDoc=parser.parseFromString(text,"text/xml");
          }catch(e){
              alert(e.message);
              return;
          }
        }
        return xmlDoc.getElementsByTagName(field)[0].childNodes[0].nodeValue;
    }
        var sogou = {
            weixin:{
                gzhcb:function(object){
                    var o = object.items;
                    var htmlString = ‘‘;
                    for(var i=0;i<o.length;i++){
                        if(i>3){
                            break;
                        }
                        var str = o[i].toString();
                        var title = parseXML(str,‘title‘).toString();
                        if(title.strLen()>10){
                            title = title.subCHStr(0,30)+‘.....‘;
                        }
                        var object = {
                            title: title,
                            url: parseXML(str,‘url‘),
                            date: parseXML(str,‘date‘)
                        };
                        htmlString += ‘<li><a target="_blank" href="‘+object.url+‘"><span class="bg_dian"></span>‘+object.title+‘<span class="right_news_time">[‘+object.date+‘]</span></a></li>‘;
                    }

                    $(‘#right_new_list_ul‘).append(htmlString);
                }
            }
        }
        $(function(){
            // 这个url是到微信搜狗里面针对自己的微信号找的地址
            var url = ‘http://weixin.sogou.com/gzhjs?cb=sogou.weixin.gzhcb&openid=oIWsFt7SddzriXihcBz_1yXHyfms&eqs=a5sooxSgnMwqoznexrP3Zux5mz5NrKcGnwDYMXmLTxYvm9XfC0cp8zbmU3atg%2FnPIHNq1&ekv=7&page=1&t=1436950692098&callback=?‘;
            //var url = ‘http://weixin.sogou.com/gzhjs?cb=sogou.weixin.gzhcb&openid=oIWsFt2IaC1wvHZc3EnDf4iToUcI&eqs=VfsoolZg%2B5ALoIsKSWSRru8JhJEgw1uSWON13NHPGfuO3qpheRdZMoIHzE2KxcUUP9Fym&ekv=7&page=1&t=1436882190413&callback=?‘;
            $.getJSON(url,function(data){
                data
            });
        });

    </script>
时间: 2024-10-12 22:58:05

根据微信号来抓取微信文章的相关文章

[Python爬虫] 之十五:Selenium +phantomjs根据微信公众号抓取微信文章

借助搜索微信搜索引擎进行抓取 抓取过程 1.首先在搜狗的微信搜索页面测试一下,这样能够让我们的思路更加清晰 在搜索引擎上使用微信公众号英文名进行“搜公众号”操作(因为公众号英文名是公众号唯一的,而中文名可能会有重复,同时公众号名字一定要完全正确,不然可能搜到很多东西,这样我们可以减少数据的筛选工作, 只要找到这个唯一英文名对应的那条数据即可),即发送请求到'http://weixin.sogou.com/weixin?type=1&query=%s&ie=utf8&_sug_=n&

使用fiddler抓取微信公众号文章的阅读数、点赞数、评论数

1 设置fiddler支持https 打开fiddler,在菜单栏中依次选择 [Tools]->[Options]->[HTTPS],勾上如下图的选项: 单击Actions,选择Export Root Certificate to Desktop(导出证书到桌面)选项: 安装证书: 在桌面上找到FiddlerRoot.cer文件,双击进行安装直到导入成功. 2 配置fiddler抓取规则 在菜单栏中依次选择 [Rules]->[Customize Rules] 弹出Fiddler Scr

如何抓取微信公共号的推送内容

最近业务需要,大体就是从一些相关的微信公共号来抓取每日推送的内容来. 想来想去没有什么思路,好在前几天看到搜狗可以搜索微信公共号,一看果然有戏. 这样一来就能看到该微信号完整的历史信息了.哈哈,然后果断用jsoup抓之 但是高兴的好像早了点,发现网页的渲染用的是jsonp,貌似jsoup不能执行js,然后分析了一下来源. 发现数据来自这样一个链接 http://weixin.sogou.com/gzhjs?cb=sogou.weixin.gzhcb&openid=oIWsFtz7I769OeSH

Python 抓取微信公众号账号信息

搜狗微信搜索提供两种类型的关键词搜索,一种是搜索公众号文章内容,另一种是直接搜索微信公众号.通过微信公众号搜索可以获取公众号的基本信息及最近发布的10条文章,今天来抓取一下微信公众号的账号信息( 爬虫 首先通过首页进入,可以按照类别抓取,通过"查看更多"可以找出页面链接规则: import requests as req import re reTypes = r'id="pc_\d*" uigs="(pc_\d*)">([\s\S]*?)

如何利用Python网络爬虫抓取微信朋友圈的动态(上)

今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌,小编在网上找到了第三方工具,它可以将朋友圈进行导出,之后便可以像我们正常爬虫网页一样进行抓取信息了. [出书啦]就提供了这样一种服务,支持朋友圈导出,并排版生成微信书.本文的主要参考资料来源于这篇博文:https://www.cnblogs.com/sheng-jie/p/7776495.html

如何利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例

前几天给大家分享了利用Python网络爬虫抓取微信朋友圈的动态(上)和利用Python网络爬虫爬取微信朋友圈动态--附代码(下),并且对抓取到的数据进行了Python词云和wordart可视化,感兴趣的伙伴可以戳这篇文章:利用Python词云和wordart可视化工具对朋友圈数据进行可视化. 今天我们继续focus on微信,不过这次给大家带来的是利用Python网络爬虫抓取微信好友总数量和微信好友男女性别的分布情况.代码实现蛮简单的,具体的教程如下. 相信大家都知道,直接通过网页抓取微信的数据

利用Python网络爬虫抓取微信好友的所在省位和城市分布及其可视化

前几天给大家分享了如何利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例,感兴趣的小伙伴可以点击链接进行查看.今天小编给大家介绍如何利用Python网络爬虫抓取微信好友的省位和城市,并且将其进行可视化,具体的教程如下. 爬取微信好友信息,不得不提及这个itchat库,简直太神奇了,通过它访问微信好友基本信息可谓如鱼得水.下面的代码是获取微信好友的省位信息: 程序运行之后,需要扫描进行授权登录,之后在Pycharm的控制台上会出现如下图的红色提示,这些红色的字体并不是我们通常遇到的Py

利用Python网络爬虫抓取微信好友的签名及其可视化展示

前几天给大家分享了如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化,利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例,以及利用Python网络爬虫抓取微信好友的所在省位和城市分布及其可视化,感兴趣的小伙伴可以点击进去看看详情,内容方面不是很难,即使你是小白,也可以通过代码进行实现抓取.今天,小编继续给大家分享如何利用Python网络爬虫抓取微信好友的签名及其可视化展示,具体的教程如下所示. 1.代码实现还是基于itchat库,关于这个神奇的库,在之前的文章中

php 抓取微信列表中的最新的一组微信消息

<?php $_G['wx_g'] = array('init' => array( "wx_content" => array("weixin_user" => "微信号码", "weixin_pass" => "微信密码") ) ); wx_login(); $messge_list = get_message_list(); $file_id=$messge_list['