python爬虫爬取知乎用户的用户信息

我用python爬虫找到了不想告诉我她知乎ID的妹纸的ID…….

在我做了这件事情之后 , 她觉得我越来越懂她了 , 嘻嘻

有一天 , 我发现我心仪已久的妹纸在朋友圈里分享了知乎专栏的文章 , 就知道她也刷知乎 . 如果在知乎上关注她 , 我就能知道 , 她最近关注什么 , 心里想些什么 , 了解了解她喜欢的方面 , 还能作为谈资 , 简直太赞了 (*^^)v .

但是输入她的名字…… 在知乎上根本找不到好吗 (?`灬′?)

我们两个聊天的时候 , 刚好说到了她分享的那篇文章 ,

我很自然的说: “知乎上你用的不是真名呀, 就我这么天真用了真名..”

她笑着说:”那个可以改呀” ,

“凭什么知乎团队不让我改啊!!! “,我答道,” 不如我们互粉吧^_- ”

哎 , 于是她打开zhihu , 看了看我的主页 , 并没有关注我…… 可能是赞太少了吧… 达不到她的要求 , 或者她不想让我知道她在看什么吧 , 也许她希望自己的知乎是交浅言深 , 不希望被身边人看见… (?-﹏-?) 失望.

我回去想了想 , 她说名字可以改 , 那她可能以前也用的是真名 , 找到破绽了!

知乎的名字可以改 , 但是id是改不了的 !

每个人的主页地址 , people后面那个就是TA的id,

http://www.zhihu.com/people/zhang-san-12-45

例如张三同名很多 , 后面就会加上数字. 她的名字拼音相同的较多 , 我试了一下 , 这个数字是不超过100的. 它的组合方式有 zhang-san , zhang-san-1 zhang-san-12-43 依次类推.

好 , 现在我就可以开始寻找她的账号了! 既然她改名了 , 那她名字满足的条件一定是: 昵称的拼音不是真名. 这个用pypinyin模块可以解决 , 这样子 , 需要我人工查看的主页就少很多了.

在github上下载 @egrcc 的zhihu-python
寻找她了ing

# coding: utf-8

from zhihu import User
from pypinyin import pinyin, lazy_pinyin
import pypinyin

user_url = ‘‘
user_id = ‘‘
l = [u‘bu‘, u‘xu‘, u‘kan‘]
 #这里是她名字的拼音, 还是不要暴露她的好, (*/ω＼*)
for num in range(100):  #先在 -100以内搜索
    try:
        user_url = ‘http://www.zhihu.com/people/bu-xu-kan-‘ + str(num)
        user = User(user_url)
        user_id = user.get_user_id()
        if l != lazy_pinyin(user_id.decode(‘gbk‘)): #看看她有没有用原名
            print user_id, ‘ ‘, num
    except:
        pass

for i in range(100):
    for j in range(100):  #在 -100-100以内搜索
        try:
            user_url = ‘http://www.zhihu.com/people/bu-xu-kan-‘ + str(i) + ‘-‘ + str(j)
            user = User(user_url)
            user_id = user.get_user_id()
            print user_id, ‘ ‘, i, ‘-‘, j
        except:
            pass

爬了好久 , 结果出来了 , 这些昵称不多 , 我翻翻他们的主页就幸运地找到了我心仪的妹纸:

XXXXXXXX   26
XXXXXXXX   27
XXXXXXXX   42
XXXXXXXX   72
XXXXXXXX   94
she is here!   6 - 36
XXXXXXXX   6 - 76
XXXXXXXX   7 - 86
XXXXXXXX   10 - 35
XXXXXXXX   28 - 67
XXXXXXXX   32 - 28
XXXXXXXX   32 - 66
XXXXXXXX   34 - 75

从那之后 , 我每天都可以看她的主页啦~ 至于我有没有追到她呢….

在我打开她的主页之后 , 我发现她喜欢科幻 , 也对推理小说感兴趣 , 关注穿衣打扮方面 , 符合我的胃口呀 . 最近呢 , 她关注情感方面的问题变多了 , 我不知道是不是因为最近我和她联系变频繁了 , 激起了她一些感觉 , (/ω＼)

我会加油哒~

时间： 2024-08-02 11:03:28

python爬虫爬取知乎用户的用户信息

从那之后 , 我每天都可以看她的主页啦~ 至于我有没有追到她呢….

python爬虫爬取知乎用户的用户信息的相关文章

Python爬虫爬取知乎小结

python爬虫——爬取知乎上自己关注的问题

Python爬虫爬取博客园并保存

用Python爬虫爬取广州大学教务系统的成绩（内网访问）

python爬虫爬取csdn博客专家所有博客内容

python爬虫爬取美女图片

python爬虫—爬取英文名以及正则表达式的介绍

python爬虫爬取微博评论案例详解

Python爬虫爬取数据的步骤

python爬虫 爬取知乎用户的用户信息

从那之后 , 我每天都可以看她的主页啦~ 至于我有没有追到她呢….

python爬虫 爬取知乎用户的用户信息的相关文章

python爬虫爬取知乎用户的用户信息

python爬虫爬取知乎用户的用户信息的相关文章