6.简单提取小红书app数据保存txt-2

对页面信息进行简单抓取:

需要注意的问题 :
auth-sign 和 auth 都是有一定的时效性,还有url原url是https这里要改为http请求。
这参数的问题需要通过mitmdump去获取请求的具体参数并将之取出,不用手动去截获分析http请求和响应,写好请求和相应的处理逻辑,通过python实现二次操作。

后期通过appium模拟人为操作去滑动请求刷新界面,得到相应再做处理。
import requests

def main():
    headers = {
    "charset":"utf-8",
    "Accept-Encoding":"gzip",
    "referer":"https://servicewechat.com/wxffc08ac7df482a27/117/page-frame.html",
    "authorization":"5bda7657a4ce660001f7eed8",
    "auth":"eyJoYXNoIjoibWQ0IiwiYWxnIjoiSFMyNTYiLCJ0eXAiOiJKV1QifQ.eyJzaWQiOiI0M2RkNGY2YS01NTk1LTRjNGEtYTkyMi05ODEzNjdiMTlmMTEiLCJleHBpcmUiOjE1NDExMzAyNjJ9.9AC8VBcXiBG48vHa-LLgVEWOnloTdQvNWzYAyvqGnMA",
    "content-type":"application/json",
    "auth-sign":"c475525b214bb5d9ae431ac029cb9b50",
    "User-Agent":"Mozilla/5.0 (Linux; Android 7.1.2; MI 5X Build/N2G47H; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/64.0.3282.137 Mobile Safari/537.36 MicroMessenger/6.7.3.1360(0x26070336) NetType/WIFI Language/zh_CN Process/appbrand2",
    "Host":"www.xiaohongshu.com",
    "Connection":"Keep-Alive",
    }
    # url = "http://www.xiaohongshu.com/sapi/wx_mp_api/sns/v1/homefeed?oid=homefeed.cosmetics_v2&cursor_score=&sid=session.1540996623416187718"
    url = "http://www.xiaohongshu.com/sapi/wx_mp_api/sns/v1/homefeed?oid=homefeed.cosmetics_v2&cursor_score=1541067389.9550&sid=session.1540996623416187718"

    datas = requests.get(url= url, headers=headers ).json()
    data = datas[‘data‘]
    # print(data)
    for i in data:
        print(i)
        # print(i[‘title‘])
        # print(i[‘share_link‘])
        title = ‘标题: ‘ + i[‘mini_program_info‘][‘share_title‘]
        print(title)
        link_url = ‘链接: ‘ + i[‘share_link‘]
        print(link_url)
        b_picture = ‘封面图片: ‘+ i[‘mini_program_info‘][‘thumb‘]
        print(b_picture)
        type = ‘类型: ‘ + i[‘type‘]
        print(type)
        level = ‘级别: ‘ + str(i[‘level‘])
        print(level)
        h_picture = ‘用户头像: ‘ + i[‘user‘][‘images‘]
        print(h_picture)
        username = ‘用户名: ‘ + i[‘user‘][‘nickname‘]
        print(username)
        user_id = ‘userid: ‘ + i[‘user‘][‘userid‘]
        print(user_id)
        zan = ‘喜欢点心: ‘ + str(i[‘likes‘])
        print(zan)

        # 以追加的方式及打开一个文件,文件指针放在文件结尾,追加读写!
        with open(‘text‘, ‘a‘, encoding=‘utf-8‘)as f:
            f.write(‘\n‘.join([title,link_url,b_picture,type,level,h_picture,username,user_id,zan]))
            f.write(‘\n‘ + ‘=‘ * 100 + ‘\n‘)
if __name__ == "__main__":
    main()
保存本地

字段信息:
标题: 王者荣耀——貂蝉~仲夏夜之梦 游戏角色貂蝉皮肤印象妆容 主色链接: https://www.xiaohongshu.com/discovery/item/5bc0b2bf910cf646cc1087aa封面图片: http://ci.xiaohongshu.com/161f03cb-0cf6-355f-b178-712a928a7720?imageView2/2/w/540/format/jpg类型: normal级别: 4用户头像: https://img.xiaohongshu.com/avatar/[email protected]_80h_90q_1e_1c_1x.jpg用户名: zanleouserid: 582c5f8982ec393b5ec866ba喜欢点心: 233====================================================================================================标题: ??仲夏夜之紫妆 | HUDA beauty 沙漠黄昏教程链接: https://www.xiaohongshu.com/discovery/item/5bc9e121672e144fac0d3438封面图片: http://ci.xiaohongshu.com/29b82aa1-ad20-355c-9d42-396ddf52e5d6?imageView2/2/w/540/format/jpg类型: normal级别: 2用户头像: https://img.xiaohongshu.com/avatar/[email protected]_80h_90q_1e_1c_1x.jpg用户名: Miya杨奶奶_userid: 558b9f43a75c956c2accf4cf喜欢点心: 211====================================================================================================标题: 6款热门平价粉底上脸测评???? 到底该选哪款? 平价粉底到链接: https://www.xiaohongshu.com/discovery/item/5bd1ab2a07ef1c2e707bf66c封面图片: http://ci.xiaohongshu.com/7d86d4bc-1170-524b-8566-2a7ea4e37843?imageView2/2/w/540/format/jpg类型: video级别: 4用户头像: https://img.xiaohongshu.com/avatar/[email protected]_80h_90q_1e_1c_1x.jpg用户名: 喵格singherCuserid: 5aa65f6411be10488ded22ed喜欢点心: 945====================================================================================================标题: 万圣节妆容??超简单|3步搞定星空版的zipper face链接: https://www.xiaohongshu.com/discovery/item/5bd6882907ef1c7693a1b241封面图片: http://ci.xiaohongshu.com/7ccd594d-e525-502c-b9bb-4c430158af3c?imageView2/2/w/540/format/jpg类型: normal级别: 2用户头像: https://img.xiaohongshu.com/avatar/[email protected]_80h_90q_1e_1c_1x.jpg用户名: 达宝Lindauserid: 5a9e51c2e8ac2b2b796a7b58喜欢点心: 24====================================================================================================标题: 傻瓜式眼线画法??简单三步画出流畅眼线 最近南南收到很多宝宝链接: https://www.xiaohongshu.com/discovery/item/5bcd2635910cf646df155c0d封面图片: http://ci.xiaohongshu.com/9d8408ff-0518-5051-93cc-d0f8e8b46ba8?imageView2/2/w/540/format/jpg类型: video级别: 4用户头像: https://img.xiaohongshu.com/avatar/[email protected]_80h_90q_1e_1c_1x.jpg用户名: 一枝南南userid: 5604f1e6e4b1cf3ec7c681aa喜欢点心: 379====================================================================================================标题: ??万圣节妆容| 受伤小精灵妆 不恐怖 仙仙哒? - 万圣节链接: https://www.xiaohongshu.com/discovery/item/5bd0e707910cf646de1ea5c4封面图片: http://ci.xiaohongshu.com/cada288c-f792-5d6c-a9c0-da3ada8f7dc9?imageView2/2/w/540/format/jpg类型: normal级别: 2用户头像: https://img.xiaohongshu.com/avatar/[email protected]_80h_90q_1e_1c_1x.jpg用户名: 原口元子userid: 584279446a6a697c18b0fd20喜欢点心: 305====================================================================================================标题: 和我一起过万圣节??暗黑系御姐妆容【视频教程链接: https://www.xiaohongshu.com/discovery/item/5bd6c20b910cf63164681086封面图片: http://ci.xiaohongshu.com/c1e67a16-ba72-5095-a205-5372d5ffc4b2?imageView2/2/w/540/format/jpg类型: video级别: 2用户头像: https://img.xiaohongshu.com/avatar/[email protected]_80h_90q_1e_1c_1x.jpg用户名: 球大王userid: 55e96f24a75c950acd3358b8喜欢点心: 119====================================================================================================标题: 90%的女生都不知道的鼻影正确画法链接: https://www.xiaohongshu.com/discovery/item/5bd3ce20672e143bd2c40c98封面图片: http://ci.xiaohongshu.com/8e67c937-12d7-5f90-a905-2211fa40c620?imageView2/2/w/540/format/jpg类型: video级别: 2用户头像: https://img.xiaohongshu.com/avatar/[email protected]_80h_90q_1e_1c_1x.jpg用户名: 爱美妆的雪禾子userid: 5b3de01911be10724c823add喜欢点心: 140====================================================================================================标题: @赵奕欢Chloe 发了一篇超赞的笔记,快点来看!链接: https://www.xiaohongshu.com/discovery/item/5bc55241910cf646d416c55a封面图片: http://ci.xiaohongshu.com/172c29bd-0ba2-5753-bdce-e4f1d98bde67?imageView2/2/w/540/format/jpg类型: video级别: 4用户头像: https://img.xiaohongshu.com/avatar/[email protected]_80h_90q_1e_1c_1x.jpg用户名: 赵奕欢Chloeuserid: 5aa12b5311be107df912efb4喜欢点心: 2557====================================================================================================标题: 黄黑皮 涂了也显白的豆沙色! 最滋润的口红 阿玛尼唇釉试色链接: https://www.xiaohongshu.com/discovery/item/5bc71ffa910cf646d813008d封面图片: http://ci.xiaohongshu.com/c153caab-44b8-5121-9e49-abc2e7334ae9?imageView2/2/w/540/format/jpg类型: video级别: 2用户头像: https://img.xiaohongshu.com/avatar/[email protected]_80h_90q_1e_1c_1x.jpg用户名: 认真少女_颜九userid: 5a52d211e8ac2b78a241269e喜欢点心: 4926====================================================================================================
 

原文地址:https://www.cnblogs.com/lvjing/p/9895434.html

时间: 2024-10-16 06:17:03

6.简单提取小红书app数据保存txt-2的相关文章

超实用教程,教你用墨刀做出小红书app原型

一个新手怎么用1小时快速学会APP原型设计? 1小时很短,这意味着学习时必须把握APP原型设计中的重点.难点,而非面面俱到. 要在短时间内理解.掌握一个工具的使用,最有效的方式莫过于临摹: 看实例视频教程,并跟着教程在实例素材上操作. 基于这2个点,我们精心挑选了一个在原型效果实现中具有典型性的APP--小红书APP作为案例,结合视频+原型素材+配套教程文档的方式做了一套流程完整.让新手能快速学会APP原型设计的教程! 下面咱们来了解一下这套视频教程有什么吧! 一 基础设置 1.项目类型.尺寸设

html5仿小红书的图片标签功能

最近做了这样的一个功能,在wap网页上实现类似小红书app里的图片标签功能,很是蛋疼. 上传页示例如下图: 可以看到最上面的①是展示区域,也是编辑标签的操作区域:中间②是可滑动的缩略图,在此选择要编辑的图片:最下面③是"添加图片"和"添加标签"两个按钮. 废话不多说,下面介绍具体实现思路. 首先就是要有"选择图片"的按钮. 1 <input type="file" name="fileToUpload"

干货分享:清法网络分析小红书内容运营那点事儿

有人说小红书是"一夜爆红",其实不然.事实上,任何平台的火爆都少不了长期的SEO优化.搜索公关专家清法认为,虽然小红书的成功大部分归功于内容营销,但是小红书中的内容运营策略与SEO优化密不可分.一.用户定位用户定位是SEO优化过程中必不可少的步骤.我们建一个网站,要考虑用户有哪些需求,再对用户的需求进行分析,想出对应的方法来满足用户的需求.通过百度指数的人群画像分析,我们会发现小红书 APP 里面集中了大量购买力强.追求精致的年轻女性用户,针对这样的用户群体,小红书的内容定位是为爱美的

2月第3周业务风控关注|上海网信办复测23个被约谈APP 涉及1号店、小红书等

易盾业务风控周报每周呈报值得关注的安全技术和事件,包括但不限于内容安全.移动安全.业务安全和网络安全,帮助企业提高警惕,规避这些似小实大.影响业务健康发展的安全风险. 1.上海网信办复测23个被约谈APP 涉及1号店.小红书等 近日,上海市网信办对此前被约谈的23个APP开展"回头看"复测工作,要求各企业按照整改报告切实做好整改工作.2018年10月,上海市网信办对本地最常用的23个App获取用户个人信息等权限申请情况开展安全抽查,并就抽查中发现的申请权限不合理.过度索取用户个人信息等

Android 数据保存

Android数据保存方法 android数据保存主要保存以下三种: 1.共享参数文件中保存简单的键值对数据: 2.保存任意的文件数据到Android的文件系统中: 3.使用SQLite数据库管理 保存键值集 通过使用SharePreferences API来保存简单的键值对数据. 共享参数文件的获取或创建: 可以通过以下两种方法来获取: getSharedPreferences()  该方法需要提供一个共享参数文件的名称标识,该方法可以在任意Context中调用 getPreferences(

两年半开发经验,从360离职后,拿到钉钉、抖音、小红书、美团等8家公司的offer

前言 去年年底,我提交了从360提交了辞呈.原因很简单,公司业绩不行了! 我们公司2019年的及格线是38亿元,但是上半年仅仅完成了16.09亿元. 屋漏偏逢连夜雨,王思聪玩砸了的熊猫直播,我们360也算是个大股东,持股近20%.熊猫直播破产,360保守估计要损失5个亿. 今年年初面试了以下几个公司(不是面试顺序): 阿里(钉钉):拿到 offer 头条(抖音.火山):拿到 offer 美团(美团平台):拿到 offer 腾讯(腾讯音乐):二面挂 小红书:拿到 offer bilibili:拿到

Hibernate数据保存操作方法的原理对比

Interface Session All Superinterfaces: Serializable All Known Subinterfaces: EventSource, Session All Known Implementing Classes: SessionImpl public interface Session  extends Serializable Java应用程序与Hibernate之间的主要运行时接口.它是抽象了持久化服务概念的核心抽象API类. Session的生

类似小红书标签效果(补间动画)

昨天老大给布置个任务,为我们的app做下调研,app中有标签的存在,类似小红书和nice的添加标签模式,于是我就试着做出那个一闪一闪的标注点~   仔细看了看小红书的闪闪的标签,得出一个结论: 它是个动画   好吧,这简直是废话. 其实一开始我的思路是拿来主义,去网上找了找类似的“小红书标签效果”等等,然后我发现他们用自定义控件完成了一个这样的动画..就这样,我华丽丽的跑偏了呃呃呃..   自定义控件我不熟啊!! 学. 花了半个下午研究自定义控件,好不容易写出了动画效果. 这个效果的原理是这个样

ClientDataset+TDataSetProvider的数据保存问题

看到一篇介绍ClientDataSet和TDataSetProvider,非常精彩,特此保存. ================================================================================= 前台:D7或D2005; DBExpress连接组件:TSqlConnection,TSqlQuery ,TDataSetProvider,TClientDataSet;后台:SQL Server 2000; 更新数据的命令:DataSet