微信储存数据的分析

iphone上微信聊天记录的储存分析

由于隐私的原因,这里不能将自己的聊天记录奉献出来

设备:越狱后的iphone5 ios7.0.4

微信5.3.1

windows 7

首先打开微信(这里使用的是itools)

数据是储存在Documents中

打开后,会发现几个文件夹,它们由数字和字母组成,细心的人可能会发现它们都是有32位,其实每一个文件夹代表了一个用户的记录,

如果你的设备上有多个用户登录过的话,便会有多个这种文件夹出现

我们选择一个打开后会发现很多的文件和文件夹

这里对部分的文件夹做简单的介绍(其实有一些我也不知道里面放的是什么东西)

appicon:储存了一些应用的图标

audio     :内有多个文件夹,分别储存了和人聊天时的语音资料,格式为aud

img       :内有多个文件夹,分别储存了和人聊天时的发送的和介绍的照片,格式为pic

usr        :内有很多usr格式的文件,但其实我们用记事本打开会发现文件的头写着所以它应该就是JFIF图片,

      打开后会发现是很多人的头像,其中有很多是陌生的,估计是摇一摇,附件的人,漂流瓶等产生的

video     :内有多个文件夹,分别储存了和人聊天时的视频资料,格式为mp4

DB        :这是这篇文章的重点,内有MM.sqlite文件,以sqlite数据库储存了聊天记录的文字还有一些其他的信息

将在下面进行介绍

打开DB之后,我们会发现一个

大小挺大,后缀是sqlite

想到了什么,sqlite数据库!

让我们下载一个SQLiteSpy,这样就能以图形界面的方式来查看MM.sqlite内储存的数据了

打开后我们会发现很多的表,它们以Chat_打头,后面有接了一串数字和字母组成的东西,如果在仔细数一下会发现它们也是32位

点击打开后会发现有以下几个字段,记录了聊天记录

createtime   :每一个聊天记录的时间,为表示自GMT时间1970年1月1日零点以来的秒数

Message      :聊天记录,文字或者是图片,声音,视频的相关信息

status          :好像只有4和2两种值,表示消息的来源,4表示对方,2表示自己

Imgstatus    :表示消息的类型,1代表文字,5,6代表表情,7,21表示声音,2代表图片

Type           :也是表示消息的类型,1代表文字,47代表表情,34代表声音,3代表图片,49代表发送给朋友的内容

Des            :感觉和status一样,表示消息的来源,只是1表示对方,0表示自己

好了,让我们回过头来看一看之前的哪些32位的字母数字代表什么,他们应该代表相应的人,用于确认聊天记录属于和哪一个人

汉字编码?不对,汉字编码有长有短,不应该都是32位

是什么能将任意长度的序列转换为32位的呢?

MD5!

在MM.sqlite中还有一个叫做Friend的表,里面储存了UserName,NickName等信息

那些32位的序列便是根据UserName生成的,大家可以自己验证一下

总结

微信用sqlite数据库储储存聊天记录,数据库文件叫做MM.sqlite,

将每一个用户的用户名用MD5的方式加密,并以此32位的序列加上Chat_为前缀作为表名,储存对应的聊天记录

时间: 2024-10-22 00:27:12

微信储存数据的分析的相关文章

微信大数据揭秘国民出境购物 东部省领先

五一小长假,离家近的朋友选择回家看看,离家远的朋友可能会短途游,有些朋友干脆宅家里(看到people Moutain people sea就压力山大),你是属于哪一类呢?当然还有一类朋友会选择出境游,我们就从微信大数据来了解一下国民出境购物的情况吧. 5月3日,微信发布了<2016微信“五一”跨境大数据>,该报告以6.5亿活跃用户为样本,并首次将微信支付的境外消费数据纳入分析,还原国人境外消费图景. “五一”跨境游:140万人出境,东部省领先,广东省最多 该报告显示,4月29日至5月2日期间,

科普一下微信62数据是什么,62数据脚本是什么原理

微信62数据经常被卖号的人挂在嘴边,相信很多人都听过,但是真正见过用过的人可能还在少数,今天我们就来看看所谓的微信62数据到底是什么?常用到的62数据脚本是什么操作原理? 为什么叫62数据?62数据只是一种习惯性的叫法,之所以会叫它62数据,是因为这一串数据是以数字62开头的(见下图). 为什么会用到62数据? 在用户在登陆微信的时候,微信会把用户的设备登陆信息记录并生产一个加密文件,储存在微信的安装目录中:当用户再次登陆这个微信号的时候,微信会检测此加密文件,用来判断当前登陆的微信号是否可以直

北风网 零基础到数据(大数据)分析专家-首席分析师

详情请交流  QQ  709639943 00.北风网 零基础到数据(大数据)分析专家-首席分析师 00.快速上手JMeter 00.Jmeter 00.2017年Java web开发工程师成长之路 00.R语言速成实战 00.R语言数据分析实战 00.Python+Django+Ansible Playbook自动化运维项目实战 00.Java深入微服务原理改造房产销售平台 00.Python3入门机器学习 经典算法与应用 00.老司机学python篇:第一季(基础速过.机器学习入门) 00.

大数据案例分析

摘自https://www.cnblogs.com/ShaYeBlog/p/5872113.html 一.大数据分析在商业上的应用 1.体育赛事预测 世界杯期间,谷歌.百度.微软和高盛等公司都推出了比赛结果预测平台.百度预测结果最为亮眼,预测全程64场比赛,准确率为67%,进入淘汰赛后准确率为94%.现在互联网公司取代章鱼保罗试水赛事预测也意味着未来的体育赛事会被大数据预测所掌控. “在百度对世界杯的预测中,我们一共考虑了团队实力.主场优势.最近表现.世界杯整体表现和博彩公司的赔率等五个因素,这

一站式大数据敏捷分析平台

OpenFEA是一站式大数据敏捷分析系统,融合了内存计算.集群运算.机器学习.交互分析.可视化分析等技术,涵盖数据收集.数据探索.构建模型.模型发布等功能,分析性能卓越,使用简便,无需复杂编程即可快速实现大数据分析,助力数据分析师激扬数据,塑造业务标杆.          数据收集         OpenFEA能够融合更多类型的数据来进行运算,支持关系型数据源. Hadoop数据源.数据文件.第三方数据源. 支持数据源与接口/格式的双向自定义机制.表示各种复杂结构或LOAD和STORE各类数据

第二篇:智能电网(Smart Grid)中的数据工程与大数据案例分析

前言 上篇文章中讲到,在智能电网的控制与管理侧中,数据的分析和挖掘.可视化等工作属于核心环节.除此之外,二次侧中需要对数据进行采集,数据共享平台的搭建显然也涉及到数据的管理.那么在智能电网领域中,数据工程到底是如何实施的呢? 本文将以IBM的Itelligent Utility Network产品为例阐述智能电网中的数据工程,它是IBM声称传统电网向智能电网转变的整体方案(看过上篇文章的童鞋想必会清楚这样的说法是片面狭隘的,它只能算是智能电网中的数据工程). 另一方面,如今是一个数据爆炸的时代,

网络数据包分析 网卡Offload

http://blog.nsfocus.net/network-packets-analysis-nic-offload/ 对于网络安全来说,网络传输数据包的捕获和分析是个基础工作,绿盟科技研究员在日常工作中,经常会捕获到一些大小远大于MTU值的数据包,经过分析这些大包的特性,发现和网卡的offload特性有关,本文对网卡Offload技术做简要描述. 文章目录 网络分片技术 网卡offload机制 发送模式 接收模式 网卡offload模式的设置 Linux windows 网卡Offload

55个最实用大数据可视化分析工具

该文转自[IT168 技术] 近年来,随着云和大数据时代的来临,数据可视化产品已经不再满足于使用传统的数据可视化工具来对数据仓库中的数据抽取.归纳并简单的展现.传统的数据可视化工具仅仅将数据加以组合,通过不同的展现方式提供给用户,用于发现数据之间的关联信息.新型的数据可视化产品必须满足互联网爆发的大数据需求,必须快速的收集.筛选.分析.归纳.展现决策者所需要的信息,并根据新增的数据进行实时更新.因此,在大数据时代,数据可视化工具必须具有以下特性: (1)实时性:数据可视化工具必须适应大数据时代数

使用python操作elasticsearch实现数据插入分析

前言: 例行公事,有些人可能不太了解elasticsearch,下面搜了一段,大家瞅一眼. Elasticsearch是一款分布式搜索引擎,支持在大数据环境中进行实时数据分析.它基于Apache Lucene文本搜索引擎,内部功能通过ReST API暴露给外部.除了通过HTTP直接访问Elasticsearch,还可以通过支持Java.JavaScript.Python及更多语言的客户端库来访问.它也支持集成Apache Hadoop环境.Elasticsearch在有些处理海量数据的公司中已经