上一篇《1分钟了解区块链的本质》,介绍了什么是区块链,区块链是一个没有管理员,每个节点都拥有全部数据,高可用的分布式存储系统。
文章的留言里,不少朋友会用比特币来解释区块链,那区块链与比特币是什么关系?
答:区块链是分布式存储,比特币是基于该存储的应用,其他诸如莱特币,以太币都是基于区块链的电子货币应用。理论上,使用上层应用来解释底层存储是不合适的。
如上图,mysql是底层存储,wechat是上层应用,用wechat来解释mysql是不合适的。
今天,从技术的角度出发,聊聊什么是区块链里的“挖矿”。
先说结论,区块链挖矿的本质是啥?
答:生成一个区块,链入区块链的过程,就是挖矿。挖矿的人,就是矿工。
什么是区块(block)?
答:如《1分钟了解区块链的本质》里所述,区块是一块存储空间,可以存储数据。
如上图,区块分为区块头(header)和区块体(body)。
区块体(body)存了些什么?
答:想存什么存什么,和上层应用有关,就像mysql里存什么依赖于上层应用。例如比特币使用的区块链,区块体里存储的是比特币交易记录。
区块头(header)存了些什么?
答:区块头里存储了和这个区块,以及区块链相关的一些元数据。
如上图,区块头里的三个常见属性:
- 前一个区块的哈希值
- 区块生成的时间戳
- 随机数
什么是区块链(blockchain)?
区块是怎么链起来的?
答:
struct node{
node* prev; // 前一个节点
int time; // 时间戳
int nonce; // 随机数
void* node_body; // 存储数据
}node;
链表,节点指针可以作为这个节点的唯一标识,下一个节点通过存储上一个节点的指针,将链表链起来。
与之类似,区块的哈希可以作为区块的唯一标识,下一个区块通过存储上一个区块的哈希,将区块链起来,这就是区块链。
讲完区块与区块链的概念,接下来讲挖矿,也就是区块的生成。
在此之前,先说说区块链的三个特性:
- 历史生成的区块是无法改变的,即“区块链只能像写日志一样追加写,不能像mysql一样随机写”
- 只能在最新的区块后面生成新区块,即“必须先完成同步全网最新的区块链数据这项工作,才能启动新区块生成这项工作”
- 新区块的生成很难,必须满足一定条件的新区块才有效
假如已经同步了最新的区块链数据,要满足什么条件,才算生成一个新的区块,才算“挖矿”成功呢?
答:对最新的区块头进行两次SHA256计算,得到的256bit哈希结果,高位48bit必须是0x00000000FFFF,才算挖矿成功。
画外音:这句话很重要,是这篇文章的核心。
为什么大家都说“挖矿”很难?
由符合条件的哈希值,倒推出区块头,填入相应的“前一块区块哈希值”“时间”“随机数”不就可以了吗?
答:额,这,,,哈希(SHA256是一个哈希算法)是不可逆的。例如MD5
md5(string) = md5_result
大家都知道:
- 由字符串,算出对应的md5值很容易,但由md5值反推出字符串是不可能的
- 可以认为哈希的结果是完全随机的,要得出前48bit必须是0x00000000FFFF的哈希结果,就如同连续抛48次硬币,每次都得到我们想要的结果,其概率为(1/2)^48
可以看到,这就好比在一座山上随手捡起一块石头,正好是一块金子,我猜测,这也正是把生成新区块叫做“挖矿”的原因。
那应该怎么找到符合条件的区块头呢,从而成功挖到矿呢?
答:穷举法。
区块头里有个随机属性nonce,将这个属性从0开始,遍历到2^32,来计算区块头的哈希值,如果得到的哈希结果符合条件,则挖矿成功。
其伪代码如下:
byte[32] = PrevBlockHash; // 上一个区块的哈希
for(int i=0 to 2^32){ // 遍历所有整数
int time=now(); // 时间戳
blockHeader= new(byte[32], time, i); // 生成区块头
hashResult= SHA256D(blockHeader); // 计算哈希值
if(hashResult>>208 == 0x00000000FFFF){ //哈希符合预期
echo“bingo”; // 挖到矿啦
}
}
看上面的算法,只要程序运行时间足够久,总能挖到矿呀?
答:错,如果别人计算能力强,在你挖到矿之前,如果别人先生成了新区块,广播到了区块链网络,你本地不是最新的区块链,你挖到的矿就作废啦,此时你要放弃之前所有的工作,先向网络同步最新的数据,再重新开始挖。
有什么方法可以提升挖矿的速度呢?
答:从架构的角度出发
- “缓存”是无效的:每个区块的哈希值都不一样,每个时间戳都不一样,历史计算过的值无法通过“查表”来节省时间
- scale up是有效的:增强单CPU的计算能力,使用GPU代替CPU,使用特殊的芯片计算SHA256D等优化都是有效的,但scale up总是有极限的,单机总会遇到瓶颈
- scale out是有效的:单机不行,来并行,一台机器不行,搞集群,这就是为什么会有这么多的矿场
如上图,这是西藏高原上的一个比特币矿场,廉价的电力让无数矿工趋之若鹜。
综上,区块链里,什么是挖矿?
答:在最新区块链的数据上,生成一个符合条件的区块,链入区块链的过程,就是挖矿。
关于区块链与挖矿,大家或许还有不少疑问:
- 如何保证数据的一致性
- 这TM有病吧,挖这玩意有什么意义,不是纯浪费电吗
- 这和比特币有什么关系
- 比特币怎么保证总量有限
- …
这些疑惑,下一个一分钟,再和大家解释。
希望这很短的一分钟,大家了解了挖矿的本质。
转载于: 架构师之路 公众号
原文地址:https://www.cnblogs.com/xiexin2015/p/8998811.html