转: 关于黑魔法常数

转自: http://www.guokr.com/post/91389/

看了之前求0x5f3759df的数学原理之后花了两天时间把@Sheldon 给的那篇论文看完了,感谢@Uroboros 的讲解,作为一个没什么计算机背景的人,能看完(好吧其实没全看)这篇文章我还是非常有成就感的,所以写下这个帖子,基本上全是翻译了,了解计算机的人可以抱着挑错的心态看。

基础知识1:i>>1
操作i>>1表示将二进制数i向右移动一位,也就是将最后一位删掉并在最前一位添加0
注意到我们将一个n位的十进制数M删掉最后一位之后就变成了n-1位,可以看做将这个十进制数除以10之后向下取整floor(M/10)
同样的,讲一个二进制数删掉最后一位之后相当于将这个数除以2并向下取整floor(M/2)

这样看上去i>>1就像是floor(i/2),因为函数f(x)=1/sqrt(x)的一阶导数是-1/2*(x)^-3/2,正好有个-1/2在前面,不禁让人感觉 0x5f3759df - ( i >> 1 )是函数1/sqrt(x)在某一个点的一阶泰勒展开。在Fast Inverse Square Root 里面有这样一段:

Eberly’s explanation was that this produced linear approximation, but is incorrect; we’ll see the guess is piecewise linear, and the function being approximated is not the same in all cases.

“Eberly的解释是说这相当于做了线性近似,但是这个解释是不对的。我们会看到这个估计值是分段线性的,并且这个近似函数在各种情况下也并不相同。”

为什么这么说呢?这里需要用到基础知识2:浮点数存储方式
各种类型浮点数的存储方式可以通过查看IEEE745(完全不知道是什么东西)了解
这里用到的是32位单精度浮点数,并且总是正数,表示方式为:
0|E|M
其中0代表正数
E是指数,E=0相当于2^-127
M表示一个绝对值小于1的数,但是注意到这里省略了一位。也就是说,当转化位十进制的时候应该表示为(1+M)
那么换算之后的数就应该是:(1+M)2^(E-127)
这样我们发现其实i>>1并不完全是floor(i/2)而是将一个数变成(floor(M/2)+1)*2^floor((E-127)/2)
而且根据E的奇偶性尾数可能还需要加上1/2

不妨令e=E-127,注意到1/sqrt(x)是让原数的指数变为-e/2,这么说来卡马克可能仅仅是希望产生一个e/2而用上了位移,接下来就是要找到一个相减之后产生-e/2并且让尾数尽量和(1+M)^-1/2相近

由于这个数必然为正数假设这个数值为:
0|R1|R2
接下来便是要分情况讨论:
假设E为偶数,这时候指数的右移并不会影响到尾数的数值:
这时候e是奇数,令e=2d+1
那么相减之后指数部分变为:

注意这里的相减其实是将浮点数转化为整型(也就是正则化)之后再相减,而不是普通的浮点数加减。
由于初始值一定要是正数,所以我们需要上式一定为正,因为0=<E<=256,所以R1>=128
因为我们讨论的E为偶数,也就是末位数一定是0,所以不用考虑他右移后对M的影响,所以两数相减之后的结果是:

注意这里用M/2而不是floor(M/2)因为这一点点的误差相较于其他误差来说太小了
当然,还存在一种情况,那就是R2<M/2,其实二进制的加减和十进制差不多,如果尾数小了,那么就要像更高位数“借位”,也就是说这种情况下相减之后的结果是:

我们定义:

那么我们可以将这两种情况合并为一个函数:

这个函数就是我们对函数1/sqrt(x)的近似了,那么我们的目标就是让这个函数的相对误差|(y-y0)/y|尽量小:

这样我们得到一个误差方程:

之后:

注意这里的1/8其实是凑出来的,具体凑法可以先假设一个小于一的正数a,由于0<R2<1,0<M<1,我们可以通过展开得到R1关于a的一个区间。让a尽量小,使得这个区间范围小于一。根据R1一定是整数的特性,我们可以确定使得误差最小的R1。这里得出R1=190,带入十六进制里面并右移(注意开头有一个表示符号的0)就是0x5f,正好是黑魔法常数的头几位。

那当E为奇数怎么办呢?其实是一样的办法,如果E为奇数,那么M/2就需要加上1/2(尾数的第一位相当于1/2),根据同样的方法,我们可以得到另外一个相对误差函数:

其中:

有兴趣可以算一算这种情况下R1应该为多少,作者十分偷懒地说由于需要让常数同时应用于两种情况,所以就让R1=190了。

之后就是确定R2的值了,各种分段讨论,过于纠结我们就不看了(反正最后也没算对,摊手),确定下来大约在0.45左右,再通过软件算得最优解。值得注意的是Chris Lomont 用的是Mathematica 4,作为用Mathematica 8的LZ感到十分自豪,说不定用更先进的软件能得到更好的数值?

好了,终于写完,如果大家发现有其他人也写过类似的...请不要告诉我

时间: 2024-10-09 11:00:39

转: 关于黑魔法常数的相关文章

&lt;转&gt;verilog hdl中常数声明

1.语法声明:parameter xx = yy;`define XX YY 使用:xx`XX 2.作用域parameter 作用于声明的那个文件:`define 从编译器读到这条指令开始到编译结束都有效,或者遇到`undef命令使之失效. 如果想让parameter或`define作用于整个项目,可以将如下声明写于单独文件,并用`include让每个文件都包含声明文件:`ifndef xx `define xx yy // or parameter xx = yy;`endif `define

[黑科技]常数优化的一些技巧

感谢wys和小火车普及这些技巧qwq 这篇文章大概没什么营养 我们来看一道十分简单的题目: 设n=131072,输入两个长度为n的数列和,要求输出一个长度为n的数列. 其中,. 首先我们来讲讲这题怎么做. 如果数据是随机的,那么有一种神奇的做法:在a和b中分别挑出最大的p个元素,对于每个i暴力枚举每个p进行更新,这样的复杂度是O(np)的,正确性我不会分析= = 那么数据不是随机的...那么估计没有什么快速的算法,不如暴力! 以下的运行时间均为在我的渣渣笔记本中测试得到,仅供参考.测试环境Ubu

宏定义的黑魔法 - 宏菜鸟起飞手册

转载:https://onevcat.com/2014/01/black-magic-in-macro/ 宏定义在C系开发中可以说占有举足轻重的作用.底层框架自不必说,为了编译优化和方便,以及跨平台能力,宏被大量使用,可以说底层开发离开define将寸步难行.而在更高层级进行开发时,我们会将更多的重心放在业务逻辑上,似乎对宏的使用和依赖并不多.但是使用宏定义的好处是不言自明的,在节省工作量的同时,代码可读性大大增加.如果想成为一个能写出漂亮优雅代码的开发者,宏定义绝对是必不可少的技能(虽然宏本身

Swift与Objective-C的兼容“黑魔法”:@objc和Dynamic

虽然说 Swift 语言的初衷是希望能摆脱 Objective-C 的沉重的历史包袱和约束,但是不可否认的是经过了二十多年的洗礼,Cocoa 框架早就烙上了不可磨灭的 Objective-C 的印记.无数的第三方库是用 Objective-C 写成的,这些积累无论是谁都不能小觑.因此,在最初的版本中,Swift 不得不考虑与 Objective-C 的兼容. Apple 采取的做法是允许我们在同一个项目中同时使用 Swift 和 Objective-C 来进行开发.其实一个项目中的 Object

NS3中一些难以理解的常数

摘要:在NS3的学习中,PHY MAC中总有一些常数,需要理解才能修改.如帧间间隔等.那么,本文做个简单分析,帮助大家理解.针对802.11标准中MAC协议.   void WifiMac::Configure80211b (void) { SetSifs (MicroSeconds (10)); SetSlot (MicroSeconds (20)); SetEifsNoDifs (MicroSeconds (10 + 304)); SetPifs (MicroSeconds (10 + 20

有预处理命令#define声明一个常数,用以表明1年中有多少秒

#define SECOND_PER_YEAR(60*60*24*356)UL (1)#define 不能以分号结束,括号这使用 (2)这个表达式将使一个十六位机的整型数移出,因此要用到长整型符号L,高速编译器这个常数是长整型的 (3)UL(表示无符号长整型)

[再寄小读者之数学篇](2014-06-20 渐近等式中的待定常数)

计算以下渐近等式 $$\bex \int_0^1 \cfrac{x^{n-1}}{1+x}\rd x=\cfrac{a}{n}+\cfrac{b}{n^2}+o\sex{\cfrac{1}{n^2}}\quad(n\to\infty) \eex$$ 中的待定常数 $a,b$. 解答: $$\beex \bea a&=\vlm{n}n\int_0^1 \cfrac{x^{n-1}}{1+x}\rd x\\ &=\vlm{n}\int_0^1 nx^{n-1}\sex{\cfrac{1}{1+

电机死区常数τ=RC计算

#include "dialog.h" #include "ui_dialog.h" #include <qmath.h> Dialog::Dialog(QWidget *parent) : QDialog(parent), ui(new Ui::Dialog) { ui->setupUi(this); ui->lablePic->setScaledContents(true); QPixmap pix(":/pic/pic.

符号常数

符号常数 符号常数的定义 定义符号常数有三种方法:宏定义.const修饰和枚举. (1)宏定义.宏定义用指定的标识符来代表一串字符,一般形式如下: #define 标识符 字符串 使用宏定义时注意: <1>.宏定义必须以#define开头,行末不加分号,因为它不是C语句: <2>.每个#define只能定义一个宏,且只占用一个书写行: <3>.#define命令一般出现在函数外部,有效范围为从定义开始处到本源程序文件结束: <4>.使用宏定义时可以使用已经定