【转】Alchemy的使用和多项式批量计算的优化

原文:http://www.cnblogs.com/flash3d/archive/2012/01/30/2332158.html

==================================================

源码:http://files.cnblogs.com/flash3d/alc.rar

前几天研究了Bresenham直线扫描算法。颇受其一些优化策略的启发,故想将其推广至二次三次已经n次曲线的批量计算。

进过一番假设推导证明,具体思路和过程就不和大家讲了,估计我也讲不清楚,大家也听不明白。我给大家举个例子就明白了。

假设我们要求y=x^3这个曲线,x为(1,2,3,4,5...)时候y的值,这个也是我们研究的目的。

那么,我们先手动算几个值看看。

X     Y

1     1

2     8

3     27

4     64

5     125

6     216

7     343

恩,粗看确实毫无规律,然后,我们试着给他们的y求相邻的差,得出的差再求相邻的差。。。

X     Y

1     1

7

2     8           12

19           6

3     27         18

37           6

4     64         24

61           6

5     125       30

91           6

6     216       36

127

7     343

最后发现。。不断求差结果竟都是6!

这个6就是y=x^3这个方程不断对x求导的最后得到的常数。比如这里y=x^3,那么3*2*1就是6。如果x前面还有个数,比如y=2*x^3,那么最后的常数就是2*3*2*1。以此类推。

这个规律的发现,可以让计算结果很大程度上被重用。

利用这个规律,如何计算呢?因为这个算法的计算依赖上一次的计算,所以,我们只能先算1的结果再算2的结果。。依次计算。那么我们来演绎下如果计算y=x^3。

x为1时,我们没有任何数据可以利用,那么老老实实计算吧。。结果为1,这个结果先存着。

x为2时,我们虽然有x为1时结果为1这个数字可以依赖,貌似没有起到任何作用。。那也老老实实计算,结果是8。这个结果存着。而且,我们也可以把前两次结果的差算出来,8和1的差是7。这个7也存着。

x为3的时候,我们也试图使用前两次的数据,结果失败。那么我们也老老实实计算,结果是27。这个结果存着,并且,我们也把他和前面的那个结果求差,27-8结果是19。这个19要存着。而且,我们还能把19和7求差,结果是12。存着。

x为4的时候,我们试图使用前面的数据。这次我们得逞了!参照上面那张表,那个6我们是能计算出来的,12我们也有,那么通过这两个数据,相加,可以得到18。然后的得出来的18和我们已经保存着的19相加,就能得到37。这37是何物?这37就是x为3和x为4两个结果的差。我们可以直接把x为3的结果27加上37,得到x为4的结果64.

x为5的结果也类似,可以用以上的方法不断累加得到。。

观察发现,前面3个数需要老老实实算,除去前三个,就能通过累加获得结果。数学证明,最高n次方程,前面n个需要老老实实算。

这里我们再整理下内存的开销。观察整个流程,可以发现,用过一次的数第二次都用不到了,其存贮位置可以被新产生的数据利用。

这里,除去那个6,总共就用到三个存储器。3就是整个函数的最高次。通过证明得到,最高n次的方程,用到存储器n个。

以下是as3上的算法。

var res:Array=new Array();//存放表一行的数组

function cul(n:int):void

{

var thex:int;//x的值

var a:int;//中间变量

var b:int;//同上

var k:int=1;//不断求导最后的常数

//前面n个数需要手动老老实实算

for(thex=1;thex<=n;thex++)

{

res[thex-1]=Math.pow(thex,n)+Math.pow(thex,n-1);

trace(thex,",",res[thex-1]);

//新存入的数产生的一系列新的值代替了老的一些用不到的值的位置

for(a=thex-1;a>=1;a--)

{

res[a-1]=res[a]-res[a-1];

}

}

//求出不断求导后常数的值

for(a=n;a>=2;a--)

{

k*=a;

}

//计算100000次

for(b=0;b<100000;b++)

{

//每次计算,将k累加到最末位上,最末位是那张表除去k之外最外层的数,加上k之后,其值下移了一位

res[0]+=k;

//不断将值往里面累加,里面的值在表中都下移了一位,最后使表中最左边的值下移一位,也就是我们要求的结果

for(a=1;a<n;a++)

{

res[a]+=res[a-1];

}

trace(n+b+1,",",res[n-1]);

}

}

不过悲剧的是,经过测试发现,该算法比用pow函数老老实实算还要慢上一大截。

这结果让我很不爽!

于是我将该算法写成了alchemy进行调用,才勉强能赶上as3默认的pow函数。不知道pow函数是用什么样的算法,很想知道呀!

http://bbs.blueidea.com/thread-2934831-1-1.html
这个是alchemy使用的方法。

时间: 2024-10-08 19:35:19

【转】Alchemy的使用和多项式批量计算的优化的相关文章

批量计算和流计算简单比对

刚刚说的:收集数据 - 放到DB中 - 取出来分析 的传统的流程,叫做批量计算,顾名思义,将数据存起来,批量进行计算. 而流式计算,也跟名字一样,是对数据流进行实时计算,它不是更快的批计算,可以说,是完全不同的处理思路. 通过与批量计算进行对比的方式,介绍下其原理: (1) 与批量计算那样慢慢积累数据不同,流式计算将大量数据平摊到每个时间点上,连续地进行小批量的进行传输,数据持续流动,计算完之后就丢弃. (2) 批量计算是维护一张表,对表进行实施各种计算逻辑.流式计算相反,是必须先定义好计算逻辑

MYSQL开发性能研究&mdash;&mdash;批量插入的优化措施

一.我们遇到了什么问题 在标准SQL里面,我们通常会写下如下的SQL insert语句. INSERT INTO TBL_TEST (id) VALUES(1);   很显然,在MYSQL中,这样的方式也是可行的.但是当我们需要批量插入数据的时候,这样的语句却会出现性能问题.例如说,如果有需要插入100000条数据,那么就需要有100000条insert语句,每一句都需要提交到关系引擎那里去解析,优化,然后才能够到达存储引擎做真的插入工作. 正是由于性能的瓶颈问题,MYSQL官方文档也就提到了使

[Pytorch]深度模型的显存计算以及优化

原文链接:https://oldpan.me/archives/how-to-calculate-gpu-memory 前言 亲,显存炸了,你的显卡快冒烟了! torch.FatalError: cuda runtime error (2) : out of memory at /opt/conda/conda-bld/pytorch_1524590031827/work/aten/src/THC/generic/THCStorage.cu:58 想必这是所有炼丹师们最不想看到的错误,没有之一.

BZOJ3684 大朋友和多叉树(多项式相关计算)

设$f(x)$为树的生成函数,即$x^i$的系数为根节点权值为$i$的树的个数.不难得出$f(x)=\sum_{k\in D}f(x)^k+x$我们要求这个多项式的第$n$项,由拉格朗日反演可得$[x^n]f(x)=\frac1n[x^{n-1}](\frac x{g(x)})^n$其中$[x^n]f(x)$表示$f(x)$的$n$次项系数.$f(x)$是$g(x)$的复合逆,即$g(f(x))=x$在本题中,$g(x)=x-\sum_{k\in D}x^k$我们需要多项式求逆和多项式快速幂.多

ArcPy批量计算Mean Center的两个实例

很久没用arcpy了,碰了好几次壁,把这次做的贴上来,以备下次可以跳过这些简单的问题 1 import arcpy 2 arcpy.env.workspace = 'C:\Users\Qian\Documents\ArcGIS\Default.gdb' 3 a=['sichuan1990','sichuan2000','sichuan2010'] 4 b=['藏族','彝族','羌族','回族'] 5 for x in a: 6 for y in b: 7 arcpy.MeanCenter_st

在Excel中,已知身份证号码,如何批量计算其实际年龄?

昨天,上司问我:..,你会在Excel中计算年龄吗?当时,一下促住了.说真的,还真不会.今天研究了一下,写下来,方便日后查看. 首先,得有一张已知姓名和相应身份证号的原表吧. 在这张表上再加上三列:出生年份.现在年份.年龄 现在年份当然是2017啦,这个很好解决.那么出生年份呢?可以很清楚的知道,在身份证上,从第7位开始之后4位是出生年份,所以来第一个函数:=MID(B2,7,4) 可以得到: 下拉一下,所有的出身年份就都出来了 现在计算年龄,来一个很简单的公式:=D2-C2 enter后下拉一

088.批量计算数学题

#include<stdio.h>#include<stdlib.h>#include<string.h>int f_calc(int p_v1, char p_sign, int p_v2) { switch (p_sign) { case '+':  return p_v1 + p_v2; case '-':  return p_v1 - p_v2; case '*':  return p_v1 * p_v2; case '/': //这个地方有一个致命的地方  i

地理空间距离计算及优化(根据两个点经纬度计算距离)

1.地理空间距离计算面临的挑战 打开美团app,不管是筛选团购还是筛选商家,默认的排序项都是"离我最近"或者"智能排序"(如下图所示). 不管是"离我最近"还是"智能排序",都涉及到计算用户位置与各个团购单子或者商家的距离(注:在智能排序中距离作为一个重要的参数参与排序打分).以筛选商家为例,北京地区有5~6w个POI(本文将商家称之为POI),当用户进入商家页,请求北京全城+所有品类+离我最近/智能排序时,我们筛选服务需要计

地理空间距离计算及优化(依据两个点经纬度计算距离)

1.地理空间距离计算面临的挑战 打开美团app.无论是筛选团购还是筛选商家,默认的排序项都是"离我近期"或者"智能排序"(例如以下图所看到的). 无论是"离我近期"还是"智能排序".都涉及到计算用户位置与各个团购单子或者商家的距离(注:在智能排序中距离作为一个重要的參数參与排序打分).以筛选商家为例.北京地区有5~6w个POI(本文将商家称之为POI),当用户进入商家页,请求北京全城+全部品类+离我近期/智能排序时.我们筛选服