DirectDraw打造极速图形引擎(Alpha混合)

显然DirectDraw是Windows下写2D图形程序的最好选择,虽然Direct3D也可以写,但是没DirectDraw简单方便,特别对于初学者,一来就接触那么多函数和参数总不是件愉快的事,所以我的文章主要结合我做的工作,谈谈DirectDraw编程中一些比较关键的技术,大多是我自己想出来的。我想先声明,我的文章可以任意转载,源代码可以任意使用和修改。

  由于我是业余时间写的文章,所以只能每次发表一篇,希望我的工作可以为大家的游戏增光添彩,同时我的文章主要面向有基本C++,DirectDraw,汇编和MMX编程经验的朋友,如果你对这些了解不够,请先学习一下再阅读。也欢迎大家和我交流,我的QQ是35830152,EMAIL:[email protected]。

  作为第一篇,我想先谈谈Alpha混合的问题。这里32位色的图形模式我们不考虑,因为技巧并不多,占用显存和内存大,实际应用的也不多。我们把焦点放在16位色的模式上。我们把源点C2和Alpha通道点C1用Alpha混合,混合后得到点C,如果Alpha取0~1,公式如下:

C = C2*Alpha + C1*(1-Alpha)

如果Alpha取0~32,公式如下:

C = (C2*Alpha + C1*(1-Alpha))>>5

每个点由R,G,B 3个分量组成,所以上面的运算要分别对每个分量进行计算,如果整体计算,由于进位的关系我们会得到错误的结果。我们只考虑用得较多的565格式,即16位的颜色值为RRRRRGGGGGGBBBBB,555格式原理是一样的。显然我们每次处理一个点似乎只能按照“拆分-分别运算-拆分”来写代码,但是这样是低效的,想想1024*768模式下运算一帧要进行多少次运算,一定快不到哪里去。

  Intel有段很长的代码,我没仔细看,也没试验,总觉得不太可靠(呵呵)。还看了GameRes上的一些相关文章,还是有值得参考的地方,就是觉得看了还是有些茫然。

  下面说我的算法,首先说明这个快速算法是针对每个Alpha值建立一个函数进行运算,如果在一个函数里实现任意Alpha的运算,一次只能运算2个点,而且汇编代码是26行,而且有2次乘法,也用到了部分MMX加速。经过针对每一级Alpha的优化处理,每次处理4个点,代码只要8行左右,移位代替了乘法运算,完全发挥了MMX的威力。我只做了17级变换,0级和17级不用做,1到15原理一样,只有少少的不同,现在我举例半透明的算法,其他大家可以自己实现,有问题也可以和我交流。

  Alpha运算中每个点3个色素,每个色素都要按上面那个公式运算,也就是每个色素要做2次乘法和一次加发,尽管可以变换一下不做浮点运算,但性能又能提高多少?我先讲一下我算法的一个基本原理,即“任意分组移位”,意思就是把一个数中分为N组,每组位数并不要求相同,我们用一次移位和一次与运算就能做到好像是每个分组移位而互不影响的效果。比半透明下Alpha=0.5,换成移位就是>>1,我们先把C右移一位,然后AND 一个2进制的数0111101111101111(0x7BEF),就完成了3个色素同时*0.5的运算,简单吧。

  代码相信大家很容易就看懂了,大家把汇编部分和自己的程序结合就可以了,只要提供一些参数,比如页面数据指针和长度高度等资料.下次我会发布带Colorkey和Clip功能的代码,同样是MMX处理的,而且不用if(这会大大降低流水线的效率).以后还会介绍动态光源,灰度图,动画控制等高级主题,欢迎大家指导,由于水平和打字原因,可能文章中会有错误,请谅解.

下面是任意Alpha的混合运算

BOOL
CAresMaterial::DrawAlpha( LONG X, LONG Y, LPRECT pRect, BYTE Alpha )
{
    unsigned __int16 *pSrc, *pDest;
    unsigned __int32 A, PA;
    unsigned __int16 Width, Height;
    unsigned __int32 D1, D2;
    RECT Rect;

    A = Alpha & 0x1F;
    PA = 0x1F - A;
    Width = (unsigned __int16)(pRect->right - pRect->left + 1);
    Height = (unsigned __int16)(pRect->bottom - pRect->top + 1);
    D1 = (m_Desc.dwPitch - Width + 1)<<1 ;
    D2 = (m_Desc.pAres->GetScreenPitch() - Width + 1)<<1 ;
    SetRect( &Rect, X, Y, X+Width-1, Y+Height-1 );
    m_Desc.pAres->BackToDILayer( &Rect );
    pSrc = m_Desc.pData + pRect->top*m_Desc.dwPitch + pRect->left;
    pDest = m_Desc.pAres->GetDILayerData() + Y*m_Desc.pAres->GetScreenPitch() + X;

    __asm
    {
        mov esi,pSrc
        mov edi,pDest
        movd mm2,A
        movd mm3,PA

        mov cx,Height
        shl ecx,16
        mov cx,Width

    LOOPA:
        ror ecx,16
        dec cx
        jz DONE
        ror ecx,16

    LOOPB:
        dec cx
        jz NEXTLINE
        //Process one point
        mov ax,[esi]
        mov dx,ax
        shl eax,16
        mov ax,dx
        and eax,0x7E0F81F
        movd edx,mm2
        mul edx
        movd mm0,eax

        mov ax,[edi]
        mov dx,ax
        shl eax,16
        mov ax,dx
        and eax,0x7E0F81F
        movd edx,mm3
        mul edx
        movd mm1,eax

        paddd mm0,mm1
        psrlq mm0,5
        movd eax,mm0
        and eax,0x7E0F81F
        mov edx,eax
        shr edx,16
        or eax,edx
        mov [edi],ax

        inc esi
        inc edi
        inc esi
        inc edi
        jmp LOOPB

    NEXTLINE:
        add esi,D1
        add edi,D2
        mov cx,Width
        jmp LOOPA

    DONE:
        emms
    }

    m_Desc.pAres->DILayerToBack( &Rect );

    return TRUE;
}

下面是半透明Alpha的混合运算

void
CAresMaterial::DrawAlpha1( LONG X, LONG Y, LPRECT pRect )
{

    unsigned __int16 *pSrc, *pDest;
    unsigned __int16 Width, Height, DW, DLeft;
    unsigned __int32 D1, D2;
    static unsigned __int64 MASKER = 0x7BEF7BEF7BEF7BEF;
    RECT Rect;

    Width = (unsigned __int16)(pRect->right - pRect->left);
    Height = (unsigned __int16)(pRect->bottom - pRect->top + 1 );
    pSrc = m_Desc.pData + pRect->top*m_Desc.dwPitch + pRect->left;
    pDest = m_Desc.pAres->GetBackData() + Y*m_Desc.pAres->GetScreenPitch() + X;

    DLeft = (Width % 4) + 1;
    DW = (Width>>2) + 1;

    D1 = (m_Desc.dwPitch - Width)<<1 ;
    D2 = (m_Desc.pAres->GetScreenPitch() - Width)<<1 ;
    SetRect( &Rect, X, Y, X+Width, Y+Height-1 );

    __asm
    {
        mov esi,pSrc
        mov edi,pDest
        mov bx,DLeft

        mov cx,Height
        shl ecx,16
        mov cx,DW

    LOOPA:
        ror ecx,16
        dec cx
        jz DONE
        ror ecx,16

    LOOPB:
        dec cx
        jz ENDLINE
        //Process four points once
        movq mm0,[esi]
        movq mm1,[edi]
        psrlq mm0,1
        psrlq mm1,1
        pand mm0,MASKER
        pand mm1,MASKER
        paddw mm0,mm1
        movq [edi],mm0

        add esi,8
        add edi,8
        jmp LOOPB

    ENDLINE:
        dec bx
        jz NEXTLINE
        mov ax,[esi]
        mov dx,[edi]
        shr ax,1
        shr dx,1
        and ax,0x7BEF
        and dx,0x7BEF
        add ax,dx
        mov [edi],ax
        inc esi
        inc esi
        inc edi
        inc edi
        jmp ENDLINE

    NEXTLINE:
        add esi,D1
        add edi,D2
        mov cx,DW
        mov bx,DLeft
        jmp LOOPA

    DONE:
        emms
    }
}

时间: 2024-10-14 13:08:12

DirectDraw打造极速图形引擎(Alpha混合)的相关文章

【转载】D3D深度测试和Alpha混合

原文:D3D深度测试和Alpha混合 1.       深度测试 a)         深度缓冲区:屏幕上每个像素点的深度信息的一块内存缓冲区.D3D通过比较当前绘制的像素点的深度和对应深度缓冲区的点的深度值来决定是否绘制当前像素. b)        D3DPRESENT_PARAMETERS. AutoDepthStencilFormat = D3DFMT_D16 表示深度值由16位二进制表示 开启深度测试:pDevice->SetRenderState( D3DRS_ZENABLE, TR

【转载】Alpha混合物体的深度排序

原文:Alpha混合物体的深度排序 先说个题外话, 本来我想解答一下最近Creators Club论坛上经常出现的一个问题, 意外的是在网上竟然找不到什么全面的答案.. 这是个有着复杂答案的简单问题: “为什么我的透明物体的绘制顺序不对, 或者有些不见了?” 当绘制一个3D场景时, 对图形进行深度排序是非常重要的, 这样离镜头近才画在远处物体的前面. 我们不会希望看到远处的山把近在眼前的建筑给挡住了! 如今有三种深度排序方法得到了广泛的应用: 深度缓冲 (也叫做 z-buffering) 油画家

《逐梦旅程 WINDOWS游戏编程之从零开始》笔记8——载入三维模型&amp;Alpha混合技术&amp;深度测试与Z缓存

第17章 三维游戏模型的载入 主要是如何从3ds max中导出.X文件,以及如何从X文件加载三维模型到DirextX游戏程序里.因为复杂的3D物体,要用代码去实现,那太反人类了,所以我们需要一些建模软件. 对于3ds max,要到出.X文件,要装个Panda插件.然后就是作者推荐的一个3D模型资源网站:http://www.cgmodel.com/. 网格模型接口ID3DXMesh 这个接口表示网格,继承自ID3DXBaseMesh.ID3DXMesh接口中的D3DXCreateMesh()可用

Unity3D教程宝典之Shader篇:第十三讲 Alpha混合

转载自风宇冲Unity3D教程学院 Alpha Blending,中文译作Alpha混合 Blending就是控制透明的.处于光栅化的最后阶段. 这里例如我们给一个模型贴一个材质,那么在某个点计算出来颜色值称为源,而该点之前累积的颜色值,叫目标. 语法 Blend Off     不混合 Blend SrcFactor DstFactor  SrcFactor是源系数,DstFactor是目标系数 最终颜色 = (Shader计算出的点颜色值 * 源系数)+(点累积颜色 * 目标系数) 属性(往

深度排序与alpha混合 【转】

  翻译:李现民 最后修改:2012-07-03 原文:Depth sorting alpha blended objects 先说个题外话,本来我想回答在 Creators Club论坛上的一个常见问题,但(意外的是)我竟然没能从网上找到一个令人满意的答案. 问题本身很简单,但答案却有些复杂: “为什么我的透明物体的绘制顺序是错误的,或者为什么它们的一部分不见了?” 当绘制一个3D场景的时候,将图形按深度排序非常重要,只有这样靠近摄像机的物体才能被绘制在(离摄像机)更远的物体的上面.我们不会希

深度排序与alpha混合

原文: https://blogs.msdn.microsoft.com/shawnhar/2009/02/18/depth-sorting-alpha-blended-objects/ 翻译:李现民 最后修改:2012-07-03 "为什么我的透明物体的绘制顺序是错误的,或者为什么它们的一部分不见了?" 当绘制一个3D场景的时候,将图形按深度排序非常重要,只有这样靠近摄像机的物体才能被绘制在(离摄像机)更远的物体的上面.我们不会希望远方的山脉被绘制在近在眼前的建筑物的上面! 当前得到

D3D 9 通过 Alpha 测试与 Alpha 混合随意控制纹理透明度

网上不怎么见得到关于 D3D 9 的技术文章了,笔者最近在写一个 2D 的功能,希望通过某些设置来随意控制一张 2D 纹理贴图的透明度,网上找来找去,所有的文章,要不就是照抄市面教材,要么是照抄官方文档,稍微好一点的,就是在官方教材的基础上增加中文翻译,哎哟我去,找了两天啊,功能是实现了,可是心中的疑惑一直挥之不去,为啥 ?因为我的代码是照抄的啊,我只知道这样子设置可以得到这样子的效果,但是我特么不知道为啥啊,我特么要是下次再遇到同样的问题,我是不是又要再去抄一次代码 ? 好了,牢骚就发到这里吧

自己动手打造基于 WKWebView 的混合开发框架(一)WKWebView 上手

http://www.cocoachina.com/ios/20150911/13301.html 代码示例:https://github.com/johnlui/Swift-On-iOS/tree/master/BuildYourOwnHybridDevelopmentFramework/BuildYourOwnHybridDevelopmentFramework 开源项目:BlackHawk,纯 Swift 开发的基于 WKWebView 的高性能 Cordova 替代:https://gi

RGB颜色空间alpha混合的方法

http://blog.csdn.net/xhhjin/article/details/6444782http://blog.csdn.net/xhhjin/article/details/6445460http://www.cnblogs.com/graphics/archive/2012/08/23/2643086.htmlhttp://www.oschina.net/code/snippet_1425046_27446