数据驱动编程法

转载至:http://blog.csdn.net/chgaowei/article/details/6658260

什么是数据驱动编程

前言:

最近在学习《Unix编程艺术》。以前粗略的翻过,以为是介绍unix工具的。现在认真的看了下,原来是介绍设计原则的。它的核心就是第一章介绍的unix的哲学以及17个设计原则,而后面的内容就是围绕它来展开的。以前说过,要学习适合自己的资料,而判断是否适合的一个方法就是看你是否能够读得下去。我对这本书有一种相见恨晚的感觉。推荐有4~6年工作经验的朋友可以读一下。

正题:

作者在介绍Unix设计原则时,其中有一条为“表示原则:把知识叠入数据以求逻辑质朴而健壮”。结合之前自己的一些经验,我对这个原则很有共鸣,所以先学习了数据驱动编程相关的内容,这里和大家分享出来和大家一起讨论。

数据驱动编程的核心

数据驱动编程的核心出发点是相对于程序逻辑,人类更擅长于处理数据。数据比程序逻辑更容易驾驭,所以我们应该尽可能的将设计的复杂度从程序代码转移至数据。

真的是这样吗?让我们来看一个示例。

假设有一个程序,需要处理其他程序发送的消息,消息类型是字符串,每个消息都需要一个函数进行处理。第一印象,我们可能会这样处理:

[cpp] view plaincopy

  1. void msg_proc(const char *msg_type, const char *msg_buf)
  2. {
  3. if (0 == strcmp(msg_type, "inivite"))
  4. {
  5. inivite_fun(msg_buf);
  6. }
  7. else if (0 == strcmp(msg_type, "tring_100"))
  8. {
  9. tring_fun(msg_buf);
  10. }
  11. else if (0 == strcmp(msg_type, "ring_180"))
  12. {
  13. ring_180_fun(msg_buf);
  14. }
  15. else if (0 == strcmp(msg_type, "ring_181"))
  16. {
  17. ring_181_fun(msg_buf);
  18. }
  19. else if (0 == strcmp(msg_type, "ring_182"))
  20. {
  21. ring_182_fun(msg_buf);
  22. }
  23. else if (0 == strcmp(msg_type, "ring_183"))
  24. {
  25. ring_183_fun(msg_buf);
  26. }
  27. else if (0 == strcmp(msg_type, "ok_200"))
  28. {
  29. ok_200_fun(msg_buf);
  30. }
  31. 。。。。。。
  32. else if (0 == strcmp(msg_type, "fail_486"))
  33. {
  34. fail_486_fun(msg_buf);
  35. }
  36. else
  37. {
  38. log("未识别的消息类型%s\n", msg_type);
  39. }
  40. }

上面的消息类型取自sip协议(不完全相同,sip协议借鉴了http协议),消息类型可能还会增加。看着常常的流程可能有点累,检测一下中间某个消息有没有处理也比较费劲,而且,没增加一个消息,就要增加一个流程分支。

按照数据驱动编程的思路,可能会这样设计:

[cpp] view plaincopy

  1. typedef void (*SIP_MSG_FUN)(const char *);
  2. typedef struct __msg_fun_st
  3. {
  4. const char *msg_type;//消息类型
  5. SIP_MSG_FUN fun_ptr;//函数指针
  6. }msg_fun_st;
  7. msg_fun_st msg_flow[] =
  8. {
  9. {"inivite", inivite_fun},
  10. {"tring_100", tring_fun},
  11. {"ring_180", ring_180_fun},
  12. {"ring_181", ring_181_fun},
  13. {"ring_182", ring_182_fun},
  14. {"ring_183", ring_183_fun},
  15. {"ok_200", ok_200_fun},
  16. 。。。。。。
  17. {"fail_486", fail_486_fun}
  18. };
  19. void msg_proc(const char *msg_type, const char *msg_buf)
  20. {
  21. int type_num = sizeof(msg_flow) / sizeof(msg_fun_st);
  22. int i = 0;
  23. for (i = 0; i < type_num; i++)
  24. {
  25. if (0 == strcmp(msg_flow[i].msg_type, msg_type))
  26. {
  27. msg_flow[i].fun_ptr(msg_buf);
  28. return ;
  29. }
  30. }
  31. log("未识别的消息类型%s\n", msg_type);
  32. }

下面这种思路的优势:

1、可读性更强,消息处理流程一目了然。

2、更容易修改,要增加新的消息,只要修改数据即可,不需要修改流程。

3、重用,第一种方案的很多的else if其实只是消息类型和处理函数不同,但是逻辑是一样的。下面的这种方案就是将这种相同的逻辑提取出来,而把容易发生变化的部分提到外面。

隐含在背后的思想

很多设计思路背后的原理其实都是相通的,隐含在数据驱动编程背后的实现思想包括:

1、控制复杂度。通过把程序逻辑的复杂度转移到人类更容易处理的数据中来,从而达到控制复杂度的目标。

2、隔离变化。像上面的例子,每个消息处理的逻辑是不变的,但是消息可能是变化的,那就把容易变化的消息和不容易变化的逻辑分离。

3、机制和策略的分离。和第二点很像,本书中很多地方提到了机制和策略。上例中,我的理解,机制就是消息的处理逻辑,策略就是不同的消息处理(后面想专门写一篇文章介绍下机制和策略)。

数据驱动编程可以用来做什么:

如上例所示,它可以应用在函数级的设计中。

同时,它也可以应用在程序级的设计中,典型的比如用表驱动法实现一个状态机(后面写篇文章专门介绍)。

也可以用在系统级的设计中,比如DSL(这方面我经验有些欠缺,目前不是非常确定)。

它不是什么:

1、 它不是一个全新的编程模型:它只是一种设计思路,而且历史悠久,在unix/linux社区应用很多;

2、它不同于面向对象设计中的数据:“数据驱动编程中,数据不但表示了某个对象的状态,实际上还定义了程序的流程;OO看重的是封装,而数据驱动编程看重的是编写尽可能少的代码。”

书中的值得思考的话:

数据压倒一切。如果选择了正确的数据结构并把一切组织的井井有条,正确的算法就不言自明。编程的核心是数据结构,而不是算法。——Rob Pike

程序员束手无策。。。。。只有跳脱代码,直起腰,仔细思考数据才是最好的行动。表达式编程的精髓。——Fred Brooks

数据比程序逻辑更易驾驭。尽可能把设计的复杂度从代码转移至数据是个好实践。——《unix编程艺术》作者。

数据驱动编程之表驱动法

本文示例代码采用的是c语言。
之前介绍过数据驱动编程《什么是数据驱动编程》。里面介绍了一个简单的数据驱动手法。今天更进一步,介绍一个稍微复杂,更加实用的一点手法——表驱动法。
关于表驱动法,在《unix编程艺术》中有提到,更详细的描述可以看一下《代码大全》,有一章专门进行描述(大概是第八章)。

简单的表驱动:
《什么是数据驱动编程》中有一个代码示例。它其实也可以看做是一种表驱动手法,只不过这个表相对比较简单,它在收到消息后,根据消息类型确定使用调用什么函数进行处理。

复杂一点的表驱动:

考虑一个消息(事件)驱动的系统,系统的某一模块需要和其他的几个模块进行通信。它收到消息后,需要根据消息的发送方,消息的类型,自身的状态,进行不同的处理。比较常见的一个做法是用三个级联的switch分支实现通过硬编码来实现:

[cpp] view plaincopy

  1. switch(sendMode)
  2. {
  3. case:
  4. }
  5. switch(msgEvent)
  6. {
  7. case:
  8. }
  9. switch(myStatus)
  10. {
  11. case:
  12. }

这种方法的缺点:
1、可读性不高:找一个消息的处理部分代码需要跳转多层代码。
2、过多的switch分支,这其实也是一种重复代码。他们都有共同的特性,还可以再进一步进行提炼。
3、可扩展性差:如果为程序增加一种新的模块的状态,这可能要改变所有的消息处理的函数,非常的不方便,而且过程容易出错。
4、程序缺少主心骨:缺少一个能够提纲挈领的主干,程序的主干被淹没在大量的代码逻辑之中。

用表驱动法来实现:
根据定义的三个枚举:模块类型,消息类型,自身模块状态,定义一个函数跳转表:

[cpp] view plaincopy

  1. typedef struct  __EVENT_DRIVE
  2. {
  3. MODE_TYPE mod;//消息的发送模块
  4. EVENT_TYPE event;//消息类型
  5. STATUS_TYPE status;//自身状态
  6. EVENT_FUN eventfun;//此状态下的处理函数指针
  7. }EVENT_DRIVE;
  8. EVENT_DRIVE eventdriver[] = //这就是一张表的定义,不一定是数据库中的表。也可以使自己定义的一个结构体数组。
  9. {
  10. {MODE_A, EVENT_a, STATUS_1, fun1}
  11. {MODE_A, EVENT_a, STATUS_2, fun2}
  12. {MODE_A, EVENT_a, STATUS_3, fun3}
  13. {MODE_A, EVENT_b, STATUS_1, fun4}
  14. {MODE_A, EVENT_b, STATUS_2, fun5}
  15. {MODE_B, EVENT_a, STATUS_1, fun6}
  16. {MODE_B, EVENT_a, STATUS_2, fun7}
  17. {MODE_B, EVENT_a, STATUS_3, fun8}
  18. {MODE_B, EVENT_b, STATUS_1, fun9}
  19. {MODE_B, EVENT_b, STATUS_2, fun10}
  20. };
  21. int driversize = sizeof(eventdriver) / sizeof(EVENT_DRIVE)//驱动表的大小
  22. EVENT_FUN GetFunFromDriver(MODE_TYPE mod, EVENT_TYPE event, STATUS_TYPE status)//驱动表查找函数
  23. {
  24. int i = 0;
  25. for (i = 0; i < driversize; i ++)
  26. {
  27. if ((eventdriver[i].mod == mod) && (eventdriver[i].event == event) && (eventdriver[i].status == status))
  28. {
  29. return eventdriver[i].eventfun;
  30. }
  31. }
  32. return NULL;
  33. }

这种方法的好处:
1、提高了程序的可读性。一个消息如何处理,只要看一下驱动表就知道,非常明显。
2、减少了重复代码。这种方法的代码量肯定比第一种少。为什么?因为它把一些重复的东西:switch分支处理进行了抽象,把其中公共的东西——根据三个元素查找处理方法抽象成了一个函数GetFunFromDriver外加一个驱动表。
3、可扩展性。注意这个函数指针,他的定义其实就是一种契约,类似于java中的接口,c++中的纯虚函数,只有满足这个条件(入参,返回值),才可以作为一个事件的处理函数。这个有一点插件结构的味道,你可以对这些插件进行方便替换,新增,删除,从而改变程序的行为。而这种改变,对事件处理函数的查找又是隔离的(也可以叫做隔离了变化)。、
4、程序有一个明显的主干。
5、降低了复杂度。通过把程序逻辑的复杂度转移到人类更容易处理的数据中来,从而达到控制复杂度的目标。

继承与组合
考虑一个事件驱动的模块,这个模块管理很多个用户,每个用户需要处理很多的事件。那么,我们建立的驱动表就不是针对模块了,而是针对用户,应该是用户在某状态下,收到某模块的某事件的处理。我们再假设用户可以分为不同的级别,每个级别对上面的提到的处理又不尽相同。
用面向对象的思路,我们可以考虑设计一个用户的基类,实现相同事件的处理方法;根据级别不同,定义几个不同的子类,继承公共的处理,再分别实现不同的处理。这是最常见的一种思路,可以叫它继承法。
如果用表驱动法怎么实现?直接设计一个用户的类,没有子类,也没有具体的事件的处理方法。它有一个成员,就是一个驱动表,它收到事件后,全部委托给这个驱动表去进行处理。针对用户的级别不同,可以定义多个不同的驱动表来装配不同的对象实例。这个可以叫他组合法。
继承和组合在《设计模式》也有提到。组合的优势在于它的可扩展性,弹性,强调封装性。(继承和组合可以参考这篇文章:面向对象之继承组合浅谈
至于这种情况下的驱动表,可以继续使用结构体,也可以使用对象。

上面的方法的一点性能优化建议:
如果对性能要求不高,上面的方法足可以应付。如果性能要求很高,可以进行适当的优化。比如,可以建立一个多维数组,每一维分别表示模块,状态,消息。这样,就可以根据这三者的枚举直接根据下标定位到处理函数,而不是查表。(其实还是数据驱动的思想:数据结构是静态的算法。)

数据驱动编程再更高级,更为抽象一点的,应该就是流程脚本或者DSL了。我曾经写过一个简单的寄生在xml上的脚本来描述流程。这一块后面抽时间介绍。

http://blog.csdn.net/chgaowei/article/details/6966857

数据驱动编程法

时间: 2024-07-30 12:04:04

数据驱动编程法的相关文章

漫谈程序员系列:神奇的四步编程法

我曾经学习过很多门开发语言,C.C++.Java.Lua.JavaScript.Python.Scala.Pascal等,不断地从零开始学习新语言,强化了我对学习过程的记忆,使得我对如何学习编程语言积累了一点点心得,我一直想把它记录下来,可考虑到这种经验的个人特征过于明显,我一直犹豫着要不要真的去做这件事儿.直到最近我又一次开始学习据说是太阳系最难的语言Scala时,我猜意识到,是时候把这种经验写下来了. 就在我要开始噼里啪啦敲键盘的时候,发现了下面的图片,碉堡了,汗出如浆,毅然放弃了我的想法.

《Java程序员面试笔试宝典》终于在万众期待中出版啦~

<Java程序员面试笔试宝典>终于在万众期待中出版啦~它是知名畅销书<程序员面试笔试宝典>的姊妹篇,而定价只要48元哦,恰逢求职季节,希望本书的出版能够让更多的求职者能够走进理想的企业 在这里,众多知名企业面试官将为你撕开神秘的求职面纱: 在这里,各种求职达人将现身说法为你揭开求职谜团: 在这里,各种类型的企业招聘细节都会被展露无疑: 在这里,我们将为你抽丝剥茧,还原IT行业的真相: 在这里,我们将为你指点迷津,告诉你职场上的风风雨雨: 在这里,我们将为你点石成金,成为那盏指引你前

数独解法小探

数独的游戏要求在一个9X9的格子内填入1~9的数字,使得每一行,每一列,以及九个3X3的子区域内都没有重复的数字. 稍作思索,我写出了第一种解法.从事后查询维基百科1来看,这种方法可以称之为回溯法.思路很简单,依次扫描每一个待填数字的空格: 1. 在第一个空格里面填上“1”,检查这个数字是否合法(其所在的行.列,以及3X3的子区域里不存在重复的数字).如果合法,则前进到第二个格子.否则,在这个格子里继续试2,3,… ,直到合法为止. 2. 在第二个格子里面继续填数字,从“1”开始试起,直到找到一

2016/06 书单

综合类:1 精益企业2 暗时间.3 逻辑学导论4 算法帝国5 人本游戏6 web全栈工程师的自我修养7 京东技术解密8 技术管理之巅9 内观,葛印卡教授的解脱之道10 软件开发践行录 基础1 操作系统之哲学原理2 深入理解计算机系统 软件工程1 构建之法2 人件3 人月神话4 设计原本5 企业信息化总体架构 编程术1 unix编程艺术2 linux/unix设计思想3 代码大全4 程序员修炼之道5 软件随想录 1,26 unix内核源代码剖析7 元素模式8 ruby元编程 2nd 编程法1 大型

教你一招:基于数据驱动的接口单元测试

1.前言 Hello,小伙伴们,本文将继续分享基于数据驱动的接口单元测试自动化测试方案. 用到的技术包括:maven.kubbo.junit4,json开发包.Jenkins等. 2.数据驱动 2.1 数据驱动的概念    数据驱动测试是从数据文件(如Excel文件.文本文件.XML文件或数据库等)中读取测试数据,然后通过变量传入事先编写或录制好的测试脚本中,这些变量既可传递测试输入数据也可传递测试输出的验证数据.测试数据只出现在数据文件中,测试脚本负责测试逻辑业务过程.测试状态以及数据文件读取

如何“谨慎”使用“数据驱动”的风控模型(三)——监控篇

之前小编介绍了谨慎使用"数据驱动"的风控模型,需要"高质量的数据 + 审慎严谨的决策模型 + 实时全面的监控分析"动态闭环.动态闭环能够"动态"起来,需要最后一个步骤"监控"把关,全面.细致的分析.评估决策效果,使决策体系不断进化. 做好监控是"谨慎"原则至关重要的举措,需同时兼顾宏观与微观,并实现数据可视化.宏观上,定义好业务指标,能做到洞察业务趋势,预测整体盈利能力,区分不同风控决策的风险资产收益率(收

华为云在视频编解码领域的优化探索

华为云在视频编解码领域的优化探索日前,2019亚太CDN峰会在北京隆重召开.此次峰会是亚太地区最具规模,最具影响力的一次CDN行业盛典,大会聚焦CDN行业热点:5G.视频云.边缘计算.智能网络等.此次大会行业巨头云集,华为云重磅亮相,在视频云论坛上,华为云视频编解码技术专家发表了题为<HW265编码优化探索之路>的主题演讲,他揭秘了华为云在视频编解码领域的深厚技术沉淀. 在今天,通过各种终端设备随时享受短视频.点播.直播等优质内容已经成为各年龄层消费者的普遍生活状态.工信部等发布<超高清

在vs 2015环境下,c语言和汇编混编操作简析(更新中......)

在VS 2015环境下如何混编. 在新建工程里也会发现了很多问题, 应用程序类型分为:windows应用程序,控制台应用程序,DLL,静态库 静态库: 静态库是指在我们的应用中,有一些公共代码是需要反复使用,就把这些代码编译为"库"文件:在链接步骤中,连接器将从库文件取得所需的代码,复制到生成的可执行文件中的这种库. 程序编译一般需经预处理.编译.汇编和链接几个步骤.静态库特点是可执行文件中包含了库代码的一份完整拷贝:缺点就是被多次使用就会有多份冗余拷贝. 静态库和动态库是两种共享程序

编码表

常见的编码表: ASCII 美国标准信息交换码,用一个字节的7位表示 ISO-8859-1  拉丁码表,欧洲码表,用一个字节的全部8位表示 GB2312:中国的中文码表 GBK:GB2312的升级,融合了更多的中文文字符号 Unicode:国际标准码,融合了多种文字,所有文字都是使用两个字节来表示,java就是使用Unicode编码表 UTF-8:最多用三个字节来表示一个字符.如果能用一个字节来装,就使用一个字节,一个装不下,就用两个字节,最多三个字节 string s="你好"; b