C 语言的 switch 语句非常强大。然而,它不能用字符串作为判断条件,只能用常整数。这是可以理解的,因为 C 的字符串仅仅是数组,它们并不是并不是一个整体。
在某些情况下,将 string 作为 switch 语句判断条件是非常有用的。在 lwan 中我用一个小窍门避免在热门路径调用 strcmp 家族函数。这是利用字符串仅仅是字节数组这个概念,我们将这些字节数组转化成一个指向 32 位整数的指针,并解引用这个指针。利用这个窍门,我们就可以在 switch 语句中使用短小的字符串(例如:文件扩展名,包括 . 它们大多数只有四个字符)来作为判断条件。
C 也支持多字节整型常量。然而由于大小端的影响, 当你在这些编译这些常量时启用 -Wall -Wextra 选项,GCC 会发出警告。我的解决方法是:用宏和枚举类型配合去创建一个编译器期望的常整型。下面的代码直接从 lwan 拷贝的,为了说明 STRING_SWITCH 语句的用法:
1 #define STRING_SWITCH_L(s) switch (*((int32_t *)(s)) | 0x20202020) 2 #define MULTICHAR_CONSTANT(a,b,c,d) ((int32_t)((a) | (b) << 8 | (c)<< 16 | (d) << 24)) 3 4 enum { 5 EXT_JPG = MULTICHAR_CONSTANT_L(‘.‘,‘j‘,‘p‘,‘g‘), 6 EXT_PNG = MULTICHAR_CONSTANT_L(‘.‘,‘p‘,‘n‘,‘g‘), 7 EXT_HTM = MULTICHAR_CONSTANT_L(‘.‘,‘h‘,‘t‘,‘m‘), 8 EXT_CSS = MULTICHAR_CONSTANT_L(‘.‘,‘c‘,‘s‘,‘s‘), 9 EXT_TXT = MULTICHAR_CONSTANT_L(‘.‘,‘t‘,‘x‘,‘t‘), 10 EXT_JS = MULTICHAR_CONSTANT_L(‘.‘,‘j‘,‘s‘,0), 11 } lwan_mime_ext_t; 12 13 const char* lwan_determine_mime_type_for_file_name(char *file_name) 14 { 15 char *last_dot = strrchr(file_name, ‘.‘); 16 if (UNLIKELY(!last_dot)) 17 goto fallback; 18 19 STRING_SWITCH_L(last_dot) { 20 case EXT_CSS: return "text/css"; 21 case EXT_HTM: return "text/html"; 22 case EXT_JPG: return "image/jpeg"; 23 case EXT_JS: return "application/javascript"; 24 case EXT_PNG: return "image/png"; 25 case EXT_TXT: return "text/plain"; 26 } 27 28 fallback: 29 return "application/octet-stream"; 30 }
我们注意到,STRING_SWITCH_L 是将字符串与一个 32 位整数按位或,这样做可以一次性检测 4 个字符的情况。
这样的 switch 语句在 lwan 中用来匹配 HTTP 头和 HTTP 请求方法。也用来做简单的文件扩展名到 MIME-Type 的转换,就像上面代码所展示的那样。
译自 http://tia.mat.br/blog/html/2012/08/09/string_switch_in_c.html ,如有错误,清留言!
时间: 2024-10-09 06:33:31