C原子

  原子是一个指向唯一的、不可变的0个或任意多个字节序列的指针,大多数原子都是指向以空字符结束的字符串,但是任何一个指向任意字节序列的指针都可以使原子。任何原子只能出现一次。如果两个原子指向同一个内存单元时,则两个原子是相等的。仅仅比较两个字节序列相应的指针是否相等,就可以判断这两个字节序列是否相等了,这就是使用原子的好处之一;还有一个好处就是使用原子可以节省空间,因为每个序列只会出现一次。

本文地址:http://www.cnblogs.com/archimedes/p/c-atom.html,转载请注明源地址。

接口

Atom的接口很简单:

#ifndef ATOM_INCLUDED
#define ATOM_INCLUDED
extern       int   Atom_length(const char *str);
extern const char *Atom_new   (const char *str, int len);
extern const char *Atom_string(const char *str);
extern const char *Atom_int   (long n);
#endif

atom.h

Atom_new接收一个指向字节序列的指针以及该序列的字节数作为输入,它在原子表中增加一个该序列的拷贝,并且如果需要的话,返回原子表中指向该拷贝的指针(即原子)

原子总是以一个空字符结束,在必要的时候该空字符由Atom_new添加

Atom_string接收一个空字符串结束的字符串作为输入,在原子表中增加一个该串的拷贝,如果需要的话返回该原子

Atom_int返回长整数n的字符串表示的原子

Atom_length返回其原子参数的长度

实现

Atom的实现对原子表进行维护。Atom_new,Atom_string,Atom_int查找原子表,并都有可能在原子表中添加一个新的元素,而Atom_length仅仅查找原子表

#include "atom.h"

Atom_string,Atom_int可以在不知道原子表细节的情况下执行相应的操作

#include <string.h>
#include "assert.h"
const char *Atom_string(const char *str) {
    assert(str);
    return Atom_new(str, strlen(str));
}

Atom_int首先把它的参数转化为一个字符串,然后调用Atom_new:

#include <limits.h>
const char *Atom_int(long n) {  /*将参数转换成一个字符串,然后调用Atom_new*/
    char str[43];
    char *s = str + sizeof str;  /*将s指向字符数组的尾部*/
    unsigned long m;
    if (n == LONG_MIN)    /*处理最小的负长整数*/
        m = LONG_MAX + 1UL;
    else if (n < 0)
        m = -n;
    else
        m = n;
    do
        *--s = m%10 + ‘0‘;   /*对m取余获取最后一位数字倒序保存在字符数组中*/
    while ((m /= 10) > 0);
    if (n < 0)
        *--s = ‘-‘;  /*如果n是负数在结果前面加上’-‘号*/
    return Atom_new(s, (str + sizeof str) - s);
}

Atom_int必须处理二进制补码数的不对称范围以及C的除法和取余运算的不确定性,无符号的除法和取余都具有良好的定义,因此Atom_int也可以通过使用无符号算术来避免使用有符号运算引起的不确定。

引入头文件和相关宏:

#include "atom.h"
#include <string.h>
#include "assert.h"
#include <limits.h>
#include "mem.h"   /* 内存管理接口 */
#define NELEMS(x) ((sizeof (x))/(sizeof ((x)[0])))
 /* 求数组中元素的个数 */

散列表显然是一个针对原子表的数据结构,散列表是一个入口表的指针数组,其中每一个元素都存有一个原子:

static struct atom {
    struct atom *link;  /*指向表中的下一个入口*/
    int len;  /*len存储序列的长度*/
    char *str;   /*str指向序列本身*/
} *buckets[2048];  /*散列表的长度小于2048*/

针对“an atom”的struct atom的小尾数法布局:

Atom_new计算由str[0……len-1]给定序列的散列值,并用buckets的元素个数对其取模,搜索由buckets中该散列值元素所指向的链表。如果发现str[0……len-1]已存在于表中,它将只是简单地返回该原子:

#define NELEMS(x) ((sizeof (x))/(sizeof ((x)[0])))  /* 求数组中元素的个数 */
const char *Atom_new(const char *str, int len) {  /*接收一个指向字节序列的指针以及该序列的字节数,在原子表中增加一个该序列的拷贝*/
    unsigned long h;
    int i;
    struct atom *p;
    assert(str);
    assert(len >= 0);
    for (h = 0, i = 0; i < len; i++)  /*查找表算法*/
        h = (h<<1) + scatter[(unsigned char)str[i]];
    h &= NELEMS(buckets)-1;
    for (p = buckets[h]; p; p = p->link)  /*在buckets[h]中查找是否存在str*/
        if (len == p->len) {
            for (i = 0; i < len && p->str[i] == str[i]; )
                i++;
            if (i == len)
                return p->str;  /*找到即返回*/
        }
    p = ALLOC(sizeof (*p) + len + 1);  /*没找到则新建原子*/
    p->len = len;
    p->str = (char *)(p + 1);
    if (len > 0)
        memcpy(p->str, str, len);
    p->str[len] = ‘\0‘;
    p->link = buckets[h];
    buckets[h] = p;
    return p->str;
}

Hash表结构:

Atom的实现对原子表进行维护,Atom_new、Atom_string以及Atom_int查找原子表,并且都有可能在原子表中添加一个新的元素,而Atom_length仅仅查找原子表。

完整实现代码如下:

static unsigned long scatter[] = {  /*256入口数组,它将字节映射为随机数,这些随机数通过标准库的rand函数生成*/
2078917053, 143302914, 1027100827, 1953210302, 755253631, 2002600785,
1405390230, 45248011, 1099951567, 433832350, 2018585307, 438263339,
813528929, 1703199216, 618906479, 573714703, 766270699, 275680090,
1510320440, 1583583926, 1723401032, 1965443329, 1098183682, 1636505764,
980071615, 1011597961, 643279273, 1315461275, 157584038, 1069844923,
471560540, 89017443, 1213147837, 1498661368, 2042227746, 1968401469,
1353778505, 1300134328, 2013649480, 306246424, 1733966678, 1884751139,
744509763, 400011959, 1440466707, 1363416242, 973726663, 59253759,
1639096332, 336563455, 1642837685, 1215013716, 154523136, 593537720,
704035832, 1134594751, 1605135681, 1347315106, 302572379, 1762719719,
269676381, 774132919, 1851737163, 1482824219, 125310639, 1746481261,
1303742040, 1479089144, 899131941, 1169907872, 1785335569, 485614972,
907175364, 382361684, 885626931, 200158423, 1745777927, 1859353594,
259412182, 1237390611, 48433401, 1902249868, 304920680, 202956538,
348303940, 1008956512, 1337551289, 1953439621, 208787970, 1640123668,
1568675693, 478464352, 266772940, 1272929208, 1961288571, 392083579,
871926821, 1117546963, 1871172724, 1771058762, 139971187, 1509024645,
109190086, 1047146551, 1891386329, 994817018, 1247304975, 1489680608,
706686964, 1506717157, 579587572, 755120366, 1261483377, 884508252,
958076904, 1609787317, 1893464764, 148144545, 1415743291, 2102252735,
1788268214, 836935336, 433233439, 2055041154, 2109864544, 247038362,
299641085, 834307717, 1364585325, 23330161, 457882831, 1504556512,
1532354806, 567072918, 404219416, 1276257488, 1561889936, 1651524391,
618454448, 121093252, 1010757900, 1198042020, 876213618, 124757630,
2082550272, 1834290522, 1734544947, 1828531389, 1982435068, 1002804590,
1783300476, 1623219634, 1839739926, 69050267, 1530777140, 1802120822,
316088629, 1830418225, 488944891, 1680673954, 1853748387, 946827723,
1037746818, 1238619545, 1513900641, 1441966234, 367393385, 928306929,
946006977, 985847834, 1049400181, 1956764878, 36406206, 1925613800,
2081522508, 2118956479, 1612420674, 1668583807, 1800004220, 1447372094,
523904750, 1435821048, 923108080, 216161028, 1504871315, 306401572,
2018281851, 1820959944, 2136819798, 359743094, 1354150250, 1843084537,
1306570817, 244413420, 934220434, 672987810, 1686379655, 1301613820,
1601294739, 484902984, 139978006, 503211273, 294184214, 176384212,
281341425, 228223074, 147857043, 1893762099, 1896806882, 1947861263,
1193650546, 273227984, 1236198663, 2116758626, 489389012, 593586330,
275676551, 360187215, 267062626, 265012701, 719930310, 1621212876,
2108097238, 2026501127, 1865626297, 894834024, 552005290, 1404522304,
48964196, 5816381, 1889425288, 188942202, 509027654, 36125855,
365326415, 790369079, 264348929, 513183458, 536647531, 13672163,
313561074, 1730298077, 286900147, 1549759737, 1699573055, 776289160,
2143346068, 1975249606, 1136476375, 262925046, 92778659, 1856406685,
1884137923, 53392249, 1735424165, 1602280572
};
const char *Atom_string(const char *str) {
    assert(str);
    return Atom_new(str, strlen(str));
}
const char *Atom_int(long n) {  /*将参数转换成一个字符串,然后调用Atom_new*/
    char str[43];
    char *s = str + sizeof str;  /*将s指向字符数组的尾部*/
    unsigned long m;
    if (n == LONG_MIN)    /*处理最小的负长整数*/
        m = LONG_MAX + 1UL;
    else if (n < 0)
        m = -n;
    else
        m = n;
    do
        *--s = m%10 + ‘0‘;   /*对m取余获取最后一位数字倒序保存在字符数组中*/
    while ((m /= 10) > 0);
    if (n < 0)
        *--s = ‘-‘;  /*如果n是负数在结果前面加上’-‘号*/
    return Atom_new(s, (str + sizeof str) - s);
}
const char *Atom_new(const char *str, int len) {  /*接收一个指向字节序列的指针以及该序列的字节数,在原子表中增加一个该序列的拷贝*/
    unsigned long h;
    int i;
    struct atom *p;
    assert(str);
    assert(len >= 0);
    for (h = 0, i = 0; i < len; i++)  /*查找表算法*/
        h = (h<<1) + scatter[(unsigned char)str[i]];
    h &= NELEMS(buckets)-1;
    for (p = buckets[h]; p; p = p->link)  /*在buckets[h]中查找是否存在str*/
        if (len == p->len) {
            for (i = 0; i < len && p->str[i] == str[i]; )
                i++;
            if (i == len)
                return p->str;  /*找到即返回*/
        }
    p = ALLOC(sizeof (*p) + len + 1);  /*没找到则新建原子*/
    p->len = len;
    p->str = (char *)(p + 1);
    if (len > 0)
        memcpy(p->str, str, len);
    p->str[len] = ‘\0‘;
    p->link = buckets[h];
    buckets[h] = p;
    return p->str;
}
int Atom_length(const char *str) {
    struct atom *p;
    int i;
    assert(str);
    for (i = 0; i < NELEMS(buckets); i++)
        for (p = buckets[i]; p; p = p->link)  /*在buckets表中查找str*/
            if (p->str == str)
                return p->len;  /*成功找到后返回len*/
    assert(0);
    return 0;
}

atom.c

参考资料

《C语言接口与实现--创建可重用软件的技术》

时间: 2024-08-06 06:59:56

C原子的相关文章

关于原子哥ENC28J60网络通信模块接收数据代码的一点失误

这几天做STM32的ENC28J60网络通信模块,自己在原子哥的代码上进行修改测试,,发现一个问题,电脑和板子进行通信的时候总隔一段时间板子就死机了. 直接源码 struct netbuf *recvbuf;//接收buf struct pbuf *q; err_t recv_err;//接收数据返回信息 u32 data_len = 0; //客户端接收数组的长度 u8 tcp_server_recvbuf[TCP_SERVER_RX_BUFSIZE]; //TCP客户端接收数据缓冲区 mem

原子变量与CAS算法

上一节讨论了 volatile关键字,volatile关键字修饰的作用是不具有 "原子性" 和 "互斥性的" 例如 i++ 操作 就不是一个原子性的操作,i++ 其实分为3个步骤进行 "读-改-写" int temp = i; i = i + 1; i= temp; 先看一段代码: package com.java.juc; public class TestAtomicDemo { public static void main(String[

原子属性与非原子属性,互斥锁与自旋锁介绍

nonatomic 非原子属性 非线程安全,适合内存小的移动设备(手机,平板...) atomic 原子属性(线程安全,但需要消耗大量资源)针对多线程设计的,为默认值,保证同一时间只有一个线程能够写入;本身就是一把自旋锁;单写多读,单个线程写入,多个线程读取 注意:当重写属性的get与set方法时需要在@implementation后添加:@synthesiae 属性名 = _属性名; 互斥锁与自旋锁对比 互斥锁:如果发现其他线程正在执行锁定代码,线程会进入休眠(就绪状态),等其他线程时间到打开

服务化、原子化maven,springmvc,mybatis,shiro,bootstrap框架整合

下载源码猛搓这里 maven构建springmvc+mybatis+rest+bootstrap(cms开源)SpringMVC + Mybatis + SpringSecurity(权限控制到方法按钮) + Rest(服务) + Webservice(服务) + Quartz(定时调度)+ Lucene(搜索引擎) + HTML5 bootstrap + Maven项目构建绝对开源平台项目Mave构建,模拟大型互联网架构,做到高并发,大数据处理,整个项目使用定制化服务思想,提供原子化.模块化的

正则表达式中原子的5种类型

原子是正则表达式的最基本的组成单位,而且在每个模式中最少包含一个原子.原子是由所有那些未显示指定为元字符的打印和非打印字符组成,所以在这里将其详细划分为五类进行介绍. ①普通字符作为原子 普通字符是编写正则表达式时最常见的原子了,包括所有的大写和小写字母字符.所有数字等.例如,a——z.A——Z.0——9. ’/5/’        –用于匹配字符串中是否有5这个字符出现 ’/php/’      –用于匹配字符串中是否有PHP字符串出现 ②一些特殊字符和元字符作为原子 任何一个符号都可以作为原

STM32学习笔记——USART串口(向原子哥和火哥学习)

一.USART简介 通用同步异步收发器(USART)提供了一种灵活的方法与使用工业标准NRZ异步串行数据格式的外部设备之间进行全双工数据交换.USART利用分数波特率发生器提供宽范围的波特率选择. STM32 的串口资源相当丰富的,功能也相当强劲.STM32F103ZET6 最多可提供 5 路串口,有分数波特率发生器,支持同步单向通信和半双工单线通信,支持LIN(局部互连网),智能卡协议和IrDA(红外数据组织)SIR ENDEC规范,以及调制解调器(CTS/RTS)操作.它还允许多处理器通信.

Linus:为何对象引用计数必须是原子的

Linus大神又在rant了!这次的吐槽对象是时下很火热的并行技术(parellism),并直截了当地表示并行计算是浪费所有人时间(“The whole “let’s parallelize” thing is a huge waste of everybody’s time.”).大致意思是说乱序性能快.提高缓存容量.降功耗.当然笔者不打算正面讨论并行的是是非非(过于宏伟的主题),因为Linus在另一则帖子中举了对象引用计数(reference counting)的例子来说明并行的复杂性. 在

Java 理论与实践: 流行的原子

Java 理论与实践: 流行的原子 新原子类是 java.util.concurrent 的隐藏精华 在 JDK 5.0 之前,如果不使用本机代码,就不能用 Java 语言编写无等待.无锁定的算法.在 java.util.concurrent 中添加原子变量类之后,这种情况发生了变化.请跟随并行专家 Brian Goetz 一起,了解这些新类如何使用 Java 语言开发高度可伸缩的无阻塞算法.您可以在本文的 论坛中与作者或其他读者共享您对本文的看法.(也可以通过单击文章顶部或者底部的 讨论链接来

Phoenix系列:原子的Upsert

Phoenix的插入语句是Upsert,Update和Insert的组合语义.即,如果数据表中没有这条记录那么插入这条记录,如果有则更新.判断是否存在相同的数据是使用ON DUPLICATE KEY来验证的,这里的KEY就是建表时候的主键(PRIMARY KEY).和Oracle的Merge Into以及MySQL的Insert …on duplicate key 是类似的功能.ON DUPLICATE KEY这个语法要到Phoenix 4.9之后才有.这个功能把HBase的Increment和

HP忆阻器内存和IBM原子磁盘双剑合璧会怎么样

作者: Hardy(晗狄) 转载本号文章请注明作者.出处和二维码及全文信息,否则视为侵权. 古墓派剑法和全真剑法双剑合璧后威力无比,就连金轮法王都甘拜下风:那HP忆阻器内存技术和IBM原子磁盘双剑合璧后,是否就所向无敌.独孤求败呢.今天文章开头调皮了下,各位读者别往心里去,毕竟搞技术.编码和练武功还是一码归一码,没什么可比性:如果您已是人码合一那就另当别论. HP在2015 Discover Conference会议中就提出了新型计算机架构 The Machine, 其架构将采用硅光(Silic