Redis4.0模块子系统实现简述 / 憋错料

一、模块加载方法

1、在配置文件或者启动参数里面通过<loadmodule /path/to/mymodule.so args>指令加载

2、Redis启动后，通过<module load /path/to/mymodule.so args>指令加载，另外<module list>可以查询当前所有已加载模块。<module unload name>可以卸载已经加载的模块，注意name为模块的注册名字，不一定和模块文件名相同。

二、介绍

Redis模块是一种动态库，可以用与Redis内核相似的运行速度和特性来扩展Redis内核的功能。作者认为lua脚本只是组合Redis内核的现有功能，但是Redis模块则可以扩展Redis内核的功能。主要提供以下几个方面的扩展

1、可以如lua脚本或者client一样，通过RedisModule_Call接口直接执行redis命令并获取执行结果。Redis称呼这种API为高层API。

2、可以通过RedisModule_OpenKey接口，获取底层键，并根据键的类型以及各类型提供的模块操作接口进行底层操作。

3、自动内存管理(Automatic memory management)，可以在回调函数中，调用RedisModule_AutoMemory打开自动内存管理功能，这样随后分配的RedisModuleString对象、open key等，redis会记录下来，当回调函数返回的时候，redis会把这些资源自动释放调。这意味着不能在自动内存管理打开的情况下，创建RedisModuleString等对象来初始化全局变量。

4、redis本地类型(native types support)创建。通过提供RDB保存、RDB加载、AOF重写等回调函数，在Redis模块中可以创建类似redis内部dict、list之类的数据类型。例如可以在模块中创建一个链表，并提供对应的回调函数，这样redis在保存RDB文件的时候，就可以把模块中的数据保存在RDB中，在redis启动从rdb中加载数据的时候，进而可以恢复模块数据状态。

5、阻塞命令。在redis模块中可以将client阻塞，并设置超时时间。以实现类似BLPOP的阻塞命令。

三、一个redis模块示例

如下代码一个简单的redis模块示例，添加了一个hello.rand命令。在模块加载的时候，打印出传入的参数，当执行hello.rand命令的时候，同样会打印出传入的命令参数，并返回生成的一个随机数。关于下面的代码，有两个点需要说明

1、RedisModule_OnLoad是每个Redis模块的入口函数，在加载模块的时候，就是通过查找这个函数的入口地址来开始执行redis模块代码的。

2、RedisModule_Init是在调用redis模块API之前必须调用的初始化函数。一般应放在RedisModule_OnLoad的最开始位置。如果没有执行RedisModule_Init，就调用redis模块的API，则会产生空指针异常。

后面介绍redis实现的时候会进一步介绍上面的两点


#include "../../src/redismodule.h"
#include <stdlib.h>
#include <string.h>

void HelloRedis_LogArgs(RedisModuleString **argv, int argc)
{
    for (int j = 0; j < argc; j++) {
        const char *s = RedisModule_StringPtrLen(argv[j],NULL);
        printf("ARGV[%d] = %s\n", j, s);
    }
}

int HelloRedis_RandCommand(RedisModuleCtx *ctx, RedisModuleString **argv, int argc) {
    
    HelloRedis_LogArgs(argv,argc);
    RedisModule_ReplyWithLongLong(ctx,rand());
    return REDISMODULE_OK;
}


int RedisModule_OnLoad(RedisModuleCtx *ctx, RedisModuleString **argv, int argc) {
    
    if (RedisModule_Init(ctx,"hello",1,REDISMODULE_APIVER_1)
        == REDISMODULE_ERR) return REDISMODULE_ERR;

    HelloRedis_LogArgs(argv,argc);
    
    if (RedisModule_CreateCommand(ctx,"hello.rand",
        HelloRedis_RandCommand,"readonly",0,0,0)== REDISMODULE_ERR)
        return REDISMODULE_ERR;
        
    
    return REDISMODULE_OK;
}

上面的模块编译执行后，client侧执行如下命令来进行测试。


127.0.0.1:6379> module load modules/hellomodule/helloRedis.so helloarg1 helloarg2 
OK
127.0.0.1:6379> module list
1) 1) "name"
   2) "hello"
   3) "ver"
   4) (integer) 1
127.0.0.1:6379> hello.rand
(integer) 1315916238
127.0.0.1:6379> hello.rand
(integer) 1420937835
127.0.0.1:6379> hello.rand arg test
(integer) 543546598
127.0.0.1:6379> module unload hello
OK

redis server端显示的如下内容。


ARGV[0] = helloarg1
ARGV[1] = helloarg2
7779:M 19 Dec 14:33:17.032 * Module ‘hello‘ loaded from modules/hellomodule/helloRedis.so
ARGV[0] = hello.rand
ARGV[0] = hello.rand
ARGV[0] = hello.rand
ARGV[1] = arg
ARGV[2] = test
7779:M 19 Dec 14:34:13.604 * Module hello unloaded

四、redis模块管理相关数据结构

Redis模块管理涉及到的相关数据结构如下


struct RedisModule {
    void *handle;   /* dlopen() 返回的handle. */
    char *name;     /* 模块名字 */
    int ver;        /* 模块版本*/
    int apiver;     /* 模块API版本*/
    list *types;    /* 用来保存模块的数据类型信息 */
};
typedef struct RedisModule RedisModule;
static dict *modules; /* 全局变量  用来进行module_name(SDS) -> RedisModule ptr的hash查找*/
struct moduleLoadQueueEntry {
    sds path;
    int argc;
    robj **argv;
};
struct redisServer {
    ....
    list *loadmodule_queue;     //在redis启动的时候，用来保存命令行或者配置文件中的模块相关配置，每个节点是一个struct moduleLoadQueueEntry
    dict *moduleapi;            /* 导出的模块API名字与API地址的映射 后面介绍*/
    ....
};
struct redisServer server; 
static list *moduleUnblockedClients;    //当模块中阻塞的client被RedisModule_UnblockClient接口解除阻塞的时候，会放入这个链表，后面统一处理

其中有几个需要额外说明一下

1、RedisModule中的types成员用来保存Redis模块中定义的native types，每个数据类型对应一个节点。每个节点的类型为struct RedisModuleType，里面包含了rdb_load、rdb_save、aof_rewrite等回调函数，这里没有给出struct RedisModuleType。

2、server.loadmodule_queue这个队列里面保存了redis通过命令行或者配置文件传入的模块加载信息，每个节点类型为struct moduleLoadQueueEntry。如配置文件指定"module load /path/to/mymodule.so arg1 arg2"，则会构建一个struct moduleLoadQueueEntry，其中path成员为包含/path/to/mymodule.so的SDS，argc=2，argv则包含两个robj对象指针，robj对象分别包含着"arg1"和"arg2"。

为什么没有在加载配置的时候，直接加载模块，而是先保存到队列中呢？原因是在加载配置的时候，redis server还没有完成初始化，加载模块的时候，会调用模块中的RedisModule_OnLoad函数，如果此时模块访问Redis内部数据，那么可能会访问到无效的数据。因此需要加载的模块需要先保存在队列中，等redis初始化完毕后，在从队列中依次加载对应的模块。

3、关于moduleUnblockedClients，当模块调用RedisModule_UnblockClient的时候，会先把要解除阻塞的client加入到这个链表中，等待当前redis的文件事件和时间事件处理完毕后，等待下一次事件前(beforeSleep->moduleHandleBlockedClients)，来集中处理(例如调用模块注册的reply_callback函数等)。

这里为什么没有直接在RedisModule_UnblockClient中处理，而是先添加到一个链表中，后面由redis内核处理呢？原因是RedisModule_UnblockClient在模块中支持线程调用，而redis内核事件处理是单线程的，因此为了避免线程竞争会先把待解除阻塞的client放入到moduleUnblockedClients链表中，后续交由redis内核处理。

五、module命令实现

接着说一下module命令中load、unload、list等实现

首先通过配置文件、命令行或者module load命令加载模块的时候，如下执行


/* 加载一个模块并初始化. 成功返回 C_OK , 失败返回C_ERR */
int moduleLoad(const char *path, void **module_argv, int module_argc) {
    int (*onload)(void *, void **, int);
    void *handle;
    RedisModuleCtx ctx = REDISMODULE_CTX_INIT;
    
    //加载动态库
    handle = dlopen(path,RTLD_NOW|RTLD_LOCAL);
    if (handle == NULL) {
        return C_ERR;
    }
    //查找动态库中入口函数RedisModule_OnLoad的地址
    onload = (int (*)(void *, void **, int))(unsigned long) dlsym(handle,"RedisModule_OnLoad");
    if (onload == NULL) {
        return C_ERR;
    }
    
    //执行模块中的RedisModule_OnLoad入口函数
    if (onload((void*)&ctx,module_argv,module_argc) == REDISMODULE_ERR) {
        if (ctx.module) moduleFreeModuleStructure(ctx.module);
        dlclose(handle);
        return C_ERR;
    }

    /* Redis module 加载成功，注册到modules全局字典中 */
    dictAdd(modules,ctx.module->name,ctx.module);
    ctx.module->handle = handle;
    /*注意这里会把ctx释放掉，后面需要的时候，会根据modules字典中的查找到的模块信息，构造一个ctx
     *这意味着在模块函数中的ctx入参是一个堆栈上的变量，
     *例如通过RedisModule_AutoMemory设置ctx自动内存管理的时候，只是当次有效*/
    moduleFreeContext(&ctx);
    return C_OK;
}

module unload命令卸载一个模块时候，执行如下简化代码


/* 卸载一个模块，成功返回C_OK,失败返回C_ERR */
int moduleUnload(sds name) {
    struct RedisModule *module = dictFetchValue(modules,name);

    if (module == NULL) {
        return REDISMODULE_ERR;
    }
    //如果模块导入了本地数据类型，则不允许卸载
    if (listLength(module->types)) {
        return REDISMODULE_ERR;
    }

    /* 模块可以向Redis服务器注册新的Redis命令，卸载模块的时候，需要取消之前注册的命令 */
    unregister_cmds_of_module(module);

    /* 卸载动态库 */
    if (dlclose(module->handle) == -1) {
        char *error = dlerror();
        if (error == NULL) error = "Unknown error";
    }

    /* 从全局modules字典中删除模块 同时释放module->name*/
    dictDelete(modules,module->name);
    module->name = NULL; 
    //释放module占用的内存
    moduleFreeModuleStructure(module);

    return REDISMODULE_OK;
}

module list命令执行如下简化代码


/* modules list简化代码 */
void moduleList(sds name) {
    dictIterator *di = dictGetIterator(modules);
    dictEntry *de;

    addReplyMultiBulkLen(c,dictSize(modules));
    //遍历modules字典，获取每个模块的名字和版本
    while ((de = dictNext(di)) != NULL) {
        sds name = dictGetKey(de);
        struct RedisModule *module = dictGetVal(de);
        addReplyMultiBulkLen(c,4);
        addReplyBulkCString(c,"name");
        addReplyBulkCBuffer(c,name,sdslen(name));
        addReplyBulkCString(c,"ver");
        addReplyLongLong(c,module->ver);
    }
    dictReleaseIterator(di);
}

六、模块导出符号与Redis core函数映射

在Redis提供给模块的API中，API的名字都是类似RedisModule_<funcname>的形式，实际对应Redis core中的RM_<funcname>函数。目前只有一个例外就是RedisModule_Init这个模块API在Redis core中的名字也是RedisModule_Init。上面我们讲过，RedisModule_Init应该是模块入口RedisModule_OnLoad中第一个调用的函数。而RedisModule_OnLoad的工作就是完成了RedisModule_<funcname>与RM_<funcname>之间的关联建立关系。

下面我们首先以上面示例模块中的RedisModule_CreateCommand这个模块API为例，说明怎么关联到RM_CreateCommand上的，然后在说明为什么这样设计。

1、RedisModule_<funcname>与RM_<funcname>关联建立过程

1.1、首先在Redis启动的时候，会执行下面的初始化代码


int moduleRegisterApi(const char *funcname, void *funcptr) {
    return dictAdd(server.moduleapi, (char*)funcname, funcptr);
}

#define REGISTER_API(name) \
    moduleRegisterApi("RedisModule_" #name, (void *)(unsigned long)RM_ ## name)

/* Register all the APIs we export. Keep this function at the end of the
 * file so that‘s easy to seek it to add new entries. */
void moduleRegisterCoreAPI(void) {
    server.moduleapi = dictCreate(&moduleAPIDictType,NULL);
    ...
    //其他的接口同样需要通过REGISTER_API来注册
    REGISTER_API(CreateCommand);
    REGISTER_API(SetModuleAttribs);
    ...
}

上面代码等效于


//在server.moduleapi中将字符串"RedisModule_<funcname>"与函数RM_<funcname>的地址建立关联
dictAdd(server.moduleapi, "RedisModule_CreateCommand", RM_CreateCommand)
dictAdd(server.moduleapi, "RedisModule_SetModuleAttribs", RM_SetModuleAttribs)

1.2、在模块源码中包含redismodule.h头文件的时候，会把下面的代码包含进来


#define REDISMODULE_API_FUNC(x) (*x)
//其他的模块接口同样需要通过REDISMODULE_API_FUNC来定义与RM_<funcname>一致的函数指针RedisModule_<funcname>
int REDISMODULE_API_FUNC(RedisModule_CreateCommand)(RedisModuleCtx *ctx, const char *name, RedisModuleCmdFunc cmdfunc, const char *strflags, int firstkey, int lastkey, int keystep);
int REDISMODULE_API_FUNC(RedisModule_SetModuleAttribs)(RedisModuleCtx *ctx, const char *name, int ver, int apiver);

#define REDISMODULE_GET_API(name) \
    RedisModule_GetApi("RedisModule_" #name, ((void **)&RedisModule_ ## name))

static int RedisModule_Init(RedisModuleCtx *ctx, const char *name, int ver, int apiver) {
    void *getapifuncptr = ((void**)ctx)[0];
    RedisModule_GetApi = (int (*)(const char *, void *)) (unsigned long)getapifuncptr;

    ...
    //其他模块接口同样需要通过REDISMODULE_GET_API来初始化RedisModule_<funcname>指针
    REDISMODULE_GET_API(CreateCommand);
    REDISMODULE_GET_API(SetModuleAttribs);
    ...

    RedisModule_SetModuleAttribs(ctx,name,ver,apiver);
    return REDISMODULE_OK;
}

上面代码进行宏展开后等效如下


//定义与RM_<funcname>类型一致的函数指针RedisModule_<funcname>
int (*RedisModule_CreateCommand)(RedisModuleCtx *ctx, const char *name, RedisModuleCmdFunc cmdfunc, const char *strflags, int firstkey, int lastkey, int keystep);
int (*RedisModule_SetModuleAttribs)(RedisModuleCtx *ctx, const char *name, int ver, int apiver);

static int RedisModule_Init(RedisModuleCtx *ctx, const char *name, int ver, int apiver) {
    void *getapifuncptr = ((void**)ctx)[0];
    RedisModule_GetApi = (int (*)(const char *, void *)) (unsigned long)getapifuncptr;

    ...
    //其他模块接口同样需要通过REDISMODULE_GET_API来初始化RedisModule_<funcname>指针
    RedisModule_GetApi("RedisModule_CreateCommand",((void **)&RedisModule_CreateCommand);
    RedisModule_GetApi("RedisModule_SetModuleAttribs",((void **)&RedisModule_SetModuleAttribs);
    ...

    RedisModule_SetModuleAttribs(ctx,name,ver,apiver);
    return REDISMODULE_OK;
}

1.3、在上面moduleLoad加载模块的时候，我们看到会传递RedisModuleCtx ctx = REDISMODULE_CTX_INIT作为入参，调用RedisModule_OnLoad，并在RedisModule_OnLoad中调用RedisModule_Init。


#define REDISMODULE_CTX_INIT {(void*)(unsigned long)&RM_GetApi, NULL, NULL, NULL, 0, 0, 0, NULL, 0, NULL, NULL, 0, NULL}

/* 查找模块请求的API，并保存在targetPtrPtr中 */
int RM_GetApi(const char *funcname, void **targetPtrPtr) {
    dictEntry *he = dictFind(server.moduleapi, funcname);
    if (!he) return REDISMODULE_ERR;
    *targetPtrPtr = dictGetVal(he);
    return REDISMODULE_OK;
}

因此在函数RedisModule_Init实际执行的时候，相当于把RedisModule_<funcname>指针初始化为RM_<funcname>函数的地址了。因此随后在模块中调用RedisModule_<funcname>的时候，实际上调用的是RM_<funcname>。

2、为什么采用这种设计？

实际上在redismodule.h头文件或者模块源码中直接extern RM_<funcname>，也是可以直接访问RM_<funcname>这个函数的。那么为什么要在每个模块的源码中定一个指向RM_<funcname>的函数指针RedisModule_<funcname>，并通过RedisModule_<funcname>来访问模块API呢？

主要是考虑到后续升级的灵活性，模块可以有不同的API版本，虽然目前API版本只有一个，但是假如后续升级后，Redis支持了新版本的API。那么当不同API版本的模块向Redis注册的时候，Redis内核就可以根据注册的API版本，来把不同模块中的函数指针指向不同的API实现函数了。这类似以面向对象中依赖于抽象而不是依赖具体的设计思路。

补充说明：

1、在redis源码src/modules目录下给出了一些redis模块相关的示例和说明文档，是不错的学习资料。

2、https://github.com/antirez/redis/commit/85919f80ed675dad7f2bee25018fec2833b8bbde

来自为知笔记(Wiz)

时间： 2024-08-06 16:04:52

Redis4.0模块子系统实现简述

Redis4.0模块子系统实现简述的相关文章

redis-4.0.14 cluster 配置实战

CentOS6.9安装Redis4.0.0

Redis4.0 主从复制(PSYN2.0)

USGS-EROS项目espa-surface-reflectance中的LaSRC Version 1.3.0模块利用vs2010编译出windows64位版本（一）

CentOS7安装Redis4.0

Linux上编译Redis4.0.2

redis-4.0.1安装配置（CentOS 6.6）

linux7.0下2台服务器安装redis4.0.2集群

（十）Linux安装Redis-4.0.8