python和C语言混编的几种方式

  Python这些年风头一直很盛,占据了很多领域的位置,Web、大数据、人工智能、运维均有它的身影,甚至图形界面做的也很顺,乃至full-stack这个词语刚出来的时候,似乎就是为了描述它。

  Python虽有GIL的问题导致多线程无法充分利用多核,但后来的multiprocess可以从多进程的角度来利用多核,甚至affinity可以绑定具体的CPU核,这个问题也算得到解决。虽基本为全栈语言,但有的时候为了效率,可能还是会去考虑和C语言混编。混编是计算机里一个不可回避的话题,涉及的东西很多,技术、架构、团队情况、管理、客户等各个环节可能对其都有影响,混编这个问题我想到时候再开一贴专门讨论。本文只讲python和C混编的方式,大致有如下几种方式(本文背景是linux,其他平台可以类比):

  

  共享库

  使用C语言编译产生共享库,然后python使用ctype库里的cdll来打开共享库。

  举例如下,C语言代码为

/* func.c */int func(int a)
{
        return a*a;
}

  python代码为

#!/usr/bin/env python
#test_so.pyfrom ctypes import cdll
import os

p = os.getcwd() + ‘/libfunc.so‘
f = cdll.LoadLibrary(p)
print f.func(99)

  测试如下

$ gcc -fPIC -shared func.c -o libfunc.so
$ ./test_so.py
9801

  

  subprocess

  C语言设计一个完整的可执行文件,然后python通过subprocess来执行该可执行文件,本质上是fork+execve。

  举例如下,C语言代码为

/* test.c */
#include <stdio.h>
int func(int a)
{
        return a*a;
}

int main(int argc, char **argv)
{
        int x;

        sscanf(argv[1], "%d", &x);
        printf("%d\n", func(x));
        return 0;
}

  Python代码为

#!/usr/bin/env python
# test_subprocess.py
import os
import subprocess

subprocess.call([os.getcwd()+‘/a.out‘, ‘99‘])

  测试如下

$ gcc test.c -o a.out
$ ./test_subprocess.py
9801

  

  C语言中运行python程序

  C语言使用popen/system或者直接以系统调用级fork+exec来运行python程序也是一种混编的手段了。

  举例如下,Python代码如下

#!/usr/bin/env python
# test.py
import sys
x = int(sys.argv[1])
print x*x

  C语言代码如下

/* test.c */
#include <stdio.h>
#include <stdlib.h>
int main()
{
        FILE *f;
        char s[1024];
        int ret;

        f = popen("./test.py 99", "r");
        while((ret=fread(s,1,1024,f))>0) {
                fwrite(s,1,ret,stdout);
        }
        fclose(f);
        return 0;
}

  测试如下

$ gcc test.c
$ ./a.out
9801

  

  python对C语言扩展的支持

  很多编程语言都为C语言扩展添加了支持,这有两种原因:(1)语言设计之初,可以充分的利用C语言已有的库来做很多扩展;(2)C语言的运行效率高。

  python也不例外,从诞生那天起,很多库都是C语言写的。python的C语言扩展中涉及到python的数据结构与C语言的对应,扩展方法其实是用C语言编写一个共享库,只是这个共享库中的接口是一个规范的,可以被python识别的。

  为了说明如何扩展,我这里先假设一个在python下的函数功能,代码如下

def func(*a):
    res=1
    for i in range(len(a)):
        res *= sum(a[i])
    return res

  如上,希望的函数功能是,参数是任意多个数字组成的列表(姑且排除其他数据结构),返回每个列表的元素之和的乘积。

  姑且先把python代码写了,如下所示

#!/usr/bin/env python
# test.py
import colin

def func(*a):
    res=1
    for i in range(len(a)):
        res *= sum(a[i])
    return res

a = [1,2,3]
b = [4,5,6]
c = [7,8]
d = [9]
e = [10,11,12,13,14]

f = colin.func2(99)
g = colin.func3(a,b,c,d,e)
h = func3(a,b,c,d,e)
print "f = ",f
print "g = ",g
print "h = ",h

  带上之前一直测试的平方func,这个实现相对简单,希望python写出来的func可以和C语言扩展出来的结果一致。

  先用C语言写上这些函数的实现,其中func3用上了一个表示任意多个任意长的数组的数据结构y_t,而x_t用来表示单个数组。

/* colin.h */
#ifndef Colin_h
#define Colin_h
typedef struct {
        int *a;
        int len;
} x_t;
typedef struct {
        x_t *ax;
        int len;
} y_t;
int func2(int a);
int func3(y_t *p);
void free_y_t(y_t *p);
#endif

  

/* colin.c */
#include "colin.h"
#include <stdlib.h>

int func2(int a)
{
        return a*a;
}

int func3(y_t *p)
{
        int result;
        int sum;
        int i, j;

        result = 1;
        for(i=0;i<p->len;i++) {
                sum = 0;
                for(j=0;j<p->ax[i].len;j++)
                        sum += p->ax[i].a[j];
                result *= sum;
        }

        return result;
}

void free_y_t(y_t *p)
{
        int i;
        for(i=0;i<p->len;i++) {
                free(p->ax[i].a);
        }
        free(p->ax);
}

  上面定义了三个函数,func2代表平方,func3代表之前所说的功能,又因y_t这个结构可能都是动态分配出来的,所以给个归还内存的方法。

  刚才说过python扩展的话,需要把这个共享库的接口“标准化”一下。于是我们就包装一下,并给个python加载的入口。

/* wrap.c */
#include <Python.h>
#include <stdlib.h>
#include "colin.h"
PyObject* wrap_func2(PyObject* self, PyObject* args)
{
        int n, result;
        /* 从参数列表中导出一个整形,用"i" */
        if (!PyArg_ParseTuple(args, "i", &n))
                return NULL;

        /* 用C语言的库实现来计算 */
        result = func2(n);
        /* 计算结果必须要导成python识别的类型 */
        return Py_BuildValue("i", result);
}

PyObject* wrap_func3(PyObject* self, PyObject* args)
{
        int n, result;
        int i, j;
        int size, size2;
        PyObject *p,*q;
        y_t *y;

        y = malloc(sizeof(y_t));
        /* 先数数有多少个参数,也就是列表的个数 */
        size = PyTuple_Size(args);
        /* 把数组的个数先分配了 */
        y->len = size;
        y->ax = malloc(sizeof(x_t)*size);
        /* 遍历python里各个列表(参数) */
        for(i=0;i<size;i++) {
                /* 先获得第i个参数,是一个列表 */
                p = PyTuple_GetItem(args, i);
                /* 获得列表的长度 */
                size2 = PyList_Size(p);
                /* 为数组分配好空间 */
                y->ax[i].len = size2;
                y->ax[i].a = malloc(sizeof(int)*size2);
                /* 遍历列表,依次把列表里的数转到数组里 */
                for(j=0;j<size2;j++) {
                        q = PyList_GetItem(p, j);
                        PyArg_Parse(q,"i",&y->ax[i].a[j]);
                }
        }

        /* 用C语言的库实现来计算 */
        result = func3(y);
        free_y_t(y);
        free(y);
        /* 结果转成python识别格式 */
        return Py_BuildValue("i", result);
}

/* 这是接口列表,加载时是只加载此列表的地址,所以这个数据结构不能放栈(局部变量)内,会被清掉 */
static PyMethodDef colinMethods[] =
{
        {"func2", wrap_func2, METH_VARARGS, "Just a test"},
        {"func3", wrap_func3, METH_VARARGS, "Just a test"},
        {NULL, NULL, METH_NOARGS, NULL}
};

/* python加载的时候的接口 */
/* 注意,既然库名叫colin,此函数必须交initcolin */
void initcolin()
{
        PyObject *m;
        m = Py_InitModule("colin", colinMethods);
}

  过程中,我猜测PyArg_VaParse应该功能更为强大,可是反复测没有成功,也没细看文档。

  测试一下

$ gcc -I /usr/include/python2.7/ -fPIC -shared colin.c wrap.c -o colin.so
$ ./test.py
f =  9801
g =  729000
h =  729000

  可以看到,C语言写的函数和python写的函数结果一致。

  

时间: 2024-10-28 11:34:25

python和C语言混编的几种方式的相关文章

[转]php和html混编的三种方式

php和html混编的三种方式 以下内容转自:http://blog.i1728.com/post/110.html 原文标题是:<PHP的(<<>,新标题是我加的,文章里的红字也是我标注的: ---------------------------------------------- 07月22日 分类: 学习笔记 8条评论 16532 ℃ 在W3school 上学PHP,看到第一句就是“PHP 文件可包含文本.HTML 标签以及脚本” 在后来的学习别人的代码,发现在需要HTML

[整理]PHP/HTML混写的四种方式

PHP作为一款后端语言,为了输出给浏览器让浏览器呈现出来,无可避免的要输出HTML代码,下文介绍下我用过的三种PHP/HTML混编方法 1.单/双引号包围法 这是最初级的方法了,用法就像下面这样 1 <?php 2 echo ' 3 <!DOCTYPE html> 4 <html> 5 <head> 6 <title> </title> 7 </head> 8 <body> 9 <span>测试页面<

python利用unittest进行测试用例执行的几种方式

利用python进行测试时,测试用例的加载方式有2种: 一种是通过unittest.main()来启动所需测试的测试模块:  一种是添加到testsuite集合中再加载所有的被测试对象,而testsuit里存放的就是所需测试的用例,下面分别列出3种方法的具体使用方式:1.通过unittest.main()来执行测试用例的方式: import unittest class UCTestCase(unittest.TestCase):    def setUp(self):        #测试前需

iOS图文混排的几种方式

最近优化升级了之前做的一个项目,现在这一期已接近尾声了,今天可以腾出些时间总结一下最近项目中用的比较多的图片文字混排显示的内容.现在遇到比较多的图文混排的基本有三种:一种是在标签中显示 价格符号+价格+某种内部项目单位(如粮票符号)+数量,这种在项目中用的比较多些:第二种是商品详情中展示一段文字+一组图片或者是,一段文字+一张图片的数组形式展示,这种在详情中用的也不少:还有一种的和第二种类似,像是网页中的东西,这里就不多说了:下面说说前两种比较常用的图文混排展示的方式: 1.,在标签中显示价格单

C语言 函数指针定义三种方式

//函数指针 #include<stdio.h> #include<stdlib.h> #include<string.h> //函数指针类型跟数组类型非常相似 //函数名就是函数的地址,函数的指针,对函数名进行&取地址操作,还是函数名本身,这是C语言编译器的特殊处理 void test(int a){ printf("a=%d\n",a); } void ProtectA(){ //定义函数类型 typedef void(FunType)(

python paramiko 验证和发送命令的几种方式

法1:使用 exec.command(),此方法不适合用 sudu su不输入密码的状况 #!/usr/bin/env python import paramiko hostname='172.16.88.117' username='liuqian' pk_path='/home/liuqian/.ssh/id_rsa' try: key=paramiko.RSAKey.from_private_key_file(pk_path) except paramiko.PasswordRequire

Python 2.7获取网站源代码的几种方式

1 #coding:utf-8 2 import urllib2,cookielib 3 4 if __name__ == '__main__': 5 root_url='https://www.baidu.com/' 6 # 第一种 7 print "第一种" 8 response1=urllib2.urlopen(root_url) 9 print response1.getcode() 10 print len(response1.read()) 11 12 #第二种 13 pr

Python 2.7获取网站源代码的几种方式_20160924

1 #coding:utf-8 2 import urllib2,cookielib 3 4 if __name__ == '__main__': 5 root_url='https://www.baidu.com/' 6 # 第一种 7 print "第一种" 8 response1=urllib2.urlopen(root_url) 9 print response1.getcode() 10 print len(response1.read()) 11 12 #第二种 13 pr

C 语言字符串连接的 3种方式

#include<stdio.h> #include<stdlib.h> #include<string.h> char *join1(char *, char*); void join2(char *, char *); char *join3(char *, char*); int main(void) { char a[4] = "abc"; // char *a = "abc" char b[4] = "def&