RFC3986编码 C 语言实现(支持大部分中文)

  前些时间做 xauth
认证程序的编写,网上找到RFC3986编码不支持中文的编码,所以便查找了一些资料.自己写了一个,代码如下.


#include <stdlib.h>
#include <string.h>
#include <stdio.h>
#include <android/log.h>
#include "RFC3986Encoder.h"

bool isReverseChar(char c);
char* charToHexString(char c);
bool isChinese(char c);

//#define snprintf _snprintf
/**
* Escape ‘string‘ according to RFC3986 and
* http://oauth.net/core/1.0/#encoding_parameters.
*
* @param string The data to be encoded
* @return encoded string otherwise NULL
* The caller must free the returned string.
*/

static void *xmalloc_fatal(size_t size) {
if (size==0) return NULL;
fprintf(stderr, "Out of memory.");
exit(1);
}

void *xrealloc (void *ptr, size_t size) {
void *p = realloc (ptr, size);
if (p == NULL) return xmalloc_fatal(size);
return p;
}

void *xmalloc (size_t size) {
void *ptr = malloc (size);
if (ptr == NULL) return xmalloc_fatal(size);
return ptr;
}

char *xstrdup (const char *s) {
void *ptr = xmalloc(strlen(s)+1);
strcpy((char *)ptr, s);
return (char*)ptr;
}

char *oauth_url_escape(const char *string) {
size_t alloc, newlen;
char *ns = NULL, *testing_ptr = NULL;
unsigned char in;
size_t strindex=0;
size_t length;

if (!string) return xstrdup("");

alloc = strlen(string)+1;
newlen = alloc;

ns = (char*) xmalloc(alloc);

length = alloc-1;
while(length--) {
in = *string;

switch(in){
case ‘0‘: case ‘1‘: case ‘2‘: case ‘3‘: case ‘4‘:
case ‘5‘: case ‘6‘: case ‘7‘: case ‘8‘: case ‘9‘:
case ‘a‘: case ‘b‘: case ‘c‘: case ‘d‘: case ‘e‘:
case ‘f‘: case ‘g‘: case ‘h‘: case ‘i‘: case ‘j‘:
case ‘k‘: case ‘l‘: case ‘m‘: case ‘n‘: case ‘o‘:
case ‘p‘: case ‘q‘: case ‘r‘: case ‘s‘: case ‘t‘:
case ‘u‘: case ‘v‘: case ‘w‘: case ‘x‘: case ‘y‘: case ‘z‘:
case ‘A‘: case ‘B‘: case ‘C‘: case ‘D‘: case ‘E‘:
case ‘F‘: case ‘G‘: case ‘H‘: case ‘I‘: case ‘J‘:
case ‘K‘: case ‘L‘: case ‘M‘: case ‘N‘: case ‘O‘:
case ‘P‘: case ‘Q‘: case ‘R‘: case ‘S‘: case ‘T‘:
case ‘U‘: case ‘V‘: case ‘W‘: case ‘X‘: case ‘Y‘: case ‘Z‘:
case ‘_‘: case ‘~‘: case ‘.‘: case ‘-‘:
ns[strindex++]=in;
break;
default:
newlen += 2; /* this‘ll become a %XX */
if(newlen > alloc) {
alloc *= 2;
testing_ptr = (char*) xrealloc(ns, alloc);
ns = testing_ptr;
}

//转换成16进制. 58-->3A
//%3A 这是3个.这里好像是自动 加 ‘/0‘ 如果生成的的字符串,大于4则不会,自动加/0
//在linux 下,这个方法,的count 包括 ‘/0‘所以最后的结果也是正确的.

int result = snprintf(&ns[strindex], 4, "%%%02X", in);

/*
printf("%d\n",result);

printf("%d\n",in);

printf("strlen(buf) = %d\n",strlen(ns));
printf("%s\n",ns);
*/

strindex+=3;
break;
}
string++;
}
ns[strindex]=0;
return ns;
}

#ifndef ISXDIGIT
# define ISXDIGIT(x) (isxdigit((int) ((unsigned char)x)))
#endif

//自己写的代码 3
char* rfc3986Encoder(const char* input)
{
//__android_log_print(ANDROID_LOG_INFO, "Test_jni","encoder start %s\n", input);

if (!input) return xstrdup("");

//char* sb = (char*)malloc(1024);
char* sb = new char[1024];
sb[0]= ‘\0‘;
int length = strlen(input);
for (int i = 0; i<length; i++)
{
char c = input[i];
if(isReverseChar(c)){
const char* temp;
if(isChinese(c))
{
//这里认为汉字 utf-8为三字节,首位为连续三个1,取unicode的后8位
//这里相于 utf-8 到 unicode 的转换,只是转换了后8位.
int high = (input[i+1]&0x03)<<6;
int low = input[i+2]&0x3f;
char chinese = (high+low)&0xff;
temp = charToHexString(chinese);
i+=2;
}else{
temp = charToHexString(c);
}
strcat(sb,temp);
}
else{
int len = strlen(sb);
const char* p = &c; //字符看不到结束符,所以会错.
strcat(sb,p);
sb[len+1] = ‘\0‘;
}
}
//__android_log_print(ANDROID_LOG_INFO, "Test_jni","encoder end %s\n", sb);
return sb;
}

bool isReverseChar(char c)
{
return !((c >= ‘a‘ && c <= ‘z‘) || (c >= ‘A‘ && c <= ‘Z‘) || (c >= ‘0‘ && c <= ‘9‘)
|| c == ‘-‘ || c == ‘_‘ || c == ‘.‘ || c == ‘~‘);
}

char* charToHexString(char src){
int v = src & 0xFF;
char* hv = new char[4];
snprintf(hv, 4,"%%%02X",v);
return hv ;
}
bool isChinese(char c)
{
int x = c&0xE0;
if(x == 224)
return true;
else
return false;
}

如程序中体现的,oauth_url_escape() 这个方法不支持对中文的编码
,所以我便另外写了个方法   rfc3986Encoder().如程序中所说,我这里认为UTF8  汉字为  3
byte ,所以已经包含了大部分的汉字.具体的参考资料当时没做笔记,大该就是关于 UTF8 汉字编码的问题.程序思想,也比较好懂.研读java
的RFC3986编码实现,发现其获取utf8汉字的编码实际为unicode 编码的后8位.所以我这里把 utf8 向 unicode
编码的转化,只取了后8位,再转换成 hex 的形式.代码我做了部分测试,目前还没有发现什么问题.

RFC3986编码 C 语言实现(支持大部分中文),布布扣,bubuko.com

时间: 2024-10-27 08:44:53

RFC3986编码 C 语言实现(支持大部分中文)的相关文章

解决IE9支持CSS中文字体经验篇

如何让CSS中使用中文字体后仍然在IE9浏览器显示兼容.(音乐放松椅) 一.CSS中文字体IE9兼容出现问题CSS中使用中文字体后Line-height样式在IE9浏览器垂直上下居中样式失效. 二.解决IE9兼容中文字体将CSS中使用中文字体的中文字转化为Unicode编码然后替代.最终设置字体效果将不受转换编码而影响同时也兼容了Line-height垂直居中样式,同时IE9即可兼容CSS中使用常用中文字体.(音乐放松椅) 常见字体转换:黑体:\9ED1\4F53宋体:\5B8B\4F53微软雅

Cassandra在CQL语言层面支持多种数据类型

Cassandra在CQL语言层面支持多种数据类型. CQL类型 对应Java类型 描述 ascii String ascii字符串 bigint long 64位整数 blob ByteBuffer/byte[] 二进制数组 boolean boolean 布尔 counter long 计数器,支持原子性的增减,不支持直接赋值 decimal BigDecimal 高精度小数 double double 64位浮点数 float float 32位浮点数 inet InetAddress i

用JIRA管理你的项目——(二)JIRA语言包支持及插件支持

昨天兴奋地把JIRA环境搭好,瞅了一眼管理界面——全英文,真是汗! 尚且不说全中文版管理界面让人操作起来多少会有困难,更别说是全英文!  昨天赞叹JIRA语言包支持丰富,今天终于找到了号称100%的语言支持包! 在这里找到了JIRA4.2系列的中文支持包!  号称汉化100%,下载下来验验! Shell代码   wget http://www.confluence.cn/download/attachments/5668914/language_zh_CN.jar 直接覆盖JIRA系统中的语言包

Qt学习笔记-嵌入式qt程序支持显示中文

移植后得qt程序在开发板上运行时无法显示中文. 拷贝windows中的字体也不行. 从网上找到方法. 添加以下代码:需要头文件  #include <QTextCodec> QTextCodec::setCodecForLocale(QTextCodec::codecForName("UTF-8")); QTextCodec::setCodecForTr(QTextCodec::codecForName("UTF-8")); //支持Tr中文 QText

utf-8页面展示 gbk编码的js,gbk中有中文

index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv=&qu

一个GO语言 的文档中文译本网站

一个GO语言 的文档中文译本网站: 1. <学习Go语言>中文版:http://mikespook.com/learning-go/ 2.GITHUB :https://github.com/mikespook/Learning-Go-zh-cn 一个GO语言 的文档中文译本网站,布布扣,bubuko.com

Apache服务之php/perl/cgi语言的支持

安装php软件包: 安装文本浏览器 安装apache的帮助文档: 测试下是否ok 启动Apache服务关闭火墙: 编辑一个php测试页测试下: perl语言包默认系统已经安装了,直接测试下: Apache服务队cgi语言的配置: 测试下是否ok 在apache服务的主目录下有index.Php文件和apache.html文件,为什么要先执行php文件呢? apache的配置文件最前面写的是这些服务: 所以apache服务启动时会优先考虑这下面的服务 Apache服务之php/perl/cgi语言

Linux下MySQL 5.5的修改字符集编码为UTF8(彻底解决中文乱码问题)

一.登录MySQL查看用SHOW VARIABLES LIKE ‘character%’;下字符集,显示如下:+--------------------------+----------------------------+| Variable_name | Value |+--------------------------+----------------------------+| character_set_client | utf8 || character_set_connectio

iOS 10.3 APFS 不支持大部分的非英文字符解决方案

背景 最近开发辞书软件的时发现离线包音频无法在iOS 10.3进行播放,经过调查发现是iOS 10.3使用了苹果的新文件系统APFS,而APFS不支持大部分的非英文字符类似(zi? ca?n xi?ng hui?).导致SSZipArchive无法解压出带音标的文件.而在整个解压过程中程序没有任何异常.最后确定问题是iOS 10.3 使用的APFS系统上fopen()无法打开带音标的文件名,且整个过程没有任何错误信息和异常警告. 官方介绍 APFS is currently unusable w