Linux iconv使用

iconv [选项】文件

输入/输出格式规范:
-f,
--from-code=名称 原始文本编码
-t, --to-code=名称
输出编码

信息:
-l, --list
列举所有已知的字符集

输出控制:
-c
从输出中忽略无效的字符
-o, --output=FILE 输出文件
-s, --silent
关闭警告
--verbose
打印进度信息

所以,我在程序的末尾直接加了一句
iconv -f utf-8 -t
gb2312 /server_test/reports/software_.txt >
/server_test/reports/software_asserts.txt
解决了问题。

在网上查了些资料还知道在LINUX上进行编码转换时,还可以利用iconv函数族编程实现。

/*以下内容摘自[url]http://www.xrss.cn/Info/10425.Html[/url]*/

iconv函数族的头文件是iconv.h,使用前需包含之。
#include
<iconv.h>
iconv函数族有三个函数,原型如下:
(1) iconv_t
iconv_open(const char *tocode, const char
*fromcode);
此函数说明将要进行哪两种编码的转换,tocode是目标编码,fromcode是原编码,该函数返回一个转换句柄,供以下两个函数使用。
(2)
size_t iconv(iconv_t cd,char **inbuf,size_t *inbytesleft,char **outbuf,size_t
*outbytesleft);
此函数从inbuf中读取字符,转换后输出到outbuf中,inbytesleft用以记录还未转换的字符数,outbytesleft用以记录输出缓冲的剩余空间。
(3) int iconv_close(iconv_t
cd);
此函数用于关闭转换句柄,释放资源。
例子1:
用C语言实现的转换示例程序

/* f.c : 代码转换示例C程序 */
#include
<iconv.h>
#define OUTLEN
255
main()
{
char *in_utf8 =
"姝e?ㄥ??瑁?";
char *in_gb2312 = "正在安装";
char
out[OUTLEN];

//unicode码转为gb2312码
rc =
u2g(in_utf8,strlen(in_utf8),out,OUTLEN);
printf("unicode-->gb2312
out=%sn",out);
//gb2312码转为unicode码
rc =
g2u(in_gb2312,strlen(in_gb2312),out,OUTLEN);
printf("gb2312-->unicode
out=%sn",out);
}
//代码转换:从一种编码转为另一种编码
int
code_convert(char *from_charset,char *to_charset,char *inbuf,int inlen,char
*outbuf,int outlen)
{
iconv_t
cd;
int rc;
char **pin =
&inbuf;
char **pout = &outbuf;

cd =
iconv_open(to_charset,from_charset);
if (cd==0) return
-1;
memset(outbuf,0,outlen);
if
(iconv(cd,pin,&inlen,pout,&outlen)==-1) return
-1;
iconv_close(cd);
return
0;
}
//UNICODE码转为GB2312码
int
u2g(char *inbuf,int inlen,char *outbuf,int
outlen)
{
return
code_convert("utf-8","gb2312",inbuf,inlen,outbuf,outlen);
}
//GB2312码转为UNICODE码
int
g2u(char *inbuf,size_t inlen,char *outbuf,size_t
outlen)
{
return
code_convert("gb2312","utf-8",inbuf,inlen,outbuf,outlen);
}

例子2:
用C++语言实现的转换示例程序

/* f.cpp : 代码转换示例C++程序
*/
#include <iconv.h>
#include
<iostream>

#define OUTLEN
255

using namespace std;

//
代码转换操作类
class CodeConverter
{
private:
iconv_t
cd;
public:
//
构造
CodeConverter(const char *from_charset,const char
*to_charset) {
cd =
iconv_open(to_charset,from_charset);
}

//
析构
~CodeConverter()
{
iconv_close(cd);
}

//
转换输出
int convert(char *inbuf,int inlen,char *outbuf,int outlen)
{
char **pin = &inbuf;
char **pout =
&outbuf;

memset(outbuf,0,outlen);
return
iconv(cd,pin,(size_t *)&inlen,pout,(size_t
*)&outlen);
}
};

int
main(int argc, char **argv)
{
char *in_utf8 =
"姝e?ㄥ??瑁?";
char *in_gb2312 = "正在安装";
char
out[OUTLEN];

//
utf-8-->gb2312
CodeConverter cc =
CodeConverter("utf-8","gb2312");
cc.convert(in_utf8,strlen(in_utf8),out,OUTLEN);
cout
<< "utf-8-->gb2312 in=" << in_utf8 << ",out=" << out
<< endl;

//
gb2312-->utf-8
CodeConverter cc2 =
CodeConverter("gb2312","utf-8");
cc2.convert(in_gb2312,strlen(in_gb2312),out,OUTLEN);
cout
<< "gb2312-->utf-8 in=" << in_gb2312 << ",out=" <<
out << endl;
}

Linux iconv使用,码迷,mamicode.com

时间: 2024-10-11 12:58:26

Linux iconv使用的相关文章

linux iconv文件编码转换

linux系统里提供的文件转化编码的命令iconv,例如: iconv -t utf-8 -f gb2312 -c test.xml > text_UTF8.xml 1 -f 源编码-t 目标编码-c 忽略无法转换的字符 如果想批量转换,只需要执行如下两行命令即可: find folder -type d -exec mkdir -p utf/{} \; find floder -type f -exec iconv -f GB2312 -t UTF-8 {} -o utf/{} \; 1 2

C++用iconv进行页面字符转换

在对HTML页面进行爬取时,总会遇到一些不同的编码,而我们通常都不会一一对这些编码进行处理,而是集体转换成相同的编码,也易于装入数据库.此时,iconv便成为一个很方便的工具. iconv 头文件"iconv.h".iconv命令可以将一种已知的字符集文件转换成另一种已知的字符集文件. 它的作用是在多种国际编码格式之间进行文本内码的转换. linux下的函数原型 size_t iconv(iconv_t cd, char **inbuf, size_t *inbytesleft, ch

shell脚本gbk环境下搜索utf-8日志

方法1: 使用linux iconv将utf-8日志转为gbk编码的文件,然后gbk环境下统计数据. utf8(){ LOG_FILE="/lcims/crontab_shell/outfile/lan_wlan_wo/SocketMain.log141114_lan1" LOG_FILE_TMP="/lcims/crontab_shell/outfile/lan_wlan_wo/141114_lan1" echo "utf-8-----" #o

在Linux/Unix系统下用iconv命令处理文本文件中文乱码问题

iconv命令是运行于linux/unix平台的文件编码装换工具.当我们在linux/unix系统shell查看文本文件时,常常会发现文件的中文是乱码的,这是由于文本文件的编码与当前操作系统设置的编码不同而引起的,这时可以使用iconv进行编码转换,从而解决乱码问题. 解决文本文件乱码问题分3步:1.确定文件编码,2.确定iconv是否支持此编码的转换,3.确定Linux/Unix操作系统编码,4.转换文件编码为与系统编码一致:下面通过对test.txt文件来举例. 1. 使用file命令来确定

linux下转格式函数iconv段错误

今天将windows代码移植到Linux下,其中用到了Unicode转char的函数,被坑了一会,相关函数及编码格式,Linux与windows不同,有几点需要注意: 1.wchar_t 在Linux下占用4个字节,在windows下占2个字节: 2.Linux默认的文本编码方式是UTF-8:Linux终端汉字显示的设置方式:vi /etc/sysconfig/i18n: 设置LANG="en_US.UTF-8"或者LANG="zh_CN.UTF-8": 3.ico

关于linux中的iconv转码

在Linux中iconv是一个用来转码的命令,在将数据文件导入到数据库中的时候经经常会遇到,数据文件的字符编码格式和数据库中要求的字符编码格式不一致,这时就会经常用到iconv这个命令 iconv  常用参数 -f 原编码-t 目标编码-c 忽略无法转换的字符 将GBK格式文件(test1.txt)转换成UTF-8格式文件(test2.txt) iconv -c -f GBK -c UTF-8 test.txt > test2.txt 注:此时文件test1并没有删除 iconv有时会和另外一个

linux命令系列之iconv

转载至:http://blog.csdn.net/eroswang/article/details/3847304 iconv的用法: 用法: iconv [选项...] [文件...] Convert encoding of given files from one encoding to another. 输入/输出格式规范: -f, --from-code=NAME       原始文本编码 -t, --to-code=NAME         输出编码 信息: -l, --list   

Linux下批量把GDK编码的文章转化为UTF-8编码的文章以及“iconv: 未知 xxx 处的非法输入序列”错误处理

Linux下批量转换GBK文件到UTF-8编码方法 查看文件编码 file -i filename 1.递归转换(包括子文件夹) find default -type d -exec mkdir -p utf/{} \; find default -type f -exec iconv -f GBK -t UTF-8 {} -o utf/{} \; 这两行命令将default目录下的文件由GBK编码转换为UTF-8编码,目录结构不变,转码后的文件保存在utf/default目录下. 2.转换 命

Linux下安装libiconv使php支持iconv函数

libiconv组件安装好了可以让我们php支持iconv函数了,这个函数的作用就是字符编码强制转换了,下面和111cn小编一起来看一个Linux中安装libiconv使php支持iconv函数的例子吧. 问题: 线上运行的lamp服务器,php不支持iconv函数. 解决方法: 安装libiconv,重新编译apache,使php支持iconv函数,实现utf-8和gb2312编码的转换. 具体步骤: 1.下载libiconv cd /usr/local/src wget http://ftp