golang 编码转化

在网上搜索golang编码转化时,我们经常看到的文章是使用下面一些第三方库:

https://github.com/djimenez/iconv-go

https://github.com/qiniu/iconv

如果我们在windows下使用这个库,会看到错误:

iconv.go:6:20: fatal error: iconv.h: No such file or directory
compilation terminated.

这是因为需要系统有 iconv.h 文件。 linux、mac下自带了这个,windows 下没有。

如何让win下有这个C的代码,网上一堆说法。

比如,

1、使用 cygwin

https://github.com/qiniu/iconv/issues/6 

在cygwin中安装gcc编译器
http://qichunren.iteye.com/blog/214527

反正这个环境,我在win下没有搭建起来,网上能看到这么说的:

go is not compatible with cygwin (either 32bit or 64bit), please use mingw.

https://code.google.com/p/go/issues/detail?id=7265

 

2、有人推荐使用 tdm gcc mingw

http://zhidao.baidu.com/question/744915659430101412.html

后来 install tdm gcc mingw to selove bellow problem 解决问题.
http://tdm-gcc.tdragon.net/download

这套方案我也没有搞定。

 

3、至于使用 mingw 的方案, 也没搞定。

最后搞定的方式,是发现有个直接用Go实现编码转化的包:

对应的代码如下:

import (
    "bytes"
    "code.google.com/p/go.text/encoding/simplifiedchinese"
    "code.google.com/p/go.text/transform"
    "io/ioutil"
)
func Decode(s []byte) ([]byte, error) {
    I := bytes.NewReader(s)
    defer I.Close()
    O := transform.NewReader(I, simplifiedchinese.GBK.NewDecoder())
    defer O.Close()
    d, e := ioutil.ReadAll(O)
    if e != nil {
        return nil, e
    }
    return d, nil
}

需要注意的是,上面代码用的包在 code.google.com/p/go.text , 这些包都被迁移到 golang.org/x 这里了, 对应的迁移映射关系如下: 

code.google.com/p/go.benchmarks -> golang.org/x/benchmarks

code.google.com/p/go.blog -> golang.org/x/blog

code.google.com/p/go.crypto -> golang.org/x/crypto

code.google.com/p/go.exp -> golang.org/x/exp

code.google.com/p/go.image -> golang.org/x/image

code.google.com/p/go.mobile -> golang.org/x/mobile

code.google.com/p/go.net -> golang.org/x/net

code.google.com/p/go.sys -> golang.org/x/sys

code.google.com/p/go.talks -> golang.org/x/talks

code.google.com/p/go.text -> golang.org/x/text

code.google.com/p/go.tools -> golang.org/x/tools

 

相关参考资料:

Golang 字符编码
http://www.cnblogs.com/lyqf365/p/3739533.html

这里有下载网页并转码的例子。

Go的官方编码转换包
http://blog.raphaelzhang.com/2014/01/go-official-support-for-charset-encoding/

Go如何处理zip中的中文文件名
http://my.oschina.net/chai2010/blog/186211

http://bbs.carlaau.com/go/t73-1-1.html

go language how to convert ansi text to utf8?
http://stackoverflow.com/questions/6927611/go-language-how-to-convert-ansi-text-to-utf8/6933412#6933412

 

 

另外,还有一个 go-charset 包(https://code.google.com/p/go-charset/

相关文档在:

https://godoc.org/code.google.com/p/go-charset/charset

它支持下面这些编码的转换。

big5 ibm437 ibm850 ibm866 iso-8859-1 iso-8859-10 iso-8859-15 iso-8859-2 iso-8859-3 iso-8859-4 iso-8859-5 iso-8859-6 iso-8859-7 iso-8859-8 iso-8859-9 koi8-r utf-16 utf-16be utf-16le utf-8 windows-1250 windows-1251 windows-1252

它的相关例子请参考:http://stackoverflow.com/questions/24555819/golang-persist-using-iso-8859-1-charset

package main

import (
    "bytes"
    "code.google.com/p/go-charset/charset"
    _ "code.google.com/p/go-charset/data"
    "fmt"
    "io/ioutil"
    "strings"
)

func toISO88591(utf8 string) (string, error) {
    buf := new(bytes.Buffer)
    w, err := charset.NewWriter("latin1", buf)
    if err != nil {
        return "", err
    }
    fmt.Fprintf(w, utf8)
    w.Close()
    return buf.String(), nil
}

func fromISO88591(iso88591 string) (string, error) {
    r, err := charset.NewReader("latin1", strings.NewReader(iso88591))
    if err != nil {
        return "", err
    }
    buf, err := ioutil.ReadAll(r)
    if err != nil {
        return "", err
    }
    return string(buf), nil
}

func main() {
    utfi := "£5 for Peppé"
    fmt.Printf("%q\n", utfi)
    iso, err := toISO88591(utfi)
    if err != nil {
        fmt.Println(err)
    }
    fmt.Printf("%q\n", iso)
    utfo, err := fromISO88591(iso)
    if err != nil {
        fmt.Println(err)
    }
    fmt.Printf("%q\n", utfo)
    fmt.Println(utfi == utfo)
}

上面代码的输出:

"£5 for Peppé"
"\xa35 for Pepp\xe9"
"£5 for Peppé"
true
时间: 2024-10-07 22:43:17

golang 编码转化的相关文章

golang编码转换

在网上搜索golang编码转化时,我们经常看到的文章是使用下面一些第三方库: https://github.com/djimenez/iconv-go https://github.com/qiniu/iconv 如果我们在windows下使用这个库,会看到错误: iconv.go:6:20: fatal error: iconv.h: No such file or directory compilation terminated. 这是因为需要系统有 iconv.h 文件. linux.ma

IOS编码转化

原文地址:http://blog.csdn.net/huifeidexin_1/article/details/7883984 iOS中编码转化 1.UTF-8转化 NSString *data = @"你好,北京!"; //转换成UTF-8 NSString *dataUTF8 = [datastringByAddingPercentEscapesUsingEncoding:NSUTF8StringEncoding]; NSLog(@"%@",dataUTF8);

宽字符、多字节、unicode、utf-8、gbk编码转化

今天遇到一个编码的问题,困惑了我很长时间,所以就简要的的了解了一下常用的编码类型. 我们最常见的是assic编码,它是一种单字节编码,对多容纳256个字符. 我们在编程的时候经常遇到unicode,unicode是一种宽字节编码,能够很好的融合世界各个国家的字符,具有国际通用性,所谓宽字符其实使用两个字节来表示一个符号. 而utf8是一种多字节编码,一个字符所占用的字节数不确定,是对unicode的精简版本,也用具有世界通用性.Gbk也是一种双字节编码,其实就是对中文简体的一种编码,不具有世界通

Nodejs编码转化问题

目前Node.js仅支持hex.utf8.ascii.binary.base64.ucs2几种编码的转换.对于GBK,GB2312等编码,Nodejs自带的toString()方法不支持,因此中文转化的时候需要加载第三方库,主要有两个编码转换库iconv-lite和encoding,个人推荐使用encoding. iconv-lite:是 iconv 的纯 js 实现,支持的编码包括 node.js 原生编码:utf8, ucs2, ascii, binary, base64:同时支持广泛使用的

golang 编码转换 gbk转码utf 爬虫中文乱码

golang仅支持utf-8, 使用爬虫时经常遇到不是utf-8编码的文件, 如果抓取则会造成文字乱码 1. 下载导入包 import "github.com/axgle/mahonia" 2. 定义函数 func ConvertToString(src string, srcCode string, tagCode string) string { srcCoder := mahonia.NewDecoder(srcCode) srcResult := srcCoder.Conver

Golang编码规范

原文链接:https://github.com/golang/go/wiki/CodeReviewComments 1)用 goimport 代替 gofmt 2) https://golang.org/doc/effective_go.html#commentary 注释单独一行,开始于描述的名字,结束于..没看明白 3)context.Context的值包含:跨API和流程边界的安全凭证,跟踪信息,截止日期和取消信号. 大多数函数用Context应该作为第一个参数接收 从不特别请求的函数可以

native2ascii -- 编码转化工具

参考文档 http://blog.chinaunix.net/uid-692788-id-2681133.html 功能说明 Java 编译器和其它 Java 工具只能处理含有 Latin-1 和/或 Unicode 编码(udddd 记号)字符的文件.native2ascii 将含有其它字符编码的文件转换成含 Latin-1 和/或 Unicode 编码字符的文件.若省略 outputfile,则使用标准输出设备输出.此外,如果也省略 inputfile,则使用标准输入设备输入. 语法:nat

将UTF8编码转化为中文 - NSString方法

方法一: 代码如下,如有更好的方法 麻烦贴出来,这个方法是通过webview进行解码的 UIWebView *web = [[UIWebView alloc] init]; NSString *tsw = @"%E4%B8%AD%E5%9B%BD"; NSString *sc = [NSString stringWithFormat:@"decodeURIComponent('%@')",tsw]; NSString *st = [web stringByEvalu

报表开发工具中mysql数据库连接编码转化失效解决方案

1. 问题描述 在报表开发工具FineReport中,mysql数据库连接通过数据连接编码转换进行编码的转换,在通过报表录入往数据库中录入中文数据的时候,总是出现乱码,这个该怎么解决呢? 2. 解决方案 2.1 检查系统的默认字体 例如查看windows下C/window/fonts的字体样式,如下图: 如果没有以上字体,百度一下缺少字体自行安装,安装之后,已经包含以上的字体如果还是出现问题,则需要参看及修改MySQL字符集. 2.2 参看及修改MySQL字符集 · 查看MySql字符集 MyS