Go语言中byte类型和rune类型（五）

本篇内容本来准备在上一篇写的，想了想还是拆开写。

go语言中字符串需要使用用双引号，而单引号用来表示单个的字符，字符也是组成字符串的元素。go语言的字符有两种：

uint8类型，或者叫 byte 型，代表了ASCII码的一个字符。
rune类型，代表一个 UTF-8字符。

ASCII编码是1个字节，而UTF-8是可变长的编码，当要表示中文等非ASCll编码的字符时，需要使用UTF-8编码来保证不会乱码。

举个例子，来遍历打印一个字符串，当使用byte类型时：

func main() {
    str:="hello 世界"
    for i:=0;i<len(str);i++{
        fmt.Printf("%c",str[i]) // hello ä¸ç
    }
}

上面结果，英文字符正确打印，但中文乱码。是因为UTF8编码下一个中文汉字由3~4个字节组成，而字符串是由byte字节组成，所以长度也是byte字符长度，这样遍历时遇到中文就乱码了。

遇到这种带中文的字符串，可以使用go提供的另一个方法来遍历：

func main() {
    str:="hello 世界"
    for _,r:=range str{
        fmt.Printf("%c",r) // hello 世界
    }
}

使用range，其实是使用rune类型来编码的，rune类型用来表示utf8字符，一个rune字符由一个或多个byte组成。

修改字符串

所谓对字符串的修改其实不是对字符串本身的修改，而是复制字符串，同时修改值，即重新分配来内存。

在go中修改字符串，需要先将字符串转化成数组，[]byte 或 []rune，然后再转换成 string型。

对于全是ASCII编码的字符串：

func main() {
    str:="abc"
    s2:=[]byte(str)
    s2[0]=‘b‘
    fmt.Println(string(s2)) //bbc
}

对于包含非ASCII编码的字符串：

func main() {
    str:="白猫"
    s2:=[]rune(str)
    s2[0]=‘黑‘
    fmt.Println(string(s2)) //黑猫
}

上面使用到的 string()，表示强制类型转换，转换为字符串。

本篇主要介绍 byte 和 rune 两种类型的字符，涉及到的for循环和强制类型转换可以简单了解下，有编程基础的很容易懂。

原文地址：https://www.cnblogs.com/wjaaron/p/11485685.html

时间： 2024-10-20 00:19:17

Go语言中byte类型和rune类型（五）的相关文章

着重基础之—MySql Blob类型和Text类型

着重基础之—MySql Blob类型和Text类型—二进制存储在经历了几个Java项目后,遇到了一些问题,在解决问题中体会到基础需要不断的回顾与巩固. 最近做的项目中,提供给接口调用方数据同步接口,传输的数据格式是Json串.由于json串的结构层级较多,数据量也不少.在设计数据库的时候,选择了Blob类型做为字段类型.一切的一切就打这开始,同步服务正常运作,但是问题慢慢的暴露了出来,客户端在暂时我所提供的数据的时候,中文总是显示乱码,乱码,乱码,一直乱码. 问题的分析路径 1.查看了数据库连

Timestame类型和String 类型的转化

Timestame类型和String 类型的转化 String转化为Timestamp: SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");String time = df.format(new Date());Timestamp ts = Timestamp.valueOf(time); Timestamp转化为String: SimpleDateFormat df = new SimpleDateFo

python3.5 的str类型和bytes类型的转换

在python3.x里增加了bytes类型,并且对str方法进行了修改,让str类型和bytes类型可以相互转换. #!/usr/bin/env python # -*- coding:utf-8 -*- a = "哈哈" #字符串转换成字节 b = bytes(a,encoding='utf-8') print(b) b1 = bytes(a,encoding='gbk') print(b1) #将字节转换成字符 c=str(b,encoding='utf-8') print(c)

java date类型和calendar类型区别

Date类在JDK1.0中,Date类是唯一的一个代表时间的类,但是由于Date类不便于实现国际化,所以从JDK1.1版本开始,推荐使用Calendar类进行时间和日期处理.这里简单介绍一下Date类的使用. 1.使用Date类代表当前系统时间 Date d = new Date(); System.out.println(d); 使用Date类的默认构造方法创建出的对象就代表当前时间,由于Date类覆盖了toString方法,所以可以直接输出Date类型的对象,显示的结果如下: Sun Ma

Date类型和Long类型的相互转换

Date类型和Long类型的相互转换: import java.text.SimpleDateFormat; import java.util.Date; public class T { public static void main(String[] args) throws Exception { SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); // 1.Date类型转Long类型 // pa

int类型和char类型的区别

下面三个定义式的区别: int i = 1; char i = 1; char i = '1'; int用来定义整型变量,char用来定义字符型变量,要清楚的知道三个定义式的区别,可以比较它们在内存中的存储形式. 数据在内存中是以二进制形式存放的,而且是以补码表示的.一个正整数的补码和该数的原码(即该数的二进制形式)相同:如果数值是负的,求补码的方法是:将该数的绝对值的二进制形式,按位取反再加1.这里不对补码的知识做过多的讨论了. int i = 1,则内存中的存储形式为:0 0 0 0 0 0

js中Boolean类型和Number类型的一些常见方法

Boolean类型 Boolean类型重写了valueOf() 方法, 返回基本布尔类型值true或false,重写了toString() 方法,返回基本字符串"true" 和 "false" 创建一个Boolean类型的实例 var booleanObj = new Boolean(true); Boolean类型和Boolean值有三个区别: Boolean类型的实例总是真 var falseObject = new Boolean(false); var re

关于java中char类型和int类型相加结果的面试题

运行结果为 3 51 C 故而总结了以下几点: 举例子说明一下. System.out.println('0'+'A');// 48+65 = 113 未指定类型--输出int System.out.println((char)('0'+'A'));// q 强转char --输出char System.out.println(10+'A'); //75 未指定类型--输出int System.out.println((char)10+'A'); //75 未指定类型--输出int System

唯爱小粽子：Java中的long类型和Long类型比较大小

Java中我们经常要做一些判断,而对于判断的话,用的最多的便是">"."=="."<"的比较,这里我们进行一个Long类型数据和long类型数据的比较大小的讲解. Java中Long和long的区别 Java的数据类型分为两种: 1.基本类型:byte(8),short(16),int(32),long(64),float(32),double(64),char(16),boolean(1) 2.对象类型:Byte,Short,Int