汇编高手带你玩转字符串,快上车!

字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为 s=“a1a2···an”(n>=0)。它是编程语言中表示文本的数据类型。在程序设计中,字符串(string)为符号或数值的一个连续序列,如符号串(一串字符)或二进制数字串(一串二进制数字)。
String类型你一定不陌生,毕竟每一位coder都是从var str1 = “Hello World”过来的。
但它真的就只是如此吗?听我娓娓道来。
一、思考
在 Swift 开发使用字符串的过程中,你是否有思考过以下问题?
1 个字符串变量占用多少内存?
字符串 str1、str2 的底层存储有什么不同?

如果对 str1、str2 进行拼接操作,str1、str2 的底层存储又会发生什么变化?

如果你能准确地回答以上问题,那说明对 Swift 字符串的底层存储机制还是比较了解的。
二、1 个字符串变量占用多少内存?
方法 1:MemoryLayout
首先,可以借助 Swift 自带的 MemoryLayout 来测试一下

方法 2:汇编
另外,我们也可以借助一个强有力的底层分析助手—汇编语言,来窥探一下 String 的底层存储
实际上分析其他语法、系统库的底层,都可以借助汇编语言
比如多态的原理、泛型的原理、Array 的底层、枚举的底层等等
另外,不仅仅是 Swift,C、C++、OC 的底层分析,依然可以借助汇编语言
毕竟你写的每一行有效代码,最终都是要转成机器指令(0 和 1)
而机器指令是跟汇编指令一一对应的,每一条机器指令都能翻译成与之对应的汇编指令
能读懂汇编指令,就相当于能读懂机器指令,知道 CPU 具体在干嘛(操作了什么寄存器,操作了哪块内存)
本教程的代码是直接跑在 Mac 的命令行(CommandLineTools)项目上
因此展示的汇编代码是基于 X64 的 AT&T 格式汇编,并非 iOS 真机设备的 ARM 汇编
其实不同种类的汇编之间有极大的相似性,只是有些指令的叫法不一样
跟微软的 Visual Studio 一样,Xcode 也内置了非常方便的反汇编功能,可以轻松查看每一句代码对应的汇编指令,打开反汇编界面的步骤如下
在某一行需要调试的代码打上断点(反汇编界面会在断点调试状态下显示出来)
菜单:Debug > Debug Workflow > Always Show Disassembly
Assembly 译为汇编, Disassembly 译为反汇编

运行程序,看到反汇编界面

如果你的反汇编经验十足,根据第 16、17 行的汇编就可以推敲出来,String 是占用 16 个字节
因为它用了 rax、rdx 寄存器存放字符串 str 的内容,而 rax、rdx 都是 8 字节的
汇编的内容太多了,因为时间和篇幅关系,文章里并不会对每一句汇编指令进行详细地讲解,更多的是想说明汇编的重要性。
三、字符串的底层存储
窥探内存
此前我写了个可以窥探 Swift 变量内存的小工具:https://github.com/CoderMJLee/Mems
现在用它来窥探下字符串的 16 字节里面,究竟存储着什么数据
Mems.memStr(ofVal:) 默认情况下按照 8 个字节一组来显示内存数据
传递参数 alignment: .one 是按照 1 个字节一组来显示内存数据

字符 ‘0‘~‘9‘ 的 ASCII 值是 0x30~0x39,认真观察最初 str1 的 16 个字节数据,你发现了什么?
它直接将所有字符的 ASCII 值存储在 str1 的 16 字节中
最后 1 个字节 0xea 中的 0xa 就是字符的数量,也是共 10 个字符
拼接

可以发现,当对 str1 进行拼接 "ABCDE" 的时候
它最终是将 "0123456789ABCDE"十五个字符的 ASCII 值都存储在了 str1 的 16 字节中
最后 1 个字节 0xef 中的 0xf 就是字符的数量,也是共 15 个字符
可以看得出来,目前 16 个字节已经存满了,那如果再拼接 1 个字符呢?

可以看到,str1 里面存储的数据发生了非常大的变化,每一个字符的 ASCII 值不见了,
那里面的 16 字节具体是什么含义呢?
所有字符(‘0‘~‘9‘、‘A‘ 到 ‘F‘)的 ASCII 值又存到哪去了呢?
其他情况
如果一开始初始化的时候(未拼接之前),字符串的内容就是超过 15 个字符呢?

相信你能猜到是这个结果
这 16 个字节里面并没有出现任何一个字符的 ASCII 值
而且这 16 个字节跟 第27行的str1 还是有所区别
虽然它们的字符串内容都是"0123456789ABCDEF"
如果对 str2 进行拼接操作

不难发现:这时 str2 的 16 字节又发生了变化,跟 第27行的str1 是有点相似的
如何解决上述疑问?
上述的种种疑问,光看打印出来的内存数据是无法解决的,但是都可以利用【!!!汇编!!!】来解决,分析汇编指令,立马就得出结论,因为文章的篇幅有限,平时工作也比较忙,我把上述问题的详细剖析过程录制成了长达 2 个多小时的视频,有兴趣的朋友可以用 1.5~2 倍速度观看
链接:https://pan.baidu.com/s/1AkS3K1ZKP8zyxhlhLRaBkA
提取码:kzrk
视频对于没有汇编基础的朋友来说,可能会有点难度,最好挑一个头脑清醒的时间去观看
看完视频后,希望大家能够确切地感受到汇编语言的重要性,不要永远只停留在编写高级语言代码、沉迷于语法糖的层面。
四、最后
人们经常认为汇编语言的应用范围很小,而忽视它的重要性。其实汇编语言对每一个希望学习计算机科学与技术的人来说都是非常重要的,是不能不学习的语言。
汇编能给你带来的价值远远不止这篇文章所说的窥探字符串的底层,对你的程序生涯影响绝对是终生受益的(数据结构与算法也是如此)。学会汇编后,你在用高级语言编程时会更了解机器到底做了什么,可以通过修改高级语言的代码来提高算法所不能提高的效率。
IT技术的发展日新月异,新技术层出不穷,具有良好的学习能力,能及时获取新知识、随时补充和丰富自己,已成为程序员职业发展的核心竞争力。
作为一名程序员,更需要不断丰富自己的知识库。我们所知道的东西,就像一个白色的圆圈,圈外则是黑暗的未知的世界。当圆圈越大,所接触到的黑暗部分就越多。我们只有不停地学习,才能打破更多的黑暗,找到更多光明。
如果您想提升自己,学习更多如 iOS、数据结构与算法等编程技巧,这里有免费的相关学习资料,欢迎加微信:19950277730获取更多技术提升秘籍。这里不仅有志同道合的小伙伴,更有无数免费编程技巧、学习视频和资料,加上微信来一起探讨学习技术吧!!

原文地址:https://blog.51cto.com/14606540/2448956

时间: 2024-08-29 13:05:41

汇编高手带你玩转字符串,快上车!的相关文章

带你玩转Visual Studio——带你发布自己的工程库

上一篇文章带你玩转Visual Studio--带你高效管理代码通过对VisualSVN优秀插件的讲解,让我们掌握了在集成开发环境VS中快捷高效地管理代码的技能.然而我们开发的程序并不总是直接地生成可执行的软件,我们可能只是开发某个大型系统的一个组件,也可能是开发某个软件的内核SDK提供给上层的应用程序调用,在开发的过程中我们也可能会用到第三方的开源库.那如果将自己的程序编译成程序库给调用方用呢?又如何在自己的程序中引用第三方库呢?这将是这篇文章要讲的内容--发布自己的工程库. 什么是程序库?

iOS开发——高级UI&带你玩转UITableView

带你玩装UITableView 在实际iOS开发中UITableView是使用最多,也是最重要的一个控件,如果你不会用它,那别说什么大神了,菜鸟都不如. 其实关于UItableView事非常简单的,实际开发中用起来却没有那么简单就是因为他结合MVC使用,涉及到了模型数据的读取,自定义View,功能的拓展和更好的解藕,下面就带你玩一遍: UITableView的两种样式 UITableViewStylePlain UITableViewStyleGroupeds accessoryType UIT

转: 带你玩转Visual Studio——带你理解多字节编码与Unicode码

上一篇文章带你玩转Visual Studio——带你跳出坑爹的Runtime Library坑帮我们理解了Windows中的各种类型C/C++运行时库及它的来龙去脉,这是C++开发中特别容易误入歧途的一个地方,我们对它进行了总结和归纳.本篇文章我们将继续讲解C++开发中容易混淆的另一个概念——多字节字符集与Unicode字符集. 多字节字符与宽字节字符 char与wchar_t 我们知道C++基本数据类型中表示字符的有两种:char.wchar_t. char叫多字节字符,一个char占一个字节

30分钟带你玩转正则表达式

        30分钟带你玩转正则表达式   定义: 正则表达式说白了就是有普通字符.以及特殊字符组成的文子模式.{匹配模式标准} 正则表达式将会作为一个模板与所搜索的字符串进行匹配.可以让使用者轻易达到搜寻/删除/取代某些特定字符的处理程序.此外vim.grep.find.awk.sed等命令都支持正则表达式 注:在这里希望大家搞明白一件事,那就是通配符和正则表达式的区别与关系: 1.正则表达式是用来匹配字符串的,这个就不解释了2.通配符是用来通配的,也就是shell在做Pathname E

带你玩转Visual Studio——性能分析与优化

上一篇文章带你玩转Visual Studio--VC++的多线程开发讲了VC++中多线程的主要用法.多线程是提升性能和解决并发问题的有效途经.在商用程序的开发中,性能是一个重要的指标,程序的性能优化也是一个重要的工作. 找到性能瓶颈 二八法则适合很多事物:最重要的只占其中一小部分,约20%,其余80%的尽管是多数,却是次要的.在程序代码中也是一样,决定应用性能的就那20%的代码(甚至更少).因此优化实践中,我们将精力集中优化那20%最耗时的代码上,这那20%的代码就是程序的性能瓶颈,主要针对这部

Android SurfaceView实战 带你玩转flabby bird (下)

转载请标明出处:http://blog.csdn.net/lmj623565791/article/details/43063331,本文出自:[张鸿洋的博客] 1.概述 在Android SurfaceView实战 带你玩转flabby bird (上)中,我们完成了在游戏所需的所有的元素的绘制,包括 Bird鸟. Floor地板.Pipe 管道 .背景图以及分数等. 本篇博客将在上篇的基本上,继续带领大家向我们的目标进发,那么问题来了,我们的目标是: 就是这个效果图了. 首先我们明确下,当然

玩一分钟快三精准走势技巧,快三回血规律718609345

老师扣718609345最高邀请码12228822在的处境,迷茫,无助,恐惧,很多事情都不能和人说出来,只能在这里 发表,让更多人明白赌博的痛苦,在这里先感谢718609345老师我家是农村的,今年24岁,男,大学生.大学毕业后,一直在家里闲着, 因为去工厂或公司上班,都有种束缚的感觉,想挣钱,又不想被束缚.后 来亲戚找关系,让我去工地上班做监理,本来我是不愿意的,但听亲戚说 ,工地上班,没人管,埋头做事就好,而且工资也很高.我心动了.第二天,我就去了工地,就两个师傅和包工头,加上我,一个大楼,

8招带你玩转规则引擎 | 我的物联网成长记

[摘要] 华为云物联网平台提供的规则引擎包括数据转发和设备联动等多种能力,这些能力都要怎么使用?本文教您8招最常用的用法,带您玩转规则引擎. 规则引擎是华为云物联网平台提供的一种能力,用户对接入平台的设备设定相应的规则,在条件满足所设定的规则后,平台会触发相应的动作来满足用户需求.规则引擎包含数据转发和设备联动两种类型. 数据转发规则:物联网平台支持将设备上报的数据(和设备信息)转发至其他云服务,包括数据接入服务DIS.对象存储服务OBS.企业集成平台ROMA等,并支持对转发的数据进行过滤. 设

B - 瑶瑶带你玩激光坦克

B - 瑶瑶带你玩激光坦克 Time Limit: 2000/1000MS (Java/Others)    Memory Limit: 256000/128000KB (Java/Others) Submit Status Problem Description 有一款名为激光坦克的游戏,游戏规则是用一个坦克发出激光来达到一些目的,激光可以通过一些镜子反射. 机智的瑶瑶为了显示自己的智商高于常人,把这个游戏改造了一下,变成了用激光攻击敌人的游戏. 瑶瑶想知道射一次激光最多可以攻击到多少个敌人.