Delphi String

Delphi结构类型包含String字符串使用需要注意的地方

  有些人提倡当在结构里面包含字符串类型的时候最好采用定长的方式。

  比如像下面这样:

  TCSInfo = record

  Cs_Str    :String;    

  Count  :Integer;

  CS_Str2 :String;

  end;

  如果Cs_Str在这里不采用定长的方式,那么当采用SizeOf()获取结构的大小的时候,可能得不到正确的大小值。

  另外这个首位成员变量的值,很有可能出现随机值的情况,就是你已经给它赋了值,在当前的显示是正确的,但是——

  如果把该结构保存为结构文件的时候,下次打开取值的时候就会出现随机值的情况。

  但是后面的变量的值是正常的,所以如果字符串变量放在首位,那么应该采用定长的方式:

  Cs_Str    :String[20];

  或者把Count放在首位。

  有些朋友没有试过存储过结构化文件,所以在程序运行的时候,不会发现有什么问题。

  简单的使用是不会发现问题,因为我在测试的时候,也发现第一次赋值的时候,完全没有发现问题。

  然后关闭程序,第二次打开文件的时候,就发现了问题。

  而且凡是前面的变量的类型是String的话,得到的全部是随机值,但是只要紧随其后有一个别的类型,那么之后的非定长的字符串变量的值却是正常的。就像上面的CS_Str2那样,值是正常的,问题出现在其它类型变量之前的非定长字符串类型的变量的身上。

  如果说是寻址的问题,那么为什么后面的变量值是正确的?

  我们知道文件流的指针位置如果不正确,那么是无法取得正确的结果的。

  总之涉及到字符串类型都是比较复杂的。

  如果不深究其中的原因,保证我们的程序完美实现,不会出现隐患。

  我的建议是:要么把其它类型的变量至于首位,那么后面的字符串可以不采用定长的方式。

  要么就采用定长的方式,这种情况最好必须把变量至于首位的情况下。

  采用定长的方式,会浪费很多空间,而且文件不会很紧凑,而且大多数时候,我们的值都是不确定的,如果采用定长的方式,显然会导致在赋值的时候带来不可预料的情况,当然自己使用不会有问题,如果是客户,那么我们不得不增加代码的开销来避免这种情况的出现,对吧。

  我个人相当习惯采用流的方式来处理文件,但是采用内存流或者文件流处理文件会有好几个陷阱,会令人误以为不能够采用流的方式处理。

  这个问题下次我会提到。

  为什么需要习惯流的方式处理文件,主要的原因是需要了解大数据处理和各种结构化文件处理的问题。

  尤其是大多数的处理都是在内存里面进行,效率还可以。

=============================================

Delphi中String类型原理介绍

Delphi中字符串的操作很简单,但幕后情况却相当复杂。Pascal传统的字符串操作方法与Windows不同,Windows吸取了C语言的字符串操作方法。32位Delphi中增加了长字符串类型,该类型功能强大,是Delphi缺省的字符串类型。

字符串类型在Borland公司的TurboPascal和16位Delphi中,传统的字符串类型是一个字符序列,序列的头部是一个长度字节,指示当前字符串的长度。由于只用一个字节来表示字符串的长度,所以字符串不能超过255个字符。这一长度限制为字符串操作带来不便,因为每个字符串必须定长(确省最大值为255),当然你也可以声明更短的字符串以节约存储空间。

字符串类型与数组类型相似。实际上一个字符串差不多就是一个字符类型的数组,因此用[]符号,你就能访问字符串中的字符,这一事实充分说明了上述观点。   
   为克服传统Pascal字符串的局限性,32位Delphi增加了对长字符串的支持。这样共有三种字符串类型:   
   ShortString   短字符串类型也就是前面所述的传统Pascal字符串类型。这类字符串最多只能有255个字符,与16位Delphi中的字符串相同。短字符串中的每个字符都属于 
                        ANSIChar类型(标准字符类型)。     
   ANSIString  长字符串类型就是新增的可变长字符串类型。这类字符串由内存动态分配,引用计数,并使用了更新前拷贝(copy--on-write)技术。这类字符串长度没有限制(可        以存储多达20亿个字符!),其字符类型也是ANSIChar类型。     
   WideString   长字符串类型与ANSIString 类型相似,只是它基于WideChar字符类型,WideChar字符为双字节Unicode字符。

使用长字符串     
    如果只简单地用String定义字符串,那么该字符串可能是短字符串也可能是ANSI长字符串,这取决于$H编译指令的值,$H+(确省)代表长字符串(ANSIString类型)。长字符串是Delphi库中控件使用的字符串。   
    Delphi长字符串基于引用计数机制,通过引用计数追踪内存中引用同一字符串的字符串变量,当字符串不再使用时,也就是说引用计数为零时,释放内存。    
    如果你要增加字符串的长度,而该字符串邻近又没有空闲的内存,即在同一存储单元字符串已没有扩展的余地,这时字符串必须被完整地拷贝到另一个存储单元。当这种情况发生时,Delphi运行时间支持程序会以完全透明的方式为字符串重新分配内存。为了有效地分配所需的存储空间,你可以用SetLength过程设定字符串的最大长度值,如:    
    SetLength   (String1,   200);   
    SetLength过程只是完成一个内存请求,并没有实际分配内存。它只是把将来所需的内存预留出来,实际上并没有使用这段内存。这一技术源于Windows操作系统,现被 
Delphi用来动态分配内存。例如,当你请求一个很大的数组时,系统会将数组内存预留出来,但并没有把内存分配给数组。 
  一般不需要设置字符串的长度,不过当需要把长字符串作为参数传递给API函数时(经过类型转换后),你必须用SetLength为该字符串预留内存空间,这一点我会在后面进行说明。 
  看一看内存中的字符串     
  为了帮你更好地理解字符串的内存管理细节,我写了一个简例StrRef。在程序中我声明了两个全程字符串:Str1和Str2,当按下第一个按钮时,程序把一个字符串常量赋给第一个变量,然后把第一个变量赋给第二个:   
  Str1   :=   ‘Hello‘;   
  Str2   :=   Str1;   
  除了字符串操作外,程序还用下面的StringStatus函数在一个列表框中显示字符串的内部状态:   
  function   StringStatus   (const   Str:   string):   string;   
  begin   
  Result   :=   ‘Address:   ‘   +   IntToStr   (Integer   (Str))   +   
  ‘,   Length:   ‘   +   IntToStr   (Length   (Str))   +     
  ‘,   References:   ‘   +   IntToStr   (PInteger   (Integer   (Str)   -   8)^)   +   
  ‘,   Value:   ‘   +   Str;   
  end;   
  在StringStatus函数中,用常量参数传递字符串至关重要。用拷贝方式(值参)传递会引起副作用,因为函数执行过程中会产生一个对字符串的额外引用;与此相反,通过引用(var)或常量(const)参数传递不会产生这种情况。由于本例不希望字符串被修改,因此选用常量参数。        为获取字符串内存地址(有利于识别串的实际内容也有助于观察两个不同的串变量是否引用了同一内存区),我通过类型映射把字符串类型强行转换为整型。字符串实际上是引用,也就是指针:字符串变量保存的是字符串的实际内存地址。   
  为了提取引用计数信息,我利用了一个鲜为人知的事实:即字符串长度和引用计数信息实际上保存在字符串中,位于实际内容和字符串变量所指的内存位置之前,其负偏移量对字符串长度来说是-4(用Length函数很容易得到这个值),对引用记数来说是-8。   
  不过必须记住,以上关于偏移量的内部信息在未来的Delphi版本中可能会变,没有写入正式Delphi文档的特性很难保证将来不变。       
  通过运行这个例子,你会看到两个串内容相同、内存位置相同、引用记数为2,如图7.1中列表框上部所示。现在,如果你改变其中一个字符串的值,那么更新后字符串的内存地址将会改变。这是copy-on-write技术的结果。       
  第二个按钮(Change)的OnClick事件代码如下,结果如图7.1列表框第二部分所示:   
  procedure   TFormStrRef.BtnChangeClick(Sender:   TObject);   
  begin   
  Str1   [2]   :=   ‘a‘;   
  ListBox1.Items.Add   (‘Str1   [2]   :=   ‘‘a‘‘‘);   
  ListBox1.Items.Add   (‘Str1   -   ‘   +   StringStatus   (Str1));   
  ListBox1.Items.Add   (‘Str2   -   ‘   +   StringStatus   (Str2));   
  end;   
  注意,BtnChangeClick只能在执行完BtnAssignClick后才能执行。为此,程序启动后第二个按钮不能用(按钮的Enabled属性设成False);第一个方法结束后激活第二个按钮。你可以自由地扩展这个例子,用StringStatus函数探究其它情况下长字符串的特性。

动态分配可以用任意一个分配内存的函数, 其实系统最终调用的都是GetMem, 其它的New、AllocMem、SetLength等等只不过除了调用GetMem外还做了一些初始化处理比如把内存清零。释放可以用Dispose或者FreeMem, 系统最终都是调用FreeMem的, Dispose相当于Finalize(p);   FreeMem(p);   
  Finalize的作用简单说就是自动释放结构或者数组中的string和动态数组,   FreeMem则是直接释放指针所指向的内存,例如:   
type   
    TMyRec   =   record   
        Name:   string;   
        X,   Y:   Integer;   
    end;   
    PMyRec   =   ^TMyRec;   
var   
    MyRec   :   PMyRec;   
begin   
    New(MyRec);           //   编译器会根据MyRec的大小自动计算需要分配的内存数量然后生成代码调用GetMem并将其中的Name字段清零   
    MyRec.Name   :=   str1   +   str2;   
    Dispose(MyRec);     //   除了调用FreeMem释放MyRec这个结构的内存外还会自动清除其中的Name所用到的内存(如果Name指向的string引用计数=1时);   
//   FreeMem(MyRec);   <--   如果直接调用FreeMem释放MyRec,   则会造成内存泄露,   因为MyRec.Name指向的字符串没有释放(引用计数-1)   
end;

由于delphi关于string的内存管理的特殊性, 可以有很多技巧充分利用其优点生成非常高效的代码, 比如要用TList来保存string(不是TStringList),   一般的做法是TList.Items[i]中保存一个PString指针, 这样就需要重新分配一块内存并复制原串, 大数据量的情况下效率很低, 但是如果充分利用string的引用计数和强制类型转换技巧, 可以直接将string作为指针保存在TList.Items[i]中:   比如:   
  var   
      List:   TList;   
      GlobalString1,   GlobalString2:   string;   
    ...   
  procedure   Test;   
  var   
      tmp:   string;   
  begin   
      tmp   :=   GlobalString1+GlobalString2;   
     List.Add(Pointer(tmp));     //   将tmp作为指针保存进List

{  由于Test过程结束时会自动释放掉tmp, 如果直接退出的话List中就保存了一个无效的指针了, 所以这里要欺骗编译器, 让它认为tmp已经被释放掉了, 等于在不改动tmp引用计数(当前是1)的情况下执行相当于tmp   :=  ‘‘的语句, 由于直接tmp   := ‘‘会修改引用计数并可能释放掉内存, 所以用强制类型转换将tmp转成一个Integer并将这个Integer设置成0(也就是nil), 此语句完全等价于pointer(tmp) :=   nil; 只是个人喜好我喜欢用Integer(tmp) := 0而已.   

     Integer(tmp)   :=   0;

end;

1. string是Delphi编译器内在支持的(predefined or built-in),是Delphi的一个基本数据类型,而PChar只是一个指向零终止字符串的指针;   
2. String 所存字符串是在堆分配内存的,String变量实际上是指向零终止字符串的指针,与此同时它还具有引用计数(reference count)功能,并且自身保存字符串长度,当引用计数为零时,自动释放所占用的空间。   
3.将string赋值给另一个string,只是一个简单的指针赋值,不产生copy动作,只是增加string的引用计数;   
4.将一个PChar变量类型赋值给一个string   变量类型会产生真正的Copy动作,即将PChar所指向的字符串整个copy到为string分配的内存中;   
5.将string赋值给一个PChar变量类型,只是简单地将string的指针值赋值给PChar变量类型,而string的引用计数并不因此操作而发生变化,因为这种情况PChar会对string产生依赖,当string的引用计数为零自动释放内存空间后,PChar很可能指向一个无效的内存地址,在你的程序你必须小心对付这种情况。   
6.对PChar的操作速度要远远高于对string操作的速度,但PChar是一种落后的管理字符串的方式,而string则以高效的管理而胜出,PChar它的存在只是为了兼容早期的类型和操作系统(调用Windows API时会经常用到),建议平常使用string。

时间: 2024-10-14 00:48:03

Delphi String的相关文章

Delphi String 常用字串符处理函数

Delphi 在面对跨平台开发,程序语言也改进不少,不过有些改进,让原本 Delphi 开发者有些不适应,最显注的就是字串处理函数了,原本 Pascal 语言字串起始由 1 开始,几乎是它的经典了,新版本字串由 0 开始,这个改变,让很多人不适应,也多有抱怨,虽然 Delphi 尽量保有相容性,但如果要写出一码,跨所有平台,还是建议全部采用新的写法(由0开始),才是一劳永逸的做法,下面就整理常用字串处理函数新旧对照表. Delphi String 常用字串符处理函数: 说明 旧写法(Window

delphi string,pchar,char的比较

来自:http://blog.163.com/kat_/blog/static/189284269201152513331999/ ------------------------------------------------------------------------------------- tring和Char数组都是一块内存, 其中存放连续的字符. string保存具体字符的内存对用户 是透明的, 由Delphi管理它的分配, 复制和释放, 用户不能干预(其实也可以, 不过是通过

delphi string.split 按照任意字符串分割语句

var  I: Integer;  S: string;  A: TArray<string>;begin  S := 'AAA分割bbb分割ccc';  A := S.Split(['分割']);  for I := 0 to High(A) do    ShowMessage(A[I]);end; 输出结果为: AAA BBB CCC var str: string;  arr: TArray<string>;begin  str := 'A-1,B-2,,,C-3,D-4';

string系列操作1

Delphi string.char数组和Pchar Pchar:是指针,占4B,定义时指向随即地址,由#0表示字符串结尾. Pchar指向内存,只是代表一个地址,可随意指向任何东西. Char数组:长度和地址比较固定.SetLength,地址不可被赋值. string:分两种,内可包含#0.ShortString:最长256字节AnsiString:最长256的4次方 String-->PChar:只是讲String中字符串的地址复制给了Pchar. Pchar和char数组,占内存少,速度快

ASP.Net string 类的扩展方法 [转]

string 类的扩展方法列表(基本相同于 IEnumerable<T> 接口的成员列表): Aggregate<>     //累加 All<>        //是否都满足条件 Any<>        //是否有一个满足条件 AsEnumerable<>  // AsParallel<>    // AsQueryable<>    // Average<>      //平均值 Cast<>

Delphi Variant oleVariant

The OleVariant type exists on both the Windows and Linux platforms. The main difference between Variant and OleVariant is that Variant can contain data types that only the current application knows what to do with. OleVariant can only contain the dat

MonoTouch 二三事(三)mono mkbundle 打包程序的解包支持

许久以后,这个续上这个系列的第三篇. 玩过mono的可能知道mono有一个工具mkbundle ,可以把mono的运行时与类库与你的程序的依赖程序集都打包成一个可执行文件,在win下为exe文件,例如mandroid.exe,mtouch.exe,在mac下的Mach-O文件,例如mtouch,mtouch-64. 根据他的源代码 https://github.com/mono/mono/tree/master/mcs/tools/mkbundle,我们得到: template_main.c i

delphi中string的管理

delphi对string采取的是copy on write的处理思路, 即在修改的时候才会发生copy,否则只是原来的引用++: 比如: 1 var 2 str1 : string; 3 str2 : string; 4 begin 5 str1 := 'changym'; 6 //分配内存并让str1计数管理: 7 8 str2 := str1; 9 //并没有分配内存, 而是让str2指向str1的内存, str1的计数++: 10 11 str2 := 'test'; 12 //这个时候

String[255]在高版本Delphi里还是被解释成Byte,总体长度256,使用StrPCopy可以给Array String拷贝字符串

学了好多不了解的知识: procedure TForm1.Button1Click(Sender: TObject); var s1 : String; s2 : String[255]; begin s1:='ç1很好'; ShowMessage(s1); // 这里显示正常 s2:=s1; ShowMessage(s2); // 这里显示乱码. // 问这个问题的原因是,在一个recode pack 里定义了String[255],但是使用Unicode字符给它赋值的时候,就乱码了,这该怎么