Delphi 正则表达式语法(10): 选项

Delphi 正则表达式语法(10): 选项

// preCaseLess: 不区分大小写, 相当于其他语言中的 i
var
  reg: TPerlRegEx;
begin
  reg := TPerlRegEx.Create(nil);

  reg.Subject := ‘abc ABC aBc‘;
  reg.RegEx   := ‘abc‘;
  reg.Replacement := ‘◆‘;

  reg.Options := [preCaseLess]; //选项是集合类型的

  reg.ReplaceAll;

  ShowMessage(reg.Subject); //返回: ◆ ◆ ◆

  FreeAndNil(reg);
end;

// preAnchored: 只匹配字符串开始, 相当于 ^, 不过还是有区别的
var
  reg: TPerlRegEx;
begin
  reg := TPerlRegEx.Create(nil);

  reg.Subject := ‘abc abc abc‘;
  reg.RegEx   := ‘abc‘;
  reg.Replacement := ‘◆‘;

  reg.Options := [preAnchored]; //指定: preAnchored 

  reg.ReplaceAll;

  ShowMessage(reg.Subject); //返回: ◆ abc abc

  FreeAndNil(reg);
end;
{preAnchored 选项和 ^ 的区别:
  1、任何情况下, preAnchored 只匹配字符串开头;
  2、在 preMultiLine 选项模式下, ^ 还能匹配每行的开头;
  3、^ 还有其他用途.
}

// preDollarEndOnly: 让 $ 只匹配字符串结尾
var
  reg: TPerlRegEx;
begin
  reg := TPerlRegEx.Create(nil);

  reg.Subject := ‘abc abc abc‘#13#10 +
                 ‘abc abc abc‘#13#10 +
                 ‘abc abc abc‘;
  reg.RegEx   := ‘abc$‘;  //当然需要有 $
  reg.Replacement := ‘◆‘;

  reg.Options := [preDollarEndOnly]; //指定: preDollarEndOnly

  reg.ReplaceAll;

  ShowMessage(reg.Subject);
{返回:
  abc abc abc
  abc abc abc
  abc abc ◆
}

  FreeAndNil(reg);
end;

// preMultiLine: 多行匹配, 相当于其他语言中的 m
var
  reg: TPerlRegEx;
begin
  reg := TPerlRegEx.Create(nil);

  reg.Subject := ‘abc abc abc‘#13#10 +
                 ‘abc abc abc‘#13#10 +
                 ‘abc abc abc‘;
  reg.RegEx   := ‘^abc‘;
  reg.Replacement := ‘◆‘;

  reg.Options := [preMultiLine]; //指定: preMultiLine

  reg.ReplaceAll;

  ShowMessage(reg.Subject);
{返回:
  ◆ abc abc
  ◆ abc abc
  ◆ abc abc
}
{如果不指定 preMultiLine 将返回:
  ◆ abc abc
  abc abc abc
  abc abc abc
}

  FreeAndNil(reg);
end;
{
  1、preMultiLine 是对 ^ 和 $ 的扩展使用;
  2、在指定了 [preAnchored] 或 [preDollarEndOnly] 的情况下无效.
}

// preSingleLine: 让特殊符号 . 能够匹配换行符 (. 的本意是匹配换行符以外的任意字符)
var
  reg: TPerlRegEx;
begin
  reg := TPerlRegEx.Create(nil);

  reg.Subject := ‘aaa;bbb;‘#13#10 +
                 ‘111;222;‘#13#10 +
                 ‘AAA;BBB;‘;
  reg.RegEx   := ‘;.‘;
  reg.Replacement := ‘◆‘;

  reg.Options := [preSingleLine]; //指定: preSingleLine

  reg.ReplaceAll;

  ShowMessage(reg.Subject);
{返回:
  aaa◆bb◆
  111◆22◆
  AAA◆BB;
}
{如果不指定 preMultiLine 将返回:
  aaa◆bb;
  111◆22;
  AAA◆BB;
}

  FreeAndNil(reg);
end;

// preUnGreedy: 指定为非贪婪模式
var
  reg: TPerlRegEx;
begin
  reg := TPerlRegEx.Create(nil);

  reg.Subject := ‘《Delphi》and《C++Builder》‘;
  reg.RegEx   := ‘《.*》‘;

  reg.Replacement := ‘◆‘;

  reg.Options := [preUnGreedy]; //指定: preUnGreedy
  { 在本例中, reg.RegEx := ‘《.*?》‘; 可以达到同样的效果}

  reg.ReplaceAll;

  ShowMessage(reg.Subject); //返回: ◆and◆ ; 如果不指定 preUnGreedy, 将返回: ◆

  FreeAndNil(reg);
end;

// preExtended: 指定为扩展模式
var
  reg: TPerlRegEx;
begin
  reg := TPerlRegEx.Create(nil);

  reg.Subject := ‘Delphi C++Builder‘;
  reg.RegEx   := ‘i\x20C‘; // \x20 是用十六进制的方式表示的空格

  reg.Replacement := ‘◆‘;

  reg.Options := [preExtended]; //指定: preExtended

  reg.ReplaceAll;

  ShowMessage(reg.Subject); //返回: Delph◆++Builder

  FreeAndNil(reg);
end;
{preExtended 是最复杂的一个选项:
  1、它会忽略表达式中的空白, 譬如: 本例中的表达式如果是 ‘i C‘ 将不会匹配成功;
  2、空白要用相应的十六进制表示, 譬如用 \x20 表示空格;
  3、把表达式中从 # 到行尾的部分当作注释而被忽略;
  4、如果要使用 # ,需要用 \# 代替;
  5、表达式的标准注释是: (?#...) 及其中 # 后面的内容均为注释, 不管指定 preExtended 与否
}

关于选项 preExtra:

如果表达式中需要特殊字符 ^ $ ( ) [ ] { } . ? + * | \ 时, 需要加转义符号 \ ;
默认状态下, 其他字符前面添加了 \ 会识别为字符本身;
preExtra 选项应该就是禁止这种情况的, 也就是不要在非特殊字符前加 \ ;
但测试效果 ... 也许是我没弄明白!

还有三个状态选项: preNotBOL, preNotEOL, preNotEmpty

reg.State := [preNotBOL] 是让标记开始的 ^ 无效;
reg.State := [preNotEOL] 是让标记结尾的 $ 无效;
reg.State := [preNotEmpty] 没弄明白!

另外这些选择是可以组合使用的, 譬如:

reg.Options := [preCaseLess, preMultiLine, preSingleLine];
reg.State := [preNotBOL, preNotEOL];

时间: 2024-12-19 12:01:24

Delphi 正则表达式语法(10): 选项的相关文章

Delphi 正则表达式语法(7): 匹配转义字符

Delphi 正则表达式语法(7): 匹配转义字符 // ? 号的意义是匹配 0-1 次, 如果需要匹配 ? 怎么办 var   reg: TPerlRegEx; begin   reg := TPerlRegEx.Create(nil);   reg.Subject := '你好吗? 还行!';   reg.RegEx  := '\?|!'; // 加转义用的 \   reg.Replacement := '◆';   reg.ReplaceAll;   ShowMessage(reg.Sub

Delphi 正则表达式语法(4): 常用转义字符与 .

Delphi 正则表达式语法(4): 常用转义字符与 . // \d 匹配所有数字, 相当于 [0-9] var   reg: TPerlRegEx; begin   reg := TPerlRegEx.Create(nil);   reg.Subject := '期待Delphi 2008 for Win32!';   reg.RegEx  := '\d';   reg.Replacement := '◆';   reg.ReplaceAll;   ShowMessage(reg.Subjec

Delphi 正则表达式语法(1): 关于大小写与中文

Delphi 正则表达式语法(1): 关于大小写与中文 //替换一般字符串 var   reg: TPerlRegEx; begin   reg := TPerlRegEx.Create(nil);   reg.Subject := '我爱DELPHI, 但Delphi不爱我!';   reg.RegEx  := 'Delphi';   reg.Replacement := '◆';   reg.ReplaceAll;   ShowMessage(reg.Subject); //返回: 我爱DE

Delphi 正则表达式语法(3): 匹配范围

Delphi 正则表达式语法(3): 匹配范围 // [A-Z]: 匹配所有大写字母 var   reg: TPerlRegEx; begin   reg := TPerlRegEx.Create(nil);   reg.Subject := 'CodeGear Delphi 2007 for Win32';   reg.RegEx  := '[A-Z]';   reg.Replacement := '◆';   reg.ReplaceAll;   ShowMessage(reg.Subject

Delphi 正则表达式语法(5): 边界

Delphi 正则表达式语法(5): 边界 // \b 单词边界 var   reg: TPerlRegEx; begin   reg := TPerlRegEx.Create(nil);   reg.Subject := 'Delphi Delphi2007 MyDelphi';   reg.RegEx  := '\bDelphi\b'; //前后边界   reg.Replacement := '◆';   reg.ReplaceAll;   ShowMessage(reg.Subject);

Delphi 正则表达式语法(6): 贪婪匹配与非贪婪匹配

Delphi 正则表达式语法(6): 贪婪匹配与非贪婪匹配 //贪婪匹配 var   reg: TPerlRegEx; begin   reg := TPerlRegEx.Create(nil);   reg.Subject := '<html><head><title>标题</title></head><body>内容</body></html>';   reg.RegEx  := '<.*>';

Delphi 正则表达式语法(9): 临界匹配 - 也叫&quot;预搜索&quot;与&quot;反向预搜索&quot;

Delphi 正则表达式语法(9): 临界匹配 - 也叫"预搜索"与"反向预搜索" //匹配右边 var   reg: TPerlRegEx; begin   reg := TPerlRegEx.Create(nil);   reg.Subject := 'Delphi 6; Delphi 7; Delphi 2007; Delphi Net';   reg.RegEx  := 'Delphi (?=2007)'; // ?=   reg.Replacement :

Delphi 正则表达式语法(2): 或者与重复

Delphi 正则表达式语法(2): 或者与重复 // | 号的使用, | 是或者的意思 var   reg: TPerlRegEx; begin   reg := TPerlRegEx.Create(nil);   reg.Subject := 'CodeGear Delphi 2007';   reg.RegEx  := 'e|Delphi|0'; //使用了 | 记号   reg.Replacement := '◆';   reg.ReplaceAll;   ShowMessage(reg

Delphi 正则表达式语法(8): 引用子表达式 - 也叫反向引用

Delphi 正则表达式语法(8): 引用子表达式 - 也叫反向引用 //准备: 我们先写一个搜索所有英文单词的表达式 var   reg: TPerlRegEx; begin   reg := TPerlRegEx.Create(nil);   reg.Subject := 'one two three four five six seven eight nine ten';   reg.RegEx  := '\b[A-Za-z]+\b'; //这个表达式就可以找到所有的英文单词   reg.