C++11中的raw string literals

作为一名C++书看得少得可怜的新手,我一直没有勇气去系统地学习一下C++ 11添加的新特性。不过,平日里逛论坛,阅读大犇们的博客,倒是了解了一些。比如,这个帖子:

如何绕过g++ 4.8.1那个不能在宏里面使用R"(...)"的bug?

看到形如:R"" 这样的写法,相信学过Python的童鞋会感到似曾相识。Python支持所谓的“raw string”。Python文档这样介绍raw string:

Both string and bytes literals may
optionally be prefixed with a letter ‘r‘ or ‘R‘; such strings are called
raw strings and treat backslashes as literal characters. As a result,
in string literals, ‘\U‘ and ‘\u‘ escapes in raw
strings are not treated specially. Given that Python 2.x’s raw unicode
literals behave differently than Python 3.x’s the ‘ur‘ syntax is not
supported.
从这段文字中我们可以看出,raw string最大的特点就是:它不会对反斜杠‘\‘进行特殊的转义处理。
那么,它的这一特性有什么好处呢?
不用正则,不知raw string大法好!我们知道,正则表达式里,有很多元字符,当没有raw string时,我们需要在书写正则表达式的时候使用‘\\‘来表示元字符里的‘\‘,这样将导致正则表达式变得冗长,而且可读性也会降低。

C++ 11中的raw string,简化了我们在使用regex库时正则表达式的书写。下面是我找到的一些资料:

C++11 raw strings literals tutorial
Wikipedia: C++ 11 # New String Literals

示例代码:

#include <iostream>
#include <string>

int main()
{
    // 一个普通的字符串,‘\n‘被当作是转义字符,表示一个换行符。
    std::string normal_str = "First line.\nSecond line.\nEnd of message.\n";
    // 一个raw string,‘\‘不会被转义处理。因此,"\n"表示两个字符:字符反斜杠 和 字母n。
    // 注意其语法格式,稍后会介绍C++ 11中为什么会采用这种语法格式来表达一个raw string。
    std::string raw_str = R"(First line.\nSecond line.\nEnd of message.\n)";

    std::cout << normal_str << std::endl;
    std::cout << raw_str << std::endl;
    std::cout << R"foo(Hello, world!)foo" << std::endl;

    // raw string可以跨越多行,其中的空白和换行符都属于字符串的一部分。
    std::cout <<R"(
                   Hello,
                   world!
                   )" << std::endl;

    return 0;
}

上面这段代码及其中注释大致讲解了C++ 11中的raw string的特点。但是为什么我们要在字符串中使用一对小括号呢?
我找到了如下资料:

What is the rationale for parenthesis in C++11‘s raw string literals R“(…)”?

C++11 FAQ中文版:原生字符串标识

示例代码:

#include <iostream>

int main()
{
    // 下面两行代码意图说明C++ 11采用一对圆括号以及自定义分割字符串来表示raw string的原因。
    // 1.
    // 如果没有一对圆括号及空的分割字符串做定界处理,R"""将会出现语法错误。Python中,r"""也不会是一个合法的
    // raw string literal。
    std::cout << R"(")" << std::endl; // 输出一个双引号:"
    // 2.
    // 自定义分割字符串为:delimiter。分割字符串的长度以及其中包含的字符集,都有明文规定。维基百科:
    // The string delimiter can be any string up to 16 characters in length, including the empty string.
    // This string cannot contain spaces, control characters, ‘(‘, ‘)‘, or the ‘\‘ character.
    //
    // 如果不使用自定义分割字符串,这里:R"()")"编译器无法识别raw string在何处结束。自定义分割字符串的用途
    // 维基百科中也有介绍:
    // The use of this delimiter string allows the user to have ")" characters within raw string literals.
    std::cout << R"delimiter()")delimiter" << std::endl; // 输出:)"

    return 0;
}

所以,小伙伴们以后在C++ 11中书写正则表达式的时候,记得用raw string literals啊。

C++11中的raw string literals

时间: 2024-10-15 21:26:43

C++11中的raw string literals的相关文章

利用宏方便地书写raw string literals

以前一直没用过标准库的regex,今天写一个hlsl的解析工具的时候用了一下,发现用字符串字面值写regular expression的时候非常不方便,特别是每个"\"字符都要被识别为转义,只能写成"\\".比如,一系列空白字符加一个数字要写成这样: std::regex reg("\\s*\\d"); 这样一来,稍微一复杂的regular expression就完全没法看了.理所当然地,可以用raw string literal来解决这个问题.

C++11中的小细节--字符串的原始字面量

原始字面量很容易理解,即不进行转义的完整字符串. 最近看了看Python,其中讲到了原始字符串. Both string and bytes literals may optionally be prefixed with a letter ‘r’ or ‘R’; such strings are called raw strings and treat backslashes as literal characters. As a result, in string literals, ‘\U

正则表达式简介及在C++11中的简单使用

正则表达式(regular expression)是计算机科学中的一个概念,又称规则表达式,通常简写为regex.regexp.RE.regexps.regexes.regexen. 正则表达式是一种文本模式.正则表达式是强大.便捷.高效的文本处理工具.正则表达式本身,加上如同一门袖珍编程语言的通用模式表示法(general pattern notation),赋予使用者描述和分析文本的能力.配合上特定工具提供的额外支持,正则表达式能够添加.删除.分离.叠加.插入和修整各种类型的文本和数据. 完

Java中如何将String转成Date

Java中如何将String转成Date 最近在开发Json数据反序列化为Java对象的时候发现spring mvc 和 Jackson 对Date类型对支持不是特别好,虽然在Java对象序列化为Json数据的过程中提供了便利的注解,但是反序列化却没有,于是就引出了下面的问题,我需要手工的将字符串转换为Date类型的数据,java.text.SimpleDateFormat 为我们提供了这种转换的基础设施.如下列出了的格式化模式的简单定义,如果 ‘M’ 大于等于3位, 月份会显示为字母,否则是数

从linux0.11中起动部分代码看汇编调用c语言函数

上一篇分析了c语言的函数调用栈情况,知道了c语言的函数调用机制后,我们来看一下,linux0.11中起动部分的代码是如何从汇编跳入c语言函数的.在LINUX 0.11中的head.s文件中会看到如下一段代码(linux0.11的启动分析部分会在另一部分中再分析,由于此文仅涉及c与汇编代码的问题,). after_page_tables: pushl $0 # These are the parameters to main :-) pushl $0 pushl $0 pushl $L6 # re

一起学习c++11——c++11中的新增的容器

c++11新增的容器1:array array最早是在boost中出现:http://www.boost.org/doc/libs/1_61_0/doc/html/array.html 当时的初衷是希望提供一个在栈上分配的,定长数组,而且可以使用stl中的模板算法. array的用法如下: #include <string> #include <iterator> #include <iostream> #include <algorithm> #inclu

C++11 中值得关注的几大变化(网摘)

C++11 中值得关注的几大变化(详解) 原文出处:[陈皓 coolshell] 源文章来自前C++标准委员会的 Danny Kalev 的 The Biggest Changes in C++11 (and Why You Should Care),赖勇浩做了一个中文翻译在这里.所以,我就不翻译了,我在这里仅对文中提到的这些变化"追问为什么要引入这些变化"的一个探讨,只有知道为了什么,用在什么地方,我们才能真正学到这个知识.而以此你可以更深入地了解这些变化.所以,本文不是翻译.因为写

(译)C++11中的Move语义和右值引用

郑重声明:本文是笔者网上翻译原文,部分有做添加说明,所有权归原文作者! 地址:http://www.cprogramming.com/c++11/rvalue-references-and-move-semantics-in-c++11.html C++一直致力于生成快速的程序.不幸的是,直到C++11之前,这里一直有一个降低C++程序速度的顽症:临时变量的创建.有时这些临时变量可以被编译器优化(例如返回值优化),但是这并不总是可行的,通常这会导致高昂的对象复制成本.我说的是怎么回事呢? 让我们

一起学习c++11——c++11中的新语法

c++11新语法1: auto关键字 c++11 添加的最有用的一个特性应该就是auto关键字. 不知道大家有没有写过这样的代码: std::map<std::string, std::vector<std::shared_ptr<std::list<T> > > > map; std::map<std::string, std::vector<std::shared_ptr<std::list<T> > > >