逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。通常都是纯文本文件。建议使用WORDPAD或是记事本来开启,再则先另存新档后用EXCEL开启,也是方法之一。
CSV文件格式的通用标准并不存在,但是在RFC 4180中有基础性的描述。使用的字符编码同样没有被指定,但是bitASCII是最基本的通用编码。
规则:
1 开头是不留空,以行为单位。
2 可含或不含列名,含列名则居文件第一行。
3 一行数据不跨行,无空行。
4 以半角逗号(即,)作分隔符,列为空也要表达其存在。
5列内容如存在半角引号(即"),替换成半角双引号("")转义,即用半角引号(即"")将该字段值包含起来。
6文件读写时引号,逗号操作规则互逆。
7内码格式不限,可为 ASCII、Unicode 或者其他。
8不支持数字(这里理解为字符)
9不支持特殊字符
举例说明
年 |
制造商 |
型号 |
说明 |
价值 |
1997 |
Ford |
E350 |
ac, abs, moon |
3000.00 |
1999 |
Chevy |
Venture "Extended Edition" |
4900.00 |
|
1999 |
Chevy |
Venture "Extended Edition, Very Large" |
5000.00 |
|
1996 |
Jeep |
Grand Cherokee |
MUST SELL! air, moon roof, loaded |
4799.00 |
上面表格内容若以CSV格式表示就会像下列:
年,制造商,型号,说明,价值
1997,Ford,E350,"ac, abs, moon",3000.00
1999,Chevy,"Venture ""Extended Edition""","",4900.00
1999,Chevy,"Venture ""Extended Edition, Very Large""","",5000.00
1996,Jeep,Grand Cherokee,"MUST SELL!
air, moon roof, loaded",4799.00
以上这个CSV的例子说明了:
- 包含逗号, 双引号, 或是换行符的字段必须放在引号内.
- 字段内部的引号必须在其前面增加一个引号来实现文字引号的转码.
- 分隔符逗号前后的空格 可能不会 被修剪掉. 这是RFC 4180的要求.
- 元素中的换行符将被保留下来.
Excel 文件可直接另存为 .csv格式文件,查看转换效果 -- 2019.11.26
原文地址:https://www.cnblogs.com/guorongtao/p/11933172.html