什么事CSV文件?csv格式的文件标准
目录
- 更多分享:www.catbro.cn
概念
- 逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。
- 纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。
- CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。
- 通常,所有记录都有完全相同的字段序列。通常都是纯文本文件。建议使用WORDPAD或是记事本(NOTE)来开启,再则先另存新档后用EXCEL开启,也是方法之一。
- CSV文件格式的通用标准并不存在,但是在RFC 4180中有基础性的描述。使用的字符编码同样没有被指定,但是7-bitASCII是最基本的通用编码。
特征
CSV”泛指具有以下特征的任何文件:
-
纯文本,使用某个字符集,比如ASCII、Unicode、EBCDIC或GB2312;
-
由记录组成(典型的是每行一条记录);
-
每条记录被分隔符分隔为字段(典型分隔符有逗号、分号或制表符;有时分隔符可以包括可选的空格);
-
每条记录都有同样的字段序列。
规则
-
1 开头是不留空,以行为单位。
-
2 可含或不含列名,含列名则居文件第一行。
-
3 一行数据不跨行,无空行。
-
4 以半角逗号(即,)作分隔符,列为空也要表达其存在。
-
5 列内容如存在半角引号(即"),替换成半角双引号("")转义,即用半角引号(即"")将该字段值包含起来。
-
6 文件读写时引号,逗号操作规则互逆。
-
7 内码格式不限,可为 ASCII、Unicode 或者其他。
-
8 不支持数字
-
9 不支持特殊字
##注意事项
- 如果你的机器上装了 Microsoft Excel的话,.csv 文件默认是被Excel打开的。需要注意的是,当你双击一个.CSV 文件,Excel 打开它以后即使不做任何的修改,在关闭的时候 Excel 往往会提示是否要改成正确的文件格式,这个时候如果选择“是”,因为 Excel 认为.CSV 文件中的数字是要用科学记数法来表示的,Excel 会把 CSV 文件中所有的数字用科学计数来表示(2.54932E+5 这种形式),这样操作之后,只是在 Excel 中显示的时候会不正常,而 csv 文件由于是纯文本文件,在使用上没有影响;如果选择了“否”,那么会提示你以 xls 格式另存为 Excel 的一个副本。