目录

什么事CSV文件?csv格式的文件标准

http://image.catbro.cn/45ffd38ecd30d.png

概念

  • 逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。
  • 纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。
  • CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。
  • 通常,所有记录都有完全相同的字段序列。通常都是纯文本文件。建议使用WORDPAD或是记事本(NOTE)来开启,再则先另存新档后用EXCEL开启,也是方法之一。
  • CSV文件格式的通用标准并不存在,但是在RFC 4180中有基础性的描述。使用的字符编码同样没有被指定,但是7-bitASCII是最基本的通用编码。

特征

CSV”泛指具有以下特征的任何文件:

  • 纯文本,使用某个字符集,比如ASCII、Unicode、EBCDIC或GB2312;

  • 由记录组成(典型的是每行一条记录);

  • 每条记录被分隔符分隔为字段(典型分隔符有逗号、分号或制表符;有时分隔符可以包括可选的空格);

  • 每条记录都有同样的字段序列。

规则

  • 1 开头是不留空,以行为单位。

  • 2 可含或不含列名,含列名则居文件第一行。

  • 3 一行数据不跨行,无空行。

  • 4 以半角逗号(即,)作分隔符,列为空也要表达其存在。

  • 5 列内容如存在半角引号(即"),替换成半角双引号("")转义,即用半角引号(即"")将该字段值包含起来。

  • 6 文件读写时引号,逗号操作规则互逆。

  • 7 内码格式不限,可为 ASCII、Unicode 或者其他。

  • 8 不支持数字

  • 9 不支持特殊字

##注意事项

  • 如果你的机器上装了 Microsoft Excel的话,.csv 文件默认是被Excel打开的。需要注意的是,当你双击一个.CSV 文件,Excel 打开它以后即使不做任何的修改,在关闭的时候 Excel 往往会提示是否要改成正确的文件格式,这个时候如果选择“是”,因为 Excel 认为.CSV 文件中的数字是要用科学记数法来表示的,Excel 会把 CSV 文件中所有的数字用科学计数来表示(2.54932E+5 这种形式),这样操作之后,只是在 Excel 中显示的时候会不正常,而 csv 文件由于是纯文本文件,在使用上没有影响;如果选择了“否”,那么会提示你以 xls 格式另存为 Excel 的一个副本。