目录

Python杂乱知识点

字符串

  • Python3.0中,所有字符串都是Unicode字符串
  • 原始字符串,字符串前加r: r string
  • 原始字符串最后不能是反斜线

数据结构

列表:可以修改

  • 列表为可变的集合
  • 不要使用list做为列表名,因为list是python内建函数
  • count():该方法并不是计算列表的长度哦,而是计算某个元素在列表的出现次数
  • index():并不是根据下标获取值哦,而是根据值获取对应的下标

元组:不可修改

序列

  • 检查值是否在序列中:in

os

1 os.name #显示当前使用的平台

2 os.getcwd() #显示当前python脚本工作路径

3 os.listdir(‘dirname’) #返回指定目录下的所有文件和目录名

4 os.remove(‘filename’) #删除一个文件

5 os.makedirs(‘dirname/dirname’) #可生成多层递规目录

6 os.rmdir(‘dirname’) #删除单级目录

7 os.rename(“oldname”,“newname”) #重命名文件

8 os.system() #运行shell命令,注意:这里是打开一个新的shell,运行命令,当命令结束后,关闭shell

9 os.sep #显示当前平台下路径分隔符

10 os.linesep #给出当前平台使用的行终止符

11 os.environ #获取系统环境变量

12 os.path.abspath(path) #显示当前绝对路径

13 os.path.dirname(path) #返回该路径的父目录

14 os.path.basename(path) #返回该路径的最后一个目录或者文件,如果path以/或\结尾,那么就会返回空值。

15 os.path.isfile(path) #如果path是一个文件,则返回True

16 os.path.isdir(path) #如果path是一个目录,则返回True

17 os.stat() #获取文件或者目录信息

18 os.path.split(path) #将path分割成路径名和文件名。(事实上,如果你完全使用目录,它也会将最后一个目录作为文件名而分离,同时它不会判断文件或目录是否存在)

19 os.path.join(path,name) #连接目录与文件名或目录 结果为path/name

None

  • python内建值,表示什么都没有

解析处理

  • Tidy 修复html格式错误

  • urlparse 获取服务器上下文

  • robotparser 解析robots.txt

  • Beautiful Soup 解析网页

  • mechanize

  • Pillow 验证码处理

  • pytesseracta 光学处理图像

  • virtualenv 虚拟环境