os.walk简介

os.walk

转载文章

os.walk的参数如下:

os.walk(top, topdown=True, onerror=None, followlinks=False)

其中:

  • top是要遍历的目录。
  • topdown是代表要从上而下遍历还是从下往上遍历。
  • onerror可以用来设置当便利出现错误的处理函数(该函数接受一个OSError的实例作为参数),设置为空则不作处理。
  • followlinks表示是否要跟随目录下的链接去继续遍历,要注意的是,os.walk不会记录已经遍历的目录,所以跟随链接遍历的话有可能一直循环调用下去。

os.walk返回的是一个3个元素的元组 (root, dirs, files) ,分别表示遍历的路径名,该路径下的目录列表和该路径下文件列表。注意目录列表和文件列表不是具体路径,需要具体路径(从root开始的路径)的话可以用 os.path.join(root,dir) 和 os.path.join(root,dir) 。

例子

假设现在存在如下的文件和目录结构:

?  test_os_walk git:(master) ? tree
.
├── a.py
├── b.py
├── c.py
├── dir1
│   ├── dir4
│   │   ├── g.py
│   │   └── h.py
│   ├── dirx
│   │   ├── diry
│   │   │   └── k.py
│   │   └── z.py
│   ├── e.py
│   ├── f.py
│   └── g.py
├── dir2
│   ├── dira
│   │   └── dirb
│   │       └── dirc
│   │           └── aha.py
│   ├── k.py
│   ├── l.py
│   └── m.py
└── dir3
    ├── dir5
    │   └── z.py
    ├── x.py
    └── y.py

10 directories, 17 files

测试topdown

当我用 os.walk 遍历这个目录时,程序和输出如下:

import os

path = ‘/Users/nisen/Projects/python_advanced_class/test/test_os_walk‘

for root, dirs, files in os.walk(path, True):
    print ‘root: %s‘ % root
    print ‘dirs: %s‘ % dirs
    print ‘files: %s‘ % files
    print ‘‘

结果如下,从root的路径可以看出遍历是自上而下的:

?  test git:(master) ? python test11.py
root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk
dirs: [‘dir1‘, ‘dir2‘, ‘dir3‘]
files: [‘a.py‘, ‘b.py‘, ‘c.py‘]

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir1
dirs: [‘dir4‘, ‘dirx‘]
files: [‘e.py‘, ‘f.py‘, ‘g.py‘]

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir1/dir4
dirs: []
files: [‘g.py‘, ‘h.py‘]

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir1/dirx
dirs: [‘diry‘]
files: [‘z.py‘]

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir1/dirx/diry
dirs: []
files: [‘k.py‘]

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir2
dirs: [‘dira‘]
files: [‘k.py‘, ‘l.py‘, ‘m.py‘]

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir2/dira
dirs: [‘dirb‘]
files: []

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir2/dira/dirb
dirs: [‘dirc‘]
files: []

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir2/dira/dirb/dirc
dirs: []
files: [‘aha.py‘]

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir3
dirs: [‘dir5‘]
files: [‘x.py‘, ‘y.py‘]

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir3/dir5
dirs: []
files: [‘z.py‘]

而当设置os.walk的topdown为False时,结果如下, 可以看出他是自上而下遍历的:

?  test git:(master) ? python test11.py
root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir1/dir4
dirs: []
files: [‘g.py‘, ‘h.py‘]

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir1/dirx/diry
dirs: []
files: [‘k.py‘]

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir1/dirx
dirs: [‘diry‘]
files: [‘z.py‘]

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir1
dirs: [‘dir4‘, ‘dirx‘]
files: [‘e.py‘, ‘f.py‘, ‘g.py‘]

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir2/dira/dirb/dirc
dirs: []
files: [‘aha.py‘]

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir2/dira/dirb
dirs: [‘dirc‘]
files: []

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir2/dira
dirs: [‘dirb‘]
files: []

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir2
dirs: [‘dira‘]
files: [‘k.py‘, ‘l.py‘, ‘m.py‘]

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir3/dir5
dirs: []
files: [‘z.py‘]

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk/dir3
dirs: [‘dir5‘]
files: [‘x.py‘, ‘y.py‘]

root: /Users/nisen/Projects/python_advanced_class/test/test_os_walk
dirs: [‘dir1‘, ‘dir2‘, ‘dir3‘]
files: [‘a.py‘, ‘b.py‘, ‘c.py‘]

运行时修改遍历目录

当topdown设置为True时,可以在处理时修改返回的 dirs 列表,这样可以遍历下面的目录时会根据修改后的 dirs来遍历。比如下面的例子,在遍历的时候不把"CSV"目录包括在内:

import os
from os.path import join, getsize
for root, dirs, files in os.walk(‘python/Lib/email‘):
    print root, "consumes",
    print sum(getsize(join(root, name)) for name in files),
    print "bytes in", len(files), "non-directory files"
    if ‘CVS‘ in dirs:
        dirs.remove(‘CVS‘)  # don‘t visit CVS directories

原文地址:https://www.cnblogs.com/wangyi429111/p/8723683.html

时间: 2024-10-31 14:07:35

os.walk简介的相关文章

[py]os.walk爬目录&sys.argv灵活获取参数

1, 遍历目录 os.walk('/tmp') os.next() ? 2,sys.argv ######################################## [email protected]:~/t$ cat t8.py import sys name=sys.argv[1] #获取参数 age=sys.argv[2] ? info=''' name:%s age :%s ''' %(name,age) ? print info print "#"*40 print

Python:关于os.path.isdir,os.path.exists,os.walk无法识别“~/" HOME目录的问题。

在编写Python脚本的时候,我发现,os.path.isdir,os.path.exists,os.walk 根本无法识别 ‘~/‘ 表示的HOME目录.例如: Python 2.7.12 (default, Jul 18 2016, 10:55:51) [GCC 6.1.1 20160621 (Red Hat 6.1.1-3)] on linux2 Type "help", "copyright", "credits" or "li

遍历目录下的所有文件-os.walk

1 #coding:utf-8 2 3 import os 4 5 6 for root,dirs,files in os.walk("D:"): 7 for fileItem in files: 8 print root + os.sep + fileItem 结果如下 遍历目录下的所有文件-os.walk,布布扣,bubuko.com

python【使用简单的os.walk生成目录树】

思路比较简单,使用os.walk 生成目录信息,然后再进行字符串操作,所以没有其他比较复杂的逻辑,但是生成的效果也比较简单,自己看看到是可以哈. 代码如下 # -*- coding: utf-8 -*- ''' Created on July 22, 2017 @author: hehe1234567 ''' import os def simple_dir_tree(ddir): for dirpath,dirnames,filenames in os.walk(ddir.strip(os.s

Python os.walk() 方法

#coding=utf-8 import os #(dirpath, dirnames, filenames)[文件夹路径, 文件夹名字, 文件名] def file_name(file_dir): for root, dirs, files in os.walk(file_dir): for name in files: print(os.path.join(root,name)) for name in dirs: print(os.path.join(root, name)) #print

Python之os.walk()

#http://www.cnblogs.com/bluescorpio/archive/2009/10/21/1587493.html os.walk() 返回结果:可以得到一个(dirpath, dirnames, filenames), 其中第一个为基础路径, 第二个为基础路径下的文件夹,为一个list 第三个是基础路径下的文件,为一个list 用于循环遍历某个目录下所有的文件和文件夹,以及文件夹下文件或文件夹非常方便--

python os.walk()和os.path.walk()

一.os.walk() 函数声明:os.walk(top,topdown=True,onerror=None) (1)参数top表示需要遍历的顶级目录的路径. (2)参数topdown的默认值是“True”表示首先返回顶级目录下的文件,然后再遍历子目录中的文件.当topdown的值为"False"时,表示先遍历子目录中的文件,然后再返回顶级目录下的文件. (3)参数onerror默认值为"None",表示忽略文件遍历时的错误.如果不为空,则提供一个自定义函数提示错误

知识点: os.walk使用详解

os.walk(top, topdown=True, onerror=None, followlinks=False) 可以得到一个三元tupple(dirpath, dirnames, filenames), 第一个为起始路径,第二个为起始路径下的文件夹,第三个是起始路径下的文件. dirpath 是一个string,代表目录的路径, 遍历过程中是不断变化的 dirnames 是一个list,包含了dirpath下所有子目录的名字.(只是目录名,没有全路径) filenames 是一个list

os.walk 查看目录大小

# 又学到了.. def Test1(rootDir): tmp_lst = [] for root,dirs,file in os.walk(rootDir): for f in file: tmp_lst.append(root+os.sep+f) size = 0 for i in tmp_lst: size += os.stat(i).st_size return size r = Test1('d:\\test') print(r)