Python 用 os.walk 遍历目录

今天第一次进行 文件遍历,自己递归写的时候还调试了好久,(主要因为分隔符号的问题),后来发现了os.walk方法,就忍不住和大家分享下.

先看下代码:

import os

for i in os.walk(‘c:‘+os.sep+‘ant‘):
    print i[1]

下面是输出:

c:\ant
c:\ant\bin
c:\ant\docs
c:\ant\docs\ant2
c:\ant\docs\antlibs
c:\ant\docs\antlibs\antunit
c:\ant\docs\antlibs\compress
c:\ant\docs\antlibs\dotnet
c:\ant\docs\antlibs\props
c:\ant\docs\antlibs\svn
c:\ant\docs\images
c:\ant\docs\manual
c:\ant\docs\manual\api
c:\ant\docs\manual\api\org
c:\ant\docs\manual\api\org\apache
c:\ant\docs\manual\api\org\apache\tools
c:\ant\docs\manual\api\org\apache\tools\ant
c:\ant\docs\manual\api\org\apache\tools\ant\dispatch
c:\ant\docs\manual\api\org\apache\tools\ant\filters

后面还有很长.

如果不使用这个方法,遍历同样能达到效果.不过使用 os.walk 方便很多了.这个方法返回的是一个三元tupple(dirpath, dirnames, filenames),

其中第一个为起始路径,

第二个为起始路径下的文件夹,

第三个是起始路径下的文件.
dirpath是一个string,代表目录的路径,

dirnames是一个list,包含了dirpath下所有子目录的名字,

filenames是一个list,包含了非目录文件的名字.这些名字不包含路径信息,如果需要得到全路径,需要使用 os.path.join(dirpath, name).

下面是可以看到 os.walk 方法返回的内容.

代码:

import os

for i in os.walk(‘c:‘+os.sep+‘ant‘):
    print i
    
输出:

(‘c:\\ant‘, [‘bin‘, ‘docs‘, ‘etc‘, ‘lib‘, ‘Project‘], [‘fetch.xml‘, ‘get-m2.xml‘, ‘INSTALL‘, ‘KEYS‘, ‘LICENSE‘, ‘NOTICE‘, ‘README‘, ‘WHATSNEW‘])
(‘c:\\ant\\bin‘, [], [‘ant‘, ‘ant.bat‘, ‘ant.cmd‘, ‘antenv.cmd‘, ‘antRun‘, ‘antRun.bat‘, ‘antRun.pl‘, ‘complete-ant-cmd.pl‘, ‘envset.cmd‘, ‘lcp.bat‘, ‘runant.pl‘, ‘runant.py‘, ‘runrc.cmd‘])
(‘c:\\ant\\docs‘, [‘ant2‘, ‘antlibs‘, ‘images‘, ‘manual‘, ‘projects‘, ‘slides‘, ‘webtest‘], [‘antnews.html‘, ‘ant_in_anger.html‘, ‘ant_task_guidelines.html‘, ‘appendix_e.pdf‘, ‘breadcrumbs.js‘, ‘bugs.html‘, ‘bylaws.html‘, ‘contributors.html‘, ‘external.html‘, ‘faq.html‘, ‘favicon.ico‘, ‘index.html‘, ‘legal.html‘, ‘LICENSE‘, ‘license.html‘, ‘mail.html‘, ‘mission.html‘, ‘nightlies.html‘, ‘page.css‘, ‘problems.html‘, ‘projects.html‘, ‘resources.html‘, ‘svn.html‘])
(‘c:\\ant\\docs\\ant2‘, [], [‘actionlist.html‘, ‘features.html‘, ‘FunctionalRequirements.html‘, ‘original-specification.html‘, ‘requested-features.html‘, ‘requested-features.txt‘, ‘VFS.txt‘])
(‘c:\\ant\\docs\\antlibs‘, [‘antunit‘, ‘compress‘, ‘dotnet‘, ‘props‘, ‘svn‘], [‘bindownload.cgi‘, ‘bindownload.html‘, ‘charter.html‘, ‘index.html‘, ‘proper.html‘, ‘sandbox.html‘, ‘srcdownload.cgi‘, ‘srcdownload.html‘])
(‘c:\\ant\\docs\\antlibs\\antunit‘, [], [‘index.html‘])
(‘c:\\ant\\docs\\antlibs\\compress‘, [], [‘index.html‘])
(‘c:\\ant\\docs\\antlibs\\dotnet‘, [], [‘index.html‘])
(‘c:\\ant\\docs\\antlibs\\props‘, [], [‘index.html‘])

...

当然后面还有很长了.

有了这个函数无论是遍历文件夹,还是遍历文件都很方便.

下面是我是自己用递归实现的遍历文件方法.

代码:

def listdir(leval,path):
    for i in os.listdir(path):
        print(‘|  ‘*(leval + 1) + i) 
        if os.path.isdir(path+i):
            listdir(leval+1, path+i)

path = ‘c:‘+os.sep+‘ant‘

#或者直接 path=‘C:/ant‘ 
print(path+os.sep)
listdir(0, path+os.sep)

下面是输出:

c:\ant\
|  bin
|  |  ant
|  |  ant.bat
|  |  ant.cmd
|  |  antenv.cmd
|  |  antRun
|  |  antRun.bat
|  |  antRun.pl
|  |  complete-ant-cmd.pl
|  |  envset.cmd
|  |  lcp.bat
|  |  runant.pl
|  |  runant.py
|  |  runrc.cmd
|  docs
|  |  ant2
|  |  antlibs
|  |  antnews.html
|  |  ant_in_anger.html
|  |  ant_task_guidelines.html
|  |  appendix_e.pdf
|  |  breadcrumbs.js
|  |  bugs.html
|  |  bylaws.html
|  |  contributors.html
|  |  external.html
|  |  faq.html
|  |  favicon.ico
|  |  images
|  |  index.html
|  |  legal.html
|  |  LICENSE
|  |  license.html
|  |  mail.html
|  |  manual
|  |  mission.html
|  |  nightlies.html
|  |  page.css
|  |  problems.html
|  |  projects
|  |  projects.html
|  |  resources.html
|  |  slides
|  |  svn.html
|  |  webtest
|  etc
|  |  ant-bootstrap.jar
|  |  changelog.xsl
|  |  checkstyle
|  |  coverage-frames.xsl
|  |  jdepend-frames.xsl
|  |  jdepend.xsl
|  |  junit-frames-xalan1.xsl
|  |  junit-frames.xsl
|  |  junit-noframes.xsl
|  |  log.xsl
|  |  maudit-frames.xsl
|  |  mmetrics-frames.xsl
|  |  tagdiff.xsl
|  fetch.xml
|  get-m2.xml
|  INSTALL
|  KEYS
|  lib
|  |  ant-1.8.0.pom
|  |  ant-1.8.0.pom.md5
|  |  ant-1.8.0.pom.sha1
|  |  ant-1.8.0.pom.sha512

..

如果只想得到文件夹,而不要文件,把要做的事情放到

if os.path.isdir(path+i):

里面就好了,比如: print()

O(∩_∩)O~

时间: 2024-10-13 18:07:56

Python 用 os.walk 遍历目录的相关文章

python中os.walk()遍历目录中所有文件

之前一直用判断目录和文件的递归方法来获取一个目录下的所有文件,后来发现python里面已经写好了这个函数,不需要自己递归获取了,记录下os.walk()函数的用法 目的:获取path下所有文件,返回由形如"C:\Program Files\Realtek\Audio\HDA\RtkNGUI64.exe"组成的列表[] 方法:os.walk(path) 返回包含(dir,folder,file)三种信息的generator(它具体是什么我也不咋明白),其中file为文件名(RtkNGUI

利用 os.walk() 遍历目录

os.walk: walk(top, topdown=True, onerror=None, followlinks=False) 参数: top 要遍历的目录地址 topdown 为真,则优先遍历top目录,否则优先遍历top的子目录(默认为True)(广度深度) onerror 需要一个 callable 对象,当walk需要异常时,会调用 followlinks 如果为真,则会遍历目录下的快捷方式 os.walk 的返回值是一个生成器(generator), 他会不断的遍历所给目录下的所有

python中os.walk浏览目录和文件

#!/usr/bin/env python # 2.py # use UTF-8 # Python 3.3.0 # os.walk()的使用 import os # 枚举dirPath目录下的所有文件 def main(): #begin fileDir = "F:" + os.sep + "aaa" # 查找F:\aaa 目录下 for root, dirs, files in os.walk(fileDir): #begin print(root) print(

python os.walk()遍历

os.walk()遍历 import os p='/bin' #设定一个路径 for i in os.walk(p): #返回一个元组 print (i[0]) #第一个元素是目录 print (i[1]) #第二个元素是文件夹 print (i[2]) #第三全元素是文件 返回一个元组,内有3个元素.第一个是路径.第二个是文件夹.第三个是文件

python【使用简单的os.walk生成目录树】

思路比较简单,使用os.walk 生成目录信息,然后再进行字符串操作,所以没有其他比较复杂的逻辑,但是生成的效果也比较简单,自己看看到是可以哈. 代码如下 # -*- coding: utf-8 -*- ''' Created on July 22, 2017 @author: hehe1234567 ''' import os def simple_dir_tree(ddir): for dirpath,dirnames,filenames in os.walk(ddir.strip(os.s

[py]os.walk爬目录&sys.argv灵活获取参数

1, 遍历目录 os.walk('/tmp') os.next() ? 2,sys.argv ######################################## [email protected]:~/t$ cat t8.py import sys name=sys.argv[1] #获取参数 age=sys.argv[2] ? info=''' name:%s age :%s ''' %(name,age) ? print info print "#"*40 print

python中os.walk的用法详解

python中os.walk是一个简单易用的文件.目录遍历器,可以帮助我们高效的处理文件.目录方面的事情. 1.载入要使用os.walk,首先要载入该函数 可以使用以下两种方法 import os from os import walk 2.使用 os.walk的函数声明为: walk(top, topdown=True, οnerrοr=None, followlinks=False) 参数 top 是你所要便利的目录的地址 topdown 为真,则优先遍历top目录,否则优先遍历top的子目

Python 之 os.walk()

原文地址https://www.cnblogs.com/JetpropelledSnake/p/8982495.html          http://www.runoob.com/python/os-walk.html os.walk方法,主要用来遍历一个目录内各个子目录和子文件. os.walk(top, topdown=True, onerror=None, followlinks=False) 可以得到一个三元tupple(dirpath, dirnames, filenames),

Python之os.walk()

#http://www.cnblogs.com/bluescorpio/archive/2009/10/21/1587493.html os.walk() 返回结果:可以得到一个(dirpath, dirnames, filenames), 其中第一个为基础路径, 第二个为基础路径下的文件夹,为一个list 第三个是基础路径下的文件,为一个list 用于循环遍历某个目录下所有的文件和文件夹,以及文件夹下文件或文件夹非常方便--