文件分类 几种文件分类的形式

文件分类的一般流程

# 1,需要处理的文件
# 2.创建保存文件的列表
# 3.写入文件
# 4.关闭文件

事例一.

QQlist=[5,6,7,8,9,10,11,"小垃圾"]
filepath = r"G:\我的python\python基础\day12\QQ\QQGood.txt"
file = open(filepath,"rb")
mylist = file.readlines()
file.close()

# 创建文件对象 存放到列表中
filelist=[]
for i in QQlist:
    QQfilepath = "G:\\我的python\\python基础\\day12\\QQ\\QQ位数分类\\"+str(i)+"位QQ.txt"
    QQfile = open(QQfilepath,"wb")
    filelist.append(QQfile)

# 分类位置
for line in mylist:
    bakline = line
    line = line.decode("utf-8")
    linelist = line.split("----")
    length = len(linelist[0])  # 取账号的长度

    if length == 5:
        filelist[0].write(bakline)
    elif length == 6:
        filelist[1].write(bakline)
    elif length == 7:
        filelist[2].write(bakline)
    elif length == 8:
        filelist[3].write(bakline)
    elif length == 9:
        filelist[4].write(bakline)
    elif length == 10:
        filelist[5].write(bakline)
    elif length == 11:
        filelist[6].write(bakline)
    else:
        filelist[7].write(bakline)
# 关闭文件
for  QQfile  in filelist:
    QQfile.close()

事例二

import codecs

# 1,需要处理的文件
filepath = r"G:\我的python\尹成\python基础\day12\kaifang\kaifangGood.txt"
file = codecs.open(filepath,"rb","utf-8","ignore")
mylist = file.readlines()
file.close()
print("内存加载结束,准备区域划分")

# 2.创建保存文件的列表
area = [ age for age in range(1000,2018)]
length = len(area)

areafilelist = []
for data in area:
    areafilepath = "G:\\我的python\\尹成\\python基础\\day12\\kaifang\\年龄\\" + str(data) + ".txt"
    areafile = open(areafilepath,"wb")
    areafilelist.append(areafile)

# 3.写入文件
for line in mylist:
    linelist = line.split(",")
    chstr = linelist[1][6:10]  # 取出一个字符
    for i in range(length):
        if str(area[i]) == chstr:
            areafilelist[i].write(line.encode("utf-8"))

# 4.关闭文件
for data in areafilelist:
    data.close()

事例三 (按照身份证号码取)

import codecs
filepath = r"G:\我的python\python基础\day12\kaifang\kaifangGood.txt"
file = codecs.open(filepath,"rb","utf-8","ignore")
mylist = file.readlines()
file.close()
print("内存加载结束,准备区域划分")

# 分类器
area=[[11,"北京"],[12,"天津"],[13,"河北"],[14,"山西"],[15,"内蒙古"],[21,"辽宁"],[22,"吉林"],[23,"黑龙江"],[31,"上海"],[32,"江苏"],[33,"浙江"],[34, "安徽"],[35,"福建"],[36,"江西"],[37,"山东"],[41,"河南"],[42,"湖北"],
         [43, "湖南"],[44,"广东"],[45,"广西"],[46,"海南"],[50,"重庆"],
         [51, "四川"],[52,"贵州"],[53,"云南"],[54,"西藏"],[61,"陕西"],
         [62, "甘肃"],[63,"青海"],[64,"宁夏"],[65,"新疆"],[71,"台湾"],
         [81, "香港"],[82,"澳门"]]
length=len(area)#长度

# 创建区域文件的对象
areafilelist = []
for data in area:
    kffilefath = "G:\\我的python\\python基础\\day12\\kaifang\\省份\\" + data[1] + ".txt"
    kffile = open(kffilefath,"wb")
    areafilelist.append(kffile)

for line in mylist:
    linelist = line.split(",")  # 字符串切割
    chstr = linelist[1][0:2]  # 取出月份
    # 判断身份证所在的地区
    for i in range(length):
        if str(area[i][0]) == chstr:
            areafilelist[i].write(line.encode("utf-8"))
            break

# 关闭文件
for line in areafilelist:
    line.close()
length=len(area)#长度

# 创建区域文件的对象
areafilelist = []
for data in area:
    kffilefath = "G:\\我的python\\尹成\\python基础\\day12\\kaifang\\区域\\" + data[1] + ".txt"
    kffile = open(kffilefath,"wb")
    areafilelist.append(kffile)

# 分类写入数据
for line in mylist:
    linelist = line.split(",")  # 字符串切割
    chstr = linelist[1][0:2]  # 取出2个字符
    # 判断身份证所在的地区
    for i in range(length):
        if str(area[i][0]) == chstr:
            areafilelist[i].write(line.encode("utf-8"))
            break

# 关闭文件
for line in areafilelist:
    line.close()

原文地址:https://www.cnblogs.com/wang102030/p/9353718.html

时间: 2024-07-29 21:23:14

文件分类 几种文件分类的形式的相关文章

将根文件夹内的所有子文件夹内的文件进行按比例分类。。。。。by Matlab

之所以写这段代码,是为了分类文件夹内的所有文件,因为做训练用的数据真的太多了,所以,写了一段Matlab,让其自动按比例分类. main: 1 %文件夹路径,不同设备,读取字符不同 2 clear all 3 clc 4 5 %% 选择要分的文件夹路径/存放路径/文件夹名称 6 fprintf('选择Train文件夹\r'); 7 pause(2) 8 path=uigetdir('选择待分析的文件夹'); 9 if path ==0 10 fprintf('取消选择文件夹') 11 end 1

VS 2010不显示头文件源文件和所有以前分类的文件夹,*.h 和*.cpp都显示在同一个文件

打开VS后不显示头文件源文件和所有以前分类的文件夹,*.h 和*.cpp都显示在同一个文件 点击右图红色指示显示所有文件夹按钮,就能恢复.

make自动生成依赖文件的两种形式

最近编译源文件发现当修改头文件后,make并不会自动把包含此头文件的所有源文件重新编译,而每次都是需要把对应的中间文件清除才能重新编译,非常的麻烦.因此需要make自动对源文件所依赖的头文件进行管理,即make自动生成依赖文件.鉴于本人的刚开始写的博客,很多方面经验不足,比如如何介绍我所用到的知识等,现在只是对我在过程中遇到的问题进行记录,相关的知识可以查看gnu make中文文档,上网等等. 遇到的问题记录如下:1.make在生成依赖文件后并不正确:原因是生成的依赖文件中的目标文件(.d与.o

文件类型分类:头文件dirent.h中定义的文件类型与linux内文件符号对应关系

头文件 dirent.h 定义了文件类型: enum{    DT_UNKNOWN = 0,         //未知类型    DT_FIFO = 1,            //first in, first out 类似于管道, 有名管道    DT_CHR = 2,             //字符设备文件    DT_DIR = 4,             //目录    DT_BLK = 6,             //块设备文件    DT_REG = 8,          

一种文件捆绑型病毒研究

一种文件捆绑型病毒研究宁 轲(广西职业技术学院 广西 南宁 530226) 摘 要: 文件捆绑型计算机病毒具有隐蔽性高.传播速度快和破坏力强等特点,早些年出现的威金病毒和熊猫烧香病毒都属于文件捆绑型病毒.本文对文件捆绑型病毒的其中一种模式做了技术上的分析和研究,最后给出了一些识别和防范此类病毒的方法.     关键词: 计算机病毒:文件捆绑:传播机制     中图分类号:TP3 文献标识码:A 文章编号:1671-7597(2013)0110227-01 文件捆绑型病毒简单说就是病毒感染了其它文

Gluon炼丹(Kaggle 120种狗分类,迁移学习加双模型融合)

http://www.cnblogs.com/fiercex/p/7927804.html fiercex 路漫漫其修远兮,吾将上下而求索 Gluon炼丹(Kaggle 120种狗分类,迁移学习加双模型融合) 这是在kaggle上的一个练习比赛,使用的是ImageNet数据集的子集.注意,mxnet版本要高于0.12.1b2017112.下载数据集. train.zip test.zip labels然后解压在data文件夹下 1. 数据 1.1 整理数据 将解压后的数据整理成Gluon能够读取

oracle rename数据文件的两种方法

oracle rename数据文件的两种方法 2012-12-11 20:44 10925人阅读 评论(0) 收藏 举报  分类: oracle(98)  版权声明:本文为博主原创文章,未经博主允许不得转载. 第一种 alter tablespace users rename datafile '==' to '***'; 这种方式需要数据库处于open状态,表空间在offline的状态下才能更改. [sql] view plain copy SQL> alter tablespace user

读取Excel文件的两种方法

第一种方法:传统方法,采用OleDB读取EXCEL文件, 优点:写法简单,缺点:服务器必须安有此组件才能用,不推荐使用 private DataSet GetConnect_DataSet2(string fileName) { DataSet myDataSet = new DataSet(); //创建一个数据链接 string strCon = " Provider = Microsoft.Jet.OLEDB.4.0 ; Data Source = " + fileName +

SpringMVC加载配置Properties文件的几种方式

最近开发的项目使用了SpringMVC的框架,用下来感觉SpringMVC的代码实现的非常优雅,功能也非常强大, 网上介绍Controller参数绑定.URL映射的文章都很多了,写这篇博客主要总结一下SpringMVC加载配置Properties文件的几种方式 通过读取Config文件的配置例如: Map<String, String> group = ConfigurationManager.GetConfiguration("config1"); this.setBcp