修改读入的CSV文件中的列名

df.rename的用法

存在这样一个CSV文件,想读入文件后,将其列名进行修改,并再写到CSV中.

日期,收盘changeColName,涨跌幅,换手率,振幅,内盘成交量,外盘成交量,金额流入率,大单流入资金,大单流出资金,超大单流入资金,超大单流出资金,大单金额流入率,超大单金额流入率
2010-01-04,47.3,-3.272,0.69437708,0.037423313,,,-8.099998782,56272128,63797540,1235515,2807990,-6.699998366,-1.400000416
2010-01-05,46.65,-1.3742,1.009538457,0.026638478,,,-7.000001914,84605408,97264176,16183990,14741852,-7.900002071,0.900000157
2010-01-06,46.84,0.4073,0.941143214,0.019506967,,,-1.199996446,72186448,86293568,44122280,31816064,-9.399997926,8.20000148
2010-01-07,45.85,-2.1136,0.553292649,0.023270709,,,0.799993095,41697248,48400152,12012986,4613683,-7.700006626,8.499999721
2010-01-08,46.69,1.8321,0.891040511,0.033805889,,,1.800001548,52810168,49703684,55069420,55634236,2.200002522,-0.400000974

python代码如下:

# -*- coding: UTF-8 -*-
import numpy as np
import pandas as pd

colName = {
	‘日期‘   : ‘Date‘,
	‘开盘价‘ : ‘Open‘,
	‘收盘价‘ : ‘Close‘,
	‘最高价‘ : ‘High‘,
	‘最低价‘ : ‘Low‘,
	‘涨跌‘   : ‘UpPrice‘,
	‘涨跌幅‘ : ‘UpPercent‘,
	‘三日均涨幅‘ : ‘MUpPert3‘,
	‘五日均涨幅‘ : ‘MUpPert5‘,
	‘十日均涨幅‘ : ‘MUpPert10‘,
	‘成交量‘ : ‘Volumn‘,
	‘振幅‘   : ‘Amplitude‘,
	‘换手率‘ : ‘TurnOver‘,
	‘内盘成交量‘: ‘BuyVol‘,
	‘外盘成交量‘ : ‘SellVol‘,
	‘金额流入率‘ : ‘CapitalInRate‘,

	‘大单流入资金‘ : ‘BigCapitalIn‘,
	‘大单流出资金‘ : ‘BigCapitalOut‘,
	‘大单金额流入率‘ : ‘BigCapitalInRate‘,	

	‘超大单流入资金‘ : ‘SuperBigCapitalIn‘,
	‘超大单流出资金‘ : ‘SuperBigCapitalOut‘,
	‘超大单金额流入率‘ : ‘SuperBigCapitalInRate‘,

	‘大单买盘成交量‘ : ‘BigBuyVolumn‘,
	‘大单卖盘成交量‘ : ‘BigSellVolumn‘,
	‘超大单买盘成交量‘ : ‘SuperBigBuyVolumn‘,
	‘超大单卖盘成交量‘ : ‘SuperBigSellVolumn‘
}

def write_to_csv(filePath, date, test_x, test_y):
    index = {"date" : date,"predict" : test_x, "real" : test_y}
    csv = pd.DataFrame(index)
    csv.to_csv(filePath)

def changeColName(all_data):
	columns = all_data.columns
	all_data.rename(columns=lambda x: colName.get(x, x), inplace = True)

	print all_data.columns
	print columns
	return all_data

def preProcessData(filePath):
    all_data = pd.read_csv(filePath)
    changeColName(all_data)
    all_data.to_csv(‘captionlocal.csv‘)
    return all_data

all_data = preProcessData(‘caption.csv‘)

原文地址:https://www.cnblogs.com/yicheng-bangbang/p/8780408.html

时间: 2024-10-10 16:52:23

修改读入的CSV文件中的列名的相关文章

取出csv文件中的中文评论数据

# -*- coding: utf-8 -*- import csv import re csvfile = 'weibo.csv' def columns_data(path, column): columns_data = '' csvfile = open(path, 'r', encoding='utf-8') DicReader = csv.DictReader(csvfile) for row in DicReader: columns_data = columns_data+row

直接把数据库中的数据保存在CSV文件中

今天突然去聊就来写一个小小的demo喽,嘿嘿 public partial class Form1 : Form { public Form1() { InitializeComponent(); } private void button1_Click(object sender, EventArgs e) { SaveFileDialog saveFileDialog1 = new SaveFileDialog(); saveFileDialog1.Filter = "CSV文件|*.CSV

Jsoup学习笔记9:Jsoup 解析saz文件,读取其中的htm文件到字符串,提取字符串中的数据写入csv文件中

本篇笔记将上篇笔记的操作做些改进,不再把saz文件中的htm文件解析出来,而是不解压直接读取其中的数据成字符串,基本思路如下: 1.自定义一个从文本文件读取内容到字符串的类:解析saz文件中的htm文档,将文件的内容读取到字符串中 2.自定义利用Jsoup解析htm字符串的类:利用Jsoup解析传入的htm字符串,将解析结果写入csv文件中 3.解析时,指定好文件路径,直接调用上面的两个工具类即可 示例代码如下: package com.daxiang.saztest; /** * 自定义一个从

将CSV文件中的数据导入到SQL Server 数据库中

导入数据时,需要注意 CSV 文件中的数据是否包含逗号以及双引号,存在时,导入会失败 选择数据库 -> 右键 -> 任务 -> 导入数据 ,然后根据弹出的导入导出向导(如下图)中的提示内容进行操作即可. 原文地址:https://www.cnblogs.com/daochangone/p/9134718.html

python3 简单实现从csv文件中读取内容,并对内容进行分类统计

新手python刚刚上路,在实际工作中遇到如题所示的问题,尝试使用python3简单实现如下,欢迎高手前来优化 import csv #打开文件,用with打开可以不用去特意关闭file了,python3不支持file()打开文件,只能用open() with open("dk0519_1.csv","r",encoding="utf-8") as csv_file: #读取csv文件,返回的是迭代类型 read = csv.reader(csv

修改sharepoint list template 文件中的语言

sharepoint list template导出后会生成一个.stp文件,文件中包含的语言属性会与网站语言一致. 如果你的导入template的网站和template所带的语言不一致,虽然这个template可以导入,但是在Create List中无法使用该template. 通过7zip打开这个文件可以发现一个manifest.xml文件. 打开manifest.xml文件,其中可以看到<Language>标签.其中:1033为英文,2052为中文. 如果想修改template的语言,应

如何转义CSV文件中的逗号

CSV全称是:Comma Separated Values 或者 Character Separated Values. 尽管第一种说法更常见,但我觉得还是第二种说法更确切一些,因为你可以使用其它字符做分隔符. 使用逗号做分隔符的CSV文件有一个好处:你可以直接用Excel打开.如果使用其它分隔符,比如“|”,你必须告诉Excel该文件使用“|”作分隔符,Excel才能把它导入进来. 前几天,project manager告诉我:我们有许多CSV文件,都是使用“|”做分隔符,用Excel打开的时

python——关于简单爬取博客园班级成员发的博文的题目、发布人、阅读、评论,再存到csv文件中

因为老师要以班里每个人发的博客质量作为最后总成绩的评定的一部分,就要把班上所有同学发的博客都统计起来,可以用来评定的因素有:阅读.评论.推荐等,但因为今天只是做一个简单的爬取,推荐这个元素在班级博客中需要点开每一篇博文才能看到获取,就不爬取了,只爬取阅读和推荐,加上每篇博文的发布人和标题. 我先会放上代码,再逐条解释其含义及作用. 代码如下(其中爬取的网页是以我自己的班级为例): 1 from bs4 import BeautifulSoup 2 import pandas as pd 3 im

如何在Magento(麦进斗)导入CSV文件中的产品价格的变化?

上传CSV文件使用Magento导入功能时,产品价格会随着自定义计算公式自动改变. 我的解决办法,代码如下: <adminhtml> <events> <catalog_product_import_finish_before> <observers> <test_module1_catalog_product_import_after> <type>singleton</type> <class>gold_p