Pandas(python)数据处理:只对某一列DataFrame数据进行归一化

  处理数据要用到Pandas,但是没有学过,不知道是否有直接对某一列归一化的方法调用。自己倒弄了下。感觉还是比较麻烦。

  使用Pandas读取到数组之后想把其中的‘MonthlyIncome’一列进行归一化,网上的栗子都是对整个dataframe进行归一化,因为我的数据有些列是类别,不能使用:

  

import pandas as pd
import numpy as np
#加载数据
#cvs

df = pd.read_csv("train1.csv")

#规格化
s = (df[‘MonthlyIncome‘] - df[‘MonthlyIncome‘].min())/(df[‘MonthlyIncome‘].max() - df[‘MonthlyIncome‘].min())

#安全删除,如果用del是永久删除

df2 = df.drop([‘MonthlyIncome‘],axis=1)

#把规格化的那一列插入到数组中,最开始的14是我把他插到了第15lie

df2.insert(14,‘MonthlyIncome‘,s)
print(df2.columns[13:15])
时间: 2024-07-30 12:49:18

Pandas(python)数据处理:只对某一列DataFrame数据进行归一化的相关文章

程序员用于机器学习编程的Python 数据处理库 pandas 入门教程

入门介绍 pandas适合于许多不同类型的数据,包括: · 具有异构类型列的表格数据,例如SQL表格或Excel数据 · 有序和无序(不一定是固定频率)时间序列数据. · 具有行列标签的任意矩阵数据(均匀类型或不同类型) · 任何其他形式的观测/统计数据集. 由于这是一个Python语言的软件包,因此需要你的机器上首先需要具备Python语言的环境.关于这一点,请自行在网络上搜索获取方法. 关于如何获取pandas请参阅官网上的说明:pandas Installation. 通常情况下,我们可以

python 数据处理学习pandas之DataFrame

请原谅没有一次写完,本文是自己学习过程中的记录,完善pandas的学习知识,对于现有网上资料的缺少和利用python进行数据分析这本书部分知识的过时,只好以记录的形势来写这篇文章.最如果后续工作定下来有时间一定完善pandas库的学习,请见谅!                     by LQJ 2015-10-25 前言: 首先推荐一个比较好的Python pandas DataFrame学习网址 网址: http://www.cnblogs.com/chaosimple/p/4153083

python数据处理技巧二

python数据处理技巧二(掌控时间) 首先简单说下关于时间的介绍其中重点是时间戳的处理,时间戳是指格林威治时间1970年01月01日00时00分00秒(北京时间1970年01月01日08时00分00秒)起至现在的总秒数.这里这个知识只做了解,接下来会用python三个关于时间的模块来定位时间,计算时间等. 首先让我们来验证下时间戳及怎么换算时间戳 1.要使用time方法首先要导入方法包import time 2.获取当前时间戳的方法是print time.time()就可以得到当前执行这个方法

Python数据处理实战

一.运行环境 1.python版本 2.7.13 博客代码均是这个版本2.系统环境:win7 64位系统 二.需求 对杂乱文本数据进行处理 部分数据截图如下,第一个字段是原字段,后面3个是清洗出的字段,从数据库中聚合字段观察,乍一看数据比较规律,类似(币种 金额 万元)这样,我想着用sql写条件判断,统一转换为'万元人民币' 单位,用sql脚本进行字符串截取即可完成,但是后面发现数据并不规则,条件判断太多清洗质量也不一定,有的前面不是左括号,有的字段里面没有币种,有的数字并不是整数,有的没有万字

基于pandas python的美团某商家的评论销售数据分析(可视化续)

from pyecharts import Bar,Pie import pandas as pd import numpy as np import matplotlib.pyplot as plt import time df=pd.read_excel("all_data_meituan.xlsx") df.drop('comment',axis=1).head(2) df['avgPrice'].value_counts() # 同一家店的均价应该为同一个数值,所以这列数据没多

《Python数据处理》(高清中文版PDF+高清英文版PDF+源代码)

下载:https://pan.baidu.com/s/19QPmRWF9uEEJLEmBQoYMiw 最新的<Python数据处理>.高清中文版和高清英文版对比学习, 带目录书签,可复制粘贴:讲解详细并配有源代码. 一块儿学习探讨,支持正版书籍. 其中高清中文版 原文地址:http://blog.51cto.com/3215120/2300897

Excel小技巧-你是否只知道表格按列排序?其实也可以按行排序!excel数据按行排序

Excel小技巧-你是否只知道表格按列排序?其实也可以按行排序!excel数据按行排序.系统默认情况下,数据都是按列进行排序的,可以通过简单的操作,让其进行按行进行排序. [解决方法,教程视频资料如下] 本教程视频资料来源:http://edu.51cto.com/course/15404.html 完整博客资料:http://blog.51cto.com/13172026/2292179 完整视频资料:http://edu.51cto.com/lecturer/13162026.html 原文

分享《Python数据处理》+PDF+源码+Jacqueline Kazil+张亮 吕家明

下载:https://pan.baidu.com/s/178uLnSsEy5wf6m0V1magRg 更多资料分享:http://blog.51cto.com/14087171 <Python数据处理>(高清中文版PDF+高清英文版PDF+源代码) 高清中文版, 402页,带目录书签,文字可复制粘贴:高清英文版, 501页,带目录书签,文字可复制粘贴:中文和英文两版对比学习:讲解详细并配有源代码. 其中,高清中文版如图: 原文地址:http://blog.51cto.com/14087171/

用python自动复制粘贴excel表里某一列的数据到另一个表中

昨天接到人事小姐姐求助减轻复制粘贴的重复工作量,分享一下代码 半路新手上路 耶 把 2.xlsx 表里的第二列 的数据复制粘贴到 test.xlsx的第一列 python3.6.2 from openpyxl import Workbook from openpyxl import load_workbook from openpyxl.writer.excel import ExcelWriter wb = load_workbook ('C:\\Users\\elan\\Desktop\\p