pandas.DataFrame对行和列求和及添加新行和列

pandas.DataFrame对行和列求和及添加新行和列

导入模块:

from pandas import DataFrame

import pandas as pd

import numpy as np

生成DataFrame数据

df = DataFrame(np.random.randn(4, 5), columns=[‘A‘, ‘B‘, ‘C‘, ‘D‘, ‘E‘])

DataFrame数据预览:

A        B        C        D        E

0  0.673092  0.230338 -0.171681  0.312303 -0.184813

1 -0.504482 -0.344286 -0.050845 -0.811277 -0.298181

2  0.542788  0.207708  0.651379 -0.656214  0.507595

3 -0.249410  0.131549 -2.198480 -0.437407  1.628228

计算各列数据总和并作为新列添加到末尾

df[‘Col_sum‘] = df.apply(lambda x: x.sum(), axis=1)

计算各行数据总和并作为新行添加到末尾

df.loc[‘Row_sum‘] = df.apply(lambda x: x.sum())

最终数据结果:

A        B        C        D        E  Col_sum

0        0.673092  0.230338 -0.171681  0.312303 -0.184813  0.859238

1      -0.504482 -0.344286 -0.050845 -0.811277 -0.298181 -2.009071

2        0.542788  0.207708  0.651379 -0.656214  0.507595  1.253256

3      -0.249410  0.131549 -2.198480 -0.437407  1.628228 -1.125520

Row_sum  0.461987  0.225310 -1.769627 -1.592595  1.652828 -1.022097

原文地址:https://www.cnblogs.com/sjy18039225956/p/9311217.html

时间: 2024-10-27 08:53:26

pandas.DataFrame对行和列求和及添加新行和列的相关文章

DataFrame对行喝列求和并添加新行和列

导入模块: from pandas import DataFrame import pandas as pd import numpy as np 生成DataFrame数据 df = DataFrame(np.random.randn(4, 5), columns=['A', 'B', 'C', 'D', 'E']) DataFrame数据预览: A B C D E 0 0.673092 0.230338 -0.171681 0.312303 -0.184813 1 -0.504482 -0.

Devexpress-GridControl实现对两列求和后作为新的列

效果: 数据源提供id.quantity1.quantity2三个字段,sum为quantity1+quantity2. 步骤: 1.打开gridcontrol的设计器 2.设置sum列的UnboundExpression属性 3.设置quantity1+quantity2 4.设置sum列的UnboundType属性为Integer. OK,大功告成!!!

pandas.DataFrame学习系列2——函数方法(1)

DataFrame类具有很多方法,下面做用法的介绍和举例. pandas.DataFrame学习系列2--函数方法(1) 1.abs(),返回DataFrame每个数值的绝对值,前提是所有元素均为数值型 1 import pandas as pd 2 import numpy as np 3 4 df=pd.read_excel('南京银行.xlsx',index_col='Date') 5 df1=df[:5] 6 df1.iat[0,1]=-df1.iat[0,1] 7 df1 8 Open

pandas DataFrame(1)

之前介绍了numpy的二维数组,但是numpy二维数组有一些局限性,比如,它数组里所有的值的类型必须相同,不能某一列是数值型,某一列是字符串型,这样会导致无法使用 mean() , std() 等方法去计算某一行或某一列. 但是,使用pandas DataFrame可以解决这一问题. pandas DataFrame也是二维数据,和pandas Series一样, pandas DataFrame也有'索引'这个概念,它每一列都有一个索引值: import pandas as pd df = p

pandas DataFrame(2)-行列索引及值的获取

pandas DataFrame是二维的,所以,它既有列索引,又有行索引 上一篇里只介绍了列索引: import pandas as pd df = pd.DataFrame({'A': [0, 1, 2], 'B': [3, 4, 5]}) print df # 结果: A B 0 0 3 1 1 4 2 2 5 行索引自动生成了 0,1,2 如果要自己指定行索引和列索引,可以使用 index 和 column 参数: 这个数据是5个车站10天内的客流数据: ridership_df = pd

网格部件添加表达式计算列使用介绍

度量快速开发平台的网格部件中,可以在界面上添加虚拟的计算列,假设一个业务中有 单价,有数量字段,但是没用总价这个字段,则可以在界面上通过添加表达式计算列加上. 添加表达式计算列,可以根据不同的业务需求添加计算列. 语法: 网格部件名称.AddExpressionColumn("columnName","[基本工资]*0.2",2) 添加表达式计算列,第一个参数为列名,第二个参数为计算列表达式.第三个参数为列类型:1:整数,2:数字,3:时间,4:字符串,5:布尔,6

Pandas(python)数据处理:只对某一列DataFrame数据进行归一化

处理数据要用到Pandas,但是没有学过,不知道是否有直接对某一列归一化的方法调用.自己倒弄了下.感觉还是比较麻烦. 使用Pandas读取到数组之后想把其中的'MonthlyIncome'一列进行归一化,网上的栗子都是对整个dataframe进行归一化,因为我的数据有些列是类别,不能使用: import pandas as pd import numpy as np #加载数据 #cvs df = pd.read_csv("train1.csv") #规格化 s = (df['Mont

Python pandas.DataFrame调整列顺序及修改index名

1. 从字典创建DataFrame >>> import pandas >>> dict_a = {'user_id':['webbang','webbang','webbang'],'book_id':['3713327','4074636','26873486'],'rating':['4','4','4'],'mark_date':['2017-03-07','2017-03-07','2017-03-07']} >>> df = pandas.

pandas.DataFrame学习系列1——定义及属性

定义: DataFrame是二维的.大小可变的.成分混合的.具有标签化坐标轴(行和列)的表数据结构.基于行和列标签进行计算.可以被看作是为序列对象(Series)提供的类似字典的一个容器,是pandas中主要的数据结构. 形式: class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False) 参数含义: data : numpy ndarray(多维数组)(结构化或同质化的), dict(字典