首先导入必要的包
import numpy as npimport pandas as pd
1,拉取数据
eg:l_sql = "select * from item_t"
df = pd.read_sql(l_sql,conn,index_col=None) #其中conn为数据库连接,index_col=None表示不从数据中产生index
2,重命名DataFrame的列名
df.rename(index=str,columns={‘MST01‘:‘Item‘,‘DAT‘:‘Date‘,‘MST08‘:‘Qty‘,‘BSUPPLY‘:‘Type‘},inplace=True) #重命名df的指定列
3,选择DataFrame的数据
选择数据:df1=df.loc[df[‘Name‘]==‘Jack‘,:] loc按照行号和列名进行选择数据,例子中表示选择Name为Jack的所有列
更新数据:df.loc[df[‘Name‘]==‘Jack‘,[‘YuWen‘]] = 70 表示更新Name为Jack,列名为‘YuWen’的数值为70
至于删除数据,直接可以选择出来,重新赋值一个DataFrame就可以了
4,重新定义index
df = df.reset_index() #可以重新定义index,并且把原先的index作为DataFrame的一列
5,数据的串联(SQL左右连接)
df6 = pd.merge(df4,df5,how=‘left‘,on=‘Item‘)
6,数据的拼接合并,如两份数据有相同的列名,需要合并,可以使用下面的命令
df1.append(df2)
原文地址:https://www.cnblogs.com/smarttony/p/11151970.html
时间: 2024-10-03 22:38:53