pandas基础操作

import pandas as pd

1、定义一个字典

data = {‘sales_volume‘: [100, 123, 446, 233, 456], ‘month‘: [‘1月‘, ‘2月‘, ‘3月‘, ‘4月‘, ‘5月‘]

, ‘product_id‘: [‘1112‘, ‘1113‘, ‘1114‘,‘1115‘,‘1116‘], ‘color‘:[‘red‘, ‘red‘, ‘black‘, ‘green‘, ‘black‘]}

2、将字典放入dataframe数据结构，自动生成一列数据做索引0-4

df = DataFrame(data)

print df

color month product_id sales_volume

0 red 1月 1112 100

1 red 2月 1113 123

2 black 3月 1114 446

3 green 4月 1115 233

4 black 5月 1116 456

3、将dataframe数据处理为字典格式

keys = list(df.keys())

values = df.values

print keys,values

dicts = [dict(zip(keys, value)) for value in values]

print dicts

[{‘color‘: ‘red‘, ‘sales_volume‘: 100L, ‘product_id‘: ‘1112‘, ‘month‘: ‘1\xe6\x9c\x88‘}, {‘color‘: ‘red‘, ‘sales_volume‘: 123L, ‘product_id‘: ‘1113‘, ‘month‘: ‘2\xe6\x9c\x88‘}, {‘color‘: ‘black‘, ‘sales_volume‘: 446L, ‘product_id‘: ‘1114‘, ‘month‘: ‘3\xe6\x9c\x88‘}, {‘color‘: ‘green‘, ‘sales_volume‘: 233L, ‘product_id‘: ‘1115‘, ‘month‘: ‘4\xe6\x9c\x88‘}, {‘color‘: ‘black‘, ‘sales_volume‘: 456L, ‘product_id‘: ‘1116‘, ‘month‘: ‘5\xe6\x9c\x88‘}]

4、通过groupy计算和，精确到color

print df.groupby([‘product_id‘, ‘color‘]).sum()

product_id color sales_volume

1112 red 223

1113 black 446

green 233

1116 black 456

时间： 2025-01-20 03:39:22

pandas基础操作的相关文章

pandas 基础操作更新

创建一个Series,同时让pandas自动生成索引列创建一个DataFrame数据框查看数据数据的简单统计数据的排序选择数据(类似于数据库中sql语句) 另外可以使用标签来选择通过位置获取数据布尔值索引设定数值(类似于sql update 或者add) 缺失值处理数据操作统计个数与离散化 pandas 处理字符串(单独一个大的章节,这人不做详述) 数据合并首先看concat合并数据框 merge方式合并(数据库中的join) Append方式合并数据分组操作Groupb

《Pandas CookBook》---- DataFrame基础操作

Pandas基础操作简书大神SeanCheney的译作,我作了些格式调整和文章目录结构的变化,更适合自己阅读,以后翻阅是更加方便自己查找吧 import pandas as pd import numpy as np 设定最大列数和最大行数 pd.set_option('max_columns',5 , 'max_rows', 5) 选取多个DataFrame列用列表选取多个列 movie = pd.read_csv('data/movie.csv') cols =['actor_1_nam

基于 Python 和 Pandas 的数据分析(2) --- Pandas 基础

在这个用 Python 和 Pandas 实现数据分析的教程中, 我们将明确一些 Pandas 基础知识. 加载到 Pandas Dataframe 的数据形式可以很多, 但是通常需要能形成行和列的数据集. 所以可以是如下的 dictionary 的形式: web_stats = {'Day':[1,2,3,4,5,6], 'Visitors':[43,34,65,56,29,76], 'Bounce Rate':[65,67,78,65,45,52]} 我们可以通过如下方式把这个 dictio

【转】Python——DataFrame基础操作

Python——DataFrame基础操作 DataFrame理解 DataFrame可以看做是有序排列的若干Series对象,这里的“排列”是指这些Series都有共同的索引. 一.读取文件 dt = pd.read_csv(path) dt = pd.read_excel(path) dt = pd.read_table(path, sep=',') 二.索引第一类索引是iloc属性,表示取值和切片都是显式的,dt.iloc[1:3] #注:从0开始的左闭右开区间第二类索引是loc属性,

vsphere基础操作-网络

一.vsphere网络操作概念: portgroup:通信端口组.在vsphere中,一共包含三种端口组. 1)管理网络:management network,可以理解为EXSI主机的管理IP地址.每个EXSI必须配置一个管理网络IP,使得vc能够管理到exsi.每个EXSI只能有一个唯一的管理网络. 2)内核:vmkernel,可以理解为EXSI的后端IP,使得后端各项功能能够实现.这里所说的后端功能指的是EXSI之间的通讯以实现VMOTION等高级功能.连入ISCSI或NAS等存储.FT功

Mysql安装和基础操作

1.环境检查: 先检查是否已经安装了:rpm -qa |grep mysql ---两个都检查下,查看mysql是否安装 rpm -qa |grep MySQL若安装有可删除:rpm -e ****** 2.安装:1)安装前准备:mkdir usr/mysql cd进入该目录,上传安装包到/usr/mysql目录下2)安装:rpm -ivh MySQL-server-5.0.16-0.i386.rpm rpm -ivh MySQL-elient-5.0.16-0.i386.rpm3)验证安装是否

双向链表的基础操作（C++实现）

★C++实现双向链表的基础操作(类的实现) #include<iostream> #include<cassert> using namespace std; typedef int DataType; class double_link_list { //定义双向链表类,包括了双向的前驱和后继指针,以及对象的初始化 public: friend class ListNode; double_link_list(DataType x =

数据结构-线性表的一些基础操作 c++代码

//线性表的顺序存储结构 template <class T> class Linearlist { public: Linearlist(int MaxListSize == 10); ~Linearlist() { delete []element; } bool IsEmpty() const { return length == 0; } bool IsFull() const { return length == MaxSize; } int Length() const { ret

php之文件基础操作

在php中对文件的基础操作非常的简单,php提供的函数粗略的用了一遍. file_get_contents():可以获取文件的内容获取一个网络资源的内容,这是php给我封装的一个比较快捷的读取文件的内容.网络资源的函数,此函数里面封装了对文件的打开,读取,关闭操作.一次性的将内容全部读取到内存中,相当方便,但是对于大文件或者网络资源较大的时候,不建议使用.file_put_contents():写入数据,和file_get_contents()类似. 文件的基础操作:touch()--新建,fo

猜你喜欢

Android实现音乐播放器（一）

Graphical User Interface 本篇文章记录了我实现Android简单音乐播放器的过程,(一)中介绍了怎么构建音乐播放器的前端页面.首先大家看一下,界面最后是这样的(界面有点粗陋) ...

Hdu 1494 跑跑卡丁车

题目链接中文题,题意一目了然 L段路,N圈那么可以视为L*N段路跑一圈所用最快时间. 每个加速卡由100能量得到,每跑一段路得到20的能量,最多获得2张加速卡以及80能量. 可以简化成 1表示 ...

[LeetCode]268 Missing Number

很简单,提供两种解法. (1)等差数列先求得总和,然后减去给定的队列,剩下的值就是缺失值. (2)先排个序,逐个比较,不等的直接return 第一种的代码: class Solution { publ ...

Java中判断字符串是否为数字的五种方法

推荐使用第二个方法,速度最快. 方法一:用JAVA自带的函数 Java代码 public static boolean isNumeric(String str){ for (int i = st ...

ZeroMQ接口函数之：zmq_msg_data - 返回消息内容的指针

ZeroMQ 官方地址 :http://api.zeromq.org/4-1:zmq_msg_data zmq_msg_data(3) ØMQ Manual - ØMQ/3.2.5 Name zmq ...

Java file read & write

1. read public static void readfile(String filepath) { BufferedReader br = null; try { String sCurre ...

10.05-10.11

//本周依旧做一下图算法的题目,尽量少用algorithm里的函数,自己写熟悉熟悉. 1.The Unique MST 解析:该题为次小生成树问题. 次小生成树的求解过程: 1.找到最小生成树,值为m ...

ios基础入门——malloc方法

char m; scanf(" %c",&m); //前面加空格是为了去掉空格.回车等操作 NSLog(@"the character is %c",m ...

andriod 上 hello world 的笔记

root 手机连接电脑后, 作为 modem 连接开发人员选项 -〉 USB 调试, 连接USB 后启用调试模式 [[email protected] shm]# ./adt-bundle-lin ...

CCF_201612-1_最大波动

http://115.28.138.223/view.page?gpid=T47 水. #include<iostream> #include<cstring> #includ ...

移动开发mock神器-Mockup Plus

http://www.mockplus.cn/

JUnit4 中@AfterClass @BeforeClass @after @before的区别对比

@BeforeClass and @AfterClass @Before and @After 出现次数在一个类中只可以出现一次在一个类中可以出现多次,即可以在多个方法的声明前加上这两个Ann ...

软件工程短学期实践第一次随笔

在所有科目期末考试之后,我们开始了我们为期两周的短学期软件工程实践,在软件工程实践课上,老师悉心教导我们.第一天老师帮助我们下载java软件.Navicat Premium等软件,还帮助我们配置了ja ...

QQ聊天界面模式切换

1.打开一个聊天窗口 2.按照图上步骤 3.模式 3-1气泡模式 3-2文本模式

Android开发之百度地图--环境搭建

这篇文章总结自极客学院张浩老师的android教学课程,在此对张浩老师和崔爽老师表示非常感谢. (一)基础知识在申请百度地图开发密钥的时候需要用到数字签名证书的内容,所以这里先对此做一下介绍. (1 ...

使用zTree插件构建树形菜单

zTree下载:https://github.com/zTree/zTree_v3 目录: 就我看来,zTree较为实用的有以下几点: zTree 是一个依靠 jQuery 实现的多功能 “树插件”. ...

ZOJ 2883 Shopaholic【贪心】

解题思路:给出n件物品,每买三件,折扣为这三件里面最便宜的那一件即将n件物品的价值按降序排序,依次选择a[3],a[6],a[9]----a[3*k] Shopaholic Time Limit: 2 ...

Hadoop读书笔记（一）

1.Hadoop是什么? 适合大数据的分布式与计算平台. HDFS:Hadoop Distributed File System 分布式文件系统 MapReduce:并行计算框架 2.HDFS的架构 ...

Android属性动画简单剖析

运行效果图: 先看布局文件吧,activity_main.xml: 1 <?xml version="1.0" encoding="utf-8"?> ...

第一行代码ANDROID 第三章

1常用控件用法 TestView gravity文字居中 Button text AllCaps默认大写 EditText 最大行数maxLines 1 button.setOnClickListen ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.