Pandas中常用的函数使用

1、离散值的onehot编码

   pd.get_dummies()
import pandas as pd
#对于离散值不能进行编码的利用onehot编码
df = pd.DataFrame([
    [‘green‘, ‘M‘, 10.1, ‘class1‘],
    [‘red‘, ‘L‘, 13.5, ‘class2‘],
    [‘blue‘, ‘XL‘, 15.3, ‘class1‘]])

df.columns = [‘color‘, ‘size‘, ‘prize‘, ‘class label‘]

size_mapping = {
    ‘XL‘: 3,
    ‘L‘: 2,
    ‘M‘: 1}
df[‘size‘] = df[‘size‘].map(size_mapping)

class_mapping = {label: idx for idx, label in enumerate(set(df[‘class label‘]))}
df[‘class label‘] = df[‘class label‘].map(class_mapping)
print(‘----------------------------------------------------------------‘)

print(df)

print(‘----------------------------------------------------------------‘)
df = pd.get_dummies(df)
print(df)
print(‘----------------------------------------------------------------‘)
2、DROP——删除pandas DataFrame的某一/几列

1. DF= DF.drop(‘column_name‘, 1);


2. DF.drop(‘column_name‘,axis=1, inplace=True)


3. DF.drop([DF.columns[[0,1, 3]]], axis=1,inplace=True)   # Note: zero indexed

凡是会对原数组作出修改并返回一个新数组的,往往都有一个 inplace可选参数。如果手动设定为True(默认为False),那么原数组直接就被替换。也就是说,采用inplace=True之后,原数组名(如2和3情况所示)对应的内存值直接改变;而采用inplace=False之后,原数组名对应的内存值并不改变,需要将新的结果赋给一个新的数组或者覆盖原数组的内存位置。

 

原文地址:https://www.cnblogs.com/6530265oule/p/10094716.html

时间: 2024-11-06 09:42:50

Pandas中常用的函数使用的相关文章

Mysql中常用的函数汇总

Mysql中常用的函数汇总: 一.数学函数abs(x) 返回x的绝对值bin(x) 返回x的二进制(oct返回八进制,hex返回十六进制)ceiling(x) 返回大于x的最小整数值exp(x) 返回值e(自然对数的底)的x次方floor(x) 返回小于x的最大整数值greatest(x1,x2,...,xn)返回集合中最大的值least(x1,x2,...,xn) 返回集合中最小的值ln(x) 返回x的自然对数log(x,y)返回x的以y为底的对数mod(x,y) 返回x/y的模(余数)pi(

SQL点滴30—SQL中常用的函数

原文:SQL点滴30-SQL中常用的函数 该文章转载自http://www.cnblogs.com/jiajiayuan/archive/2011/06/16/2082488.html 别人的总结,很详细. 以下所有例子均Studnet表为例:  计算字符串长度len()用来计算字符串的长度 select sname ,len(sname) from student 字符串转换为大.小写lower() 用来将一个字符串转换为小写,upper() 用来将一个字符串转换为大写 select lowe

re模块中常用功能函数

re模块中常用功能函数 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. re 模块使 Python 语言拥有全部的正则表达式功能. compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象.该对象拥有一系列方法用于正则表达式匹配和替换. re 模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数. re.match函数

python 迭代器 itertools模块中常用工具函数

迭代器 itertools模块中常用工具函数,提供了接近二十个迭代器工具函数. 原文地址:https://www.cnblogs.com/bcyczhhb/p/11809842.html

在PHP编程中常用的函数

<?php//===============================时间日期===============================//y返回年最后两位,Y年四位数,m月份数字,M月份英文.d月份几号数字,D星期几英文$date=date("Y-m-d");$date=date("Y-m-d H:i:s");//带时分秒 //include,include_once.require,require_once//require("file

绘图与可视化--pandas中的绘图函数

matplotlib是一种比较低级的工具,要组装一张图表,你得用它得各种基础组件才行:数据展示(即图表类型:线型图.柱状图.盒型图.散布图.等值线图等).图例.标题.刻度标签以及其它注释型信息. 在pandas中,有行标签.列标签及分组信息,要绘制一张图,需要很多matplotlib代码.pandas有很多能够利用DataFrame对象数据组织特点来创建标准图表的高级绘图方法. 1.1 线型图 Series和DataFrame都有一个用于生成各类图表的plot方法,默认情况下,生成的是线型图.

Mysql中常用的函数

控制流函数IFNULL(expr1,expr2)如果expr1不是NULL,IFNULL()返回expr1,否则它返回expr2.IFNULL()返回一个数字或字符串值,取决于它被使用的上下文环境. mysql> select IFNULL(1,0); -> 1 mysql> select IFNULL(0,10); -> 0 mysql> select IFNULL(1/0,10); -> 10 mysql> select IFNULL(1/0,'yes');

[转]Makefile中常用的函数

转自:http://linux.chinaunix.net/techdoc/develop/2009/07/09/1122854.shtml 在Makefile中可以使用函数来处理变量,从而让我们的命令或是规则更为的灵活和具有智能.make所支持的函数也不算很多,不过已经足够我们的操作了.函数调用后,函数的返回值可以当做变量来使用. 一.函数的调用语法 函数调用,很像变量的使用,也是以“$”来标识的,其语法如下:     $( ) 或是     ${ } 这里,就是函数名,make支持的函数不多

python第二十课——math模块中常用的函数

属性: e:自然数 pi:圆周率 函数: ceil():向上取整 floor():向下取整 sqrt():开平方根 radians():角度转弧度 degrees():弧度转角度 import math #属性:e和pi print(math.e) print(math.pi) #函数: #ceil(),floot(): print(math.ceil(3.14)) print(math.floor(3.14)) print(math.ceil(-3.14)) print(math.floor(