关于pandas精度控制

最近使用pandas处理一批数据,数据中包含几个columns,它们的数据精度,例如

3.25165,1451684684168.0,0.23

处理完之后保存csv时发现,1451684684168.0被保存为1.45168e+12,我需要完全保存数据信息

Google一番发现pandas自带了如下函数:

DataFrame.to_csv(‘out.csv‘, float_format = ‘%.3f‘)

由于我的文件中包含不同精度数据,不能一概而论,所以初步想法是想把1451684684168.0转换为str处理,

有以下几种办法:

1.df[‘id‘].apply(str)或者df[‘id‘].astype(basestring)

这个方法可以将某个column变为str,缺点是不能控制精度,转出来还是1.45168e+12

2.pandas.DataFrame.to_string或者pandas.Series.to_string

这个两种方法可以将整个DataFrame或者Series转成str,参数很多,而且可以控制精度。

需要注意的是参数formatters和float_format,它们两的参数是以函数的形式给出的

######################################################

myformatter = lambda x: ‘%4.1f‘ % x
formatters = {‘A‘: myformatter}
float_format = myformatter

######################################################

由于我使用的是pd(0.17.1)版本,与官方的0.19.2的不同,

pandas.Series.to_string参数中缺少index

所以我将Series转换为DataFrame处理,下面给出代码:

#####################################################

Tpart1 = dfN.iloc[:,0:12]
Tpart2 = dfN.iloc[:,12]
Tpart3 = dfN.iloc[:,13:16]

myformat = lambda x: ‘%.0f‘%x   # #保留整数
str1 = pd.DataFrame(Tpart2, columns=[‘time‘])
str2 = str1.to_string(float_format = myformat, index = False, header = False)  # #去除column name以及index name
str3 = str2.split(‘\n‘)
Tpart2 = pd.DataFrame(str3, columns=[‘time‘])   ##重新变为DataFrame

npart1 = pd.concat([Tpart1, Tpart2, Tpart3], axis = 1)  # #合并

#######################################################

pandas的向量处理速度还是很快的,程序中尽量不使用for语句来逐一处理。

时间: 2024-12-28 17:18:31

关于pandas精度控制的相关文章

文件重定向,getline()获取一样,屏幕输出流,格式控制符dec,oct,hex,精度控制setprecision(int num),设置填充,cout.width和file(字符),进制输入

 1.在window下的命令重定向输出到文件中 2.将内容输入到某个文件中的方式:命令<1.txt (使用1.txt中的命令) 3.读取文件中的名,然后将命令读取最后输出到文件中.命令<1.txt>2.txt   这一句的作用就是将执行的命令输入到2.txt中. 4.文件重定向案例1 #include <iostream> using namespace std; void main() { char str[30] = { 0 }; cin >> str;

C++ double 小数精度控制

第一种方法:cout<<fixed<<setprecision(20)<<mydouble<<endl; #include <iostream> #include <iomanip> using namespace std; int main() { double aDouble = 5.141592694827862736487362746374637434343434; cout<<fixed<<setpr

Java 浮点数精度控制

1.String.format?(String format,Object… args) Java中用String.format()来控制输出精度, format参数用来设置精度格式, args参数代表待格式化的数字. 返回值是格式化后的字符串. Java API文档中的解释是这样的: 文档不好懂… 没关系 直接上代码! //精确到小数点后两位: public class test { public static void main(String args[]) { //格式控制与C语言类似 S

cout输出控制——位数和精度控制

刷到一道需要控制输出精度和位数的题目 刚开始以为单纯使用 iomanip 函数库里的 setprecision 就可以,但 OJ 给我判了答案错误,后来一想这样输出并不能限制位数只能限制有效位数. 比如说 0.000101000110 用 setprecision(4) 答案是 0.000101 这里甚至把最后一位的有效数字 0 省略了!! 后来了解到 fixed 关键字 那么在这里若要控制小数点后 N 位 只要写成 cout << fixed << setprecision(N)

HDU 1007 Quoit Design(二分+浮点数精度控制)

Quoit Design Time Limit: 10000/5000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 47104    Accepted Submission(s): 12318 Problem Description Have you ever played quoit in a playground? Quoit is a game in which fla

【Python】关于Python里面小数点精度控制的问题

基础 浮点数是用机器上浮点数的本机双精度(64 bit)表示的.提供大约17位的精度和范围从-308到308的指数.和C语言里面的double类型相同.Python不支持32bit的单精度浮点数.如果程序需要精确控制区间和数字精度,可以考虑使用numpy扩展库. Python 3.X对于浮点数默认的是提供17位数字的精度. 关于单精度和双精度的通俗解释: 单精度型和双精度型,其类型说明符为float 单精度说明符,double 双精度说明符.在Turbo C中单精度型占4个字节(32位)内存空间

小数点输出精度控制问题?.xml

pre{ line-height:1; color:#9f1d66; background-color:#d2d2d2; font-size:16px;}.sysFunc{color:#5d57ff;font-style:italic;font-weight:bold;} .selfFuc{color:#8e0ed3;} .bool{color:#008000;} .condition{color:#008000;font-weight:bold;} .key{color:#440080;} .

hdu 5170 精度控制

众所周知,GTY是一位神犇,为了更好的虐场,他从来不写数学作业而是去屠题,他的数学老师非常不爽,但由于GTY每次考试都AK,她也不能说什么,有一天老师在黑板上写了四个数——a,b,c,da,b,c,d 然后让GTY比较a^ba?b??和c^dc?d??的大小,由于GTY不屑于虐这道题,就把这个问题交给你了. 输入描述 多组数据(约5000组),每组数据包含4个整数a,b,c,d(1 \leq a,b,c,d \leq 1000)a,b,c,d(1≤a,b,c,d≤1000),用空格隔开 输出描述

HDU 5705 Clock (精度控制,暴力)

题意:给定一个开始时间和一个角度,问你下一个时刻时针和分针形成这个角度是几点. 析:反正数量很小,就可以考虑暴力了,从第一秒开始暴力,直到那个角度即可,不会超时的,数目很少,不过要注意精度. 代码如下: #include <cstdio> #include <string> #include <cstdlib> #include <cmath> #include <iostream> #include <cstring> #inclu