pandas中一列含有多种数据类型的转换:科学计算法转浮点数、字符映射

import pandas as pd
import re

def getNum(x):
    """
    科学计数法和字符转浮点数
    """
    if re.findall(r‘\d+\.\d+E\+‘,x):
        return "%.f" % float(x)
    elif x=="C":
        return 1
    else:
        return x

df = pd.DataFrame({"x":[2030,1.11002E+11,2030,1.11002E+11,"C"]})

df["x"] = df["x"].astype("str")

df["x"] = df["x"].apply(getNum)

df["x"] = pd.to_numeric(df["x"])

df["x"] = df["x"].astype("int64")

原文地址:https://www.cnblogs.com/wzdLY/p/9885877.html

时间: 2024-11-13 02:33:40

pandas中一列含有多种数据类型的转换:科学计算法转浮点数、字符映射的相关文章

在 Pandas 中更改列的数据类型

import pandas as pd import numpy as np a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']] df = pd.DataFrame(a) df.dtypes 0 object 1 object 2 object dtype: object 数据框(data.frame)是最常用的数据结构,用于存储二维表(即关系表)的数据,每一列存储的数据类型必须相同,不同数据列的数据类型可以相同,也可以

转载: 黄聪:C#中 Excel列字母与数字的转换

using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Text.Regularexpression_rs; namespace Hooogle { public static class ExcelConvert { #region - 由数字转换为Excel中的列字母 - public static int ToIndex(string columnN

在Pandas中更改列的数据类型【方法总结】

先看一个非常简单的例子: a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']] df = pd.DataFrame(a) 有什么方法可以将列转换为适当的类型?例如,上面的例子,如何将列2和3转为浮点数?有没有办法将数据转换为DataFrame格式时指定类型?或者是创建DataFrame,然后通过某种方法更改每列的类型?理想情况下,希望以动态的方式做到这一点,因为可以有数百个列,明确指定哪些列是哪种类型太麻烦.可以假定每列都

Python中2维数组/矩阵转化为字典(矩阵中第一列含有重复元素)??

例如将a=[[3,789],[1,100],[1,102],[2,102],[1,106],[2,456]];转化为一个字典b={1:[100,102,102],2:[102,456],3:[789]} 如果用强制转换: 1 >>> a=[[3,789],[1,100],[1,102],[2,102],[1,106],[2,456]]; 2 >>> b=dict(a) 3 >>> b 4 {1: 106, 2: 456, 3: 789} 5 >&

查看哪些表的哪些列含有指定字符串(如‘andy’存在哪些表的哪些列中)

-- 查看表中列含有指定字符.SQL> select * from demo1; NAME                                   ID------------------------------ ----------????                                    4andy                                    1andy1                                   2andy

13、如何拆分含有多种分隔符的字符串 14、如何判断字符串a是否以字符串b开头或结尾 15、如何调整字符串中文本的格式 16、如何将多个小字符串拼接成一个大的字符串

13.如何拆分含有多种分隔符的字符串 import re s = "23:41:2314\1234#sdf\23;" print(re.split(r'[#:\;]+',s))  14.如何判断字符串a是否以字符串b开头或结尾 import os,stat #找到当前目录下的文件名称,返回list ret = os.listdir('.') print(ret) for x in ret: #endswith传参类型是tuple if x.endswith(('.py','.html'

Asp.net 修改已有数据的DataTable中某列的数据类型

DataTable dt_PI = new DataTable(); //克隆表结构 dt_PI = ds.Tables[0].Clone(); dt_PI.Columns["FLTFullPercentage"].DataType = typeof(String);//修改[满柜百分比]列的数据类型 foreach (DataRow row in ds.Tables[0].Rows) { DataRow rowNew = dt_PI.NewRow(); foreach (DataCo

Pandas中的DataFrame按指定顺序输出所有列的方法

问题: 输出新建的DataFrame对象时,DataFrame中各列的显示顺序和DataFrame定义中的顺序不一致. 例如: import pandas as pd grades = [48,99,75,80,42,80,72,68,36,78] df = pd.DataFrame( {'ID': ["x%d" % r for r in range(10)], 'Gender' : ['F', 'M', 'F', 'M', 'F', 'M', 'F', 'M', 'M', 'M'],

Oracle中对列加密的方法

Oracle中对列加密的方法 2011-12-22 17:21:13 分类: Linux Oracle支持多种列加密方式: 1,透明数据加密(TDE):create table encrypt_col(id int,txt varchar2(100) encrypt using '算法名称' identified by '密钥' no salt);优点:对应用完全透明缺点:需要数据库管理员管理wallet,增加了管理复杂性,也无法避免数据库管理员查看原文. 2,使用DBMS_CRYPTO包优点: