2018.03.26 Python-Pandas 字符串常用方法

  import numpy as np  import pandas as pd 1 #字符串常用方法 - strip
 2 s = pd.Series([‘  jack ‘,‘jill‘,‘ jease ‘,‘feank‘])
 3 df = pd.DataFrame(np.random.randn(3,2),columns=[‘ Column A‘,‘ Column B‘],index=range(3))
 4 print(s)
 5 print(df.columns)
 6
 7 print(‘----‘)
 8 print(s.str.lstrip().values)#去掉左边的空格
 9 print(s.str.rstrip().values)#去掉右边的空格
10 df.columns = df.columns.str.strip()
11 print(df.columns)

结果:

0      jack
1       jill
2     jease
3      feank
dtype: object
Index([‘ Column A‘, ‘ Column B‘], dtype=‘object‘)
----
[‘jack ‘ ‘jill‘ ‘jease ‘ ‘feank‘]
[‘  jack‘ ‘jill‘ ‘ jease‘ ‘feank‘]
Index([‘Column A‘, ‘Column B‘], dtype=‘object‘)
#字符串常用方法 - replace  替换字符串
df = pd.DataFrame(np.random.randn(3,2),columns=[‘ Columns A‘,‘  Columns B‘],index = range(3))
print(df.columns)
df.columns = df.columns.str.replace(‘ ‘,‘-‘)
print(df.columns)

df.columns = df.columns.str.replace(‘-‘,‘hehe‘,n=1)#表示用hehe去替换第一个‘ ‘
print(df.columns)

结果:

Index([‘ Columns A‘, ‘  Columns B‘], dtype=‘object‘)
Index([‘-Columns-A‘, ‘--Columns-B‘], dtype=‘object‘)
Index([‘heheColumns-A‘, ‘hehe-Columns-B‘], dtype=‘object‘)
#字符串常用方法 - split、rsplit  分成列表list的形式
s = pd.Series([‘a,b,c‘,‘1,2,3‘,[‘a,,,c‘],np.nan])
print(s)
print(‘----‘)
print(s.str.split(‘,‘))
print(‘----‘)
#类似于字符串的split
print(s.str.split(‘,‘)[0])#索引第一行
print(s.str.split(‘,‘).str[0])#第一列
print(s.str.split(‘,‘).str.get(1))#第二列
#可以使用get或者[]符号访问拆分列表的元素

print(s.str.split(‘,‘,expand=True,n=1))#n为拓展数量
print(s.str.rsplit(‘,‘,expand=True,n=1))#rsplit 从右到左分
#expand可以扩展此操作来返回DataFrame
#n参数限制分数
#rsplit类似于split,反向工作,即从字符串的末尾到字符串开头
print(‘dataframe:‘)
df = pd.DataFrame({‘key1‘:[‘a,b,c‘,‘1,2,3‘,[‘,,,‘]],
                   ‘key2‘:[‘a-b-c‘,‘1-2-c‘,[‘,-,-,‘]]})
print(df[‘key2‘])
print(df[‘key2‘].str.split(‘-‘))

结果:
0      a,b,c
1      1,2,3
2    [a,,,c]
3        NaN
dtype: object
----
0    [a, b, c]
1    [1, 2, 3]
2          NaN
3          NaN
dtype: object
----
[‘a‘, ‘b‘, ‘c‘]
0      a
1      1
2    NaN
3    NaN
dtype: object
0      b
1      2
2    NaN
3    NaN
dtype: object
     0    1
0    a  b,c
1    1  2,3
2  NaN  NaN
3  NaN  NaN
     0    1
0  a,b    c
1  1,2    3
2  NaN  NaN
3  NaN  NaN
dataframe:
0      a-b-c
1      1-2-c
2    [,-,-,]
Name: key2, dtype: object
0    [a, b, c]
1    [1, 2, c]
2          NaN
Name: key2, dtype: object

#字符串索引
s = pd.Series([‘A‘,‘b‘,‘C‘,‘bbhello‘,‘123‘,np.nan,‘hj‘])
df = pd.DataFrame({‘key1‘:list(‘abcdef‘),
                   ‘key2‘:[‘hee‘,‘fv‘,‘w‘,‘hjja‘,‘123‘,np.nan]})
print(s,‘\n-----‘)
print(s.str[0])#取第一个字符串
print(s.str[:2])#取前2个字符
print(‘-----‘)
print(df[‘key2‘].str[0])
#str之后和字符串本身索引方式相同

结果:

0          A
1          b
2          C
3    bbhello
4        123
5        NaN
6         hj
dtype: object
-----
0      A
1      b
2      C
3      b
4      1
5    NaN
6      h
dtype: object
0      A
1      b
2      C
3     bb
4     12
5    NaN
6     hj
dtype: object
-----
0      h
1      f
2      w
3      h
4      1
5    NaN
Name: key2, dtype: object

原文地址:https://www.cnblogs.com/jxzhu/p/8654096.html

时间: 2024-10-31 00:30:16

2018.03.26 Python-Pandas 字符串常用方法的相关文章

python(4)---字符串常用方法

python字符串常用方法 password='.jpg 123456789 .jpg ABCDFG\n ' #字符串的值不能改变 ##strip()方法 print(password.strip()) #默认去掉字符串两边的空格和换行符 print(password.strip('.jpg')) #去掉两边的.jpg print(password.lstrip()) #掉字符串左边的空格和换行符 print(password.rstrip()) #掉字符串右边的空格和换行符 ##大小写转换 p

python之字符串常用方法

1.字符串常用方法print(s.zfill(4)) #在前面补0print(s.strip())print(s.lstrip())print(s.rstrip())print(s.replace('a','A')) #替换print(s.count('c'))#统计出现次数print(s.index('c')) #找下标.找不到报错print(s.find('d')) #找下标,找不到返回-1print(s.startswith('a')) #判断是否a开始print(s.endswith('

Python入门-字符串常用方法

Python 字符串 字符串是 Python 中最常用的数据类型.我们可以使用引号('或")来创建字符串. 创建字符串很简单,只要为变量分配一个值即可. var1 = 'Hello World!' var2 = "Python Runoob" 原文地址:https://www.cnblogs.com/zivli/p/9485120.html

Python学习之路—2018/6/26

Python学习之路-2018/6/26 1.ORM 单表操作 删除与修改记录 >>> ret = Book.objects.filter(title="go").delete() (1, {'app01.Book': 1}) >>> Book.objects.filter(price=115).update(price=120) 多表操作 创建模型 一对一 models.OneToOneField(to="表名", on_del

python中字符串的操作方法

python中字符串的操作方法大全 更新时间:2018年06月03日 10:08:51 作者:骏马金龙 我要评论这篇文章主要给大家介绍了关于python中字符串操作方法的相关资料,文中通过示例代码详细介绍了关于python中字符串的大小写转换.isXXX判断.填充.子串搜索.替换.分割.join以及修剪:strip.lstrip和rstrip的相关内容,需要的朋友可以参考下 前言 python中字符串对象提供了很多方法来操作字符串,功能相当丰富.?123 print(dir(str)) [...

python 数据结构 - 字符串

字符串是 Python 中最常用的数据类型.我们可以使用单引号 ( '' ) 或双引号 ( " " ) 来创建字符串. 在python中,创建变量不需要指定类型,你在创建变量赋值时,python解释器会自动推断变量的数据类型 1 >>> s = 'abcde' 2 >>> type(s) 3 <class 'str'> #这里把多种数据类型的值赋值给s,python都能自动识别 4 >>> s = 123 5 >&

Python pandas 0.19.1 Indexing and Selecting Data文档翻译

最近在写个性化推荐的论文,经常用到Python来处理数据,被pandas和numpy中的数据选取和索引问题绕的比较迷糊,索性把这篇官方文档翻译出来,方便自查和学习,翻译过程中难免很多不到位的地方,但大致能看懂,错误之处欢迎指正~ Python pandas 0.19.1 Indexing and Selecting Data 原文链接 http://pandas.pydata.org/pandas-docs/stable/indexing.html 数据索引和选取 pandas对象中的轴标签信息

python pandas 中文件的读写——read_csv()读取文件

read_csv()读取文件1.python读取文件的几种方式read_csv 从文件,url,文件型对象中加载带分隔符的数据.默认分隔符为逗号read_table 从文件,url,文件型对象中加载带分隔符的数据.默认分隔符为制表符(“\t”)read_fwf 读取定宽列格式数据(也就是没有分隔符)read_cliboard 读取剪切板中的数据,可以看做read_table的剪切板.在将网页转换为表格时很有用2.读取文件的简单实现程序代码: df=pd.read_csv('D:/project/

Python基础-字符串格式化_百分号方式_format方式

Python的字符串格式化有两种方式: 百分号方式.format方式 百分号的方式相对来说比较老,而format方式则是比较先进的方式,企图替换古老的方式,目前两者并存.[PEP-3101] This PEP proposes a new system for built-in string formatting operations, intended as a replacement for the existing '%' string formatting operator. 1.百分号