Python学习笔记:pandas.Series.str.split分列⼀、字符串分割split
split() ⽅法通过指定分隔符对字符串进⾏切分,返回分割后的字符串列表。
使⽤语法为:
str.split(str=" ", unt(str))
参数:
-- str 分隔符默认为所有的空字符包括空格、换⾏符、制表符等
-- maxsplit 分割次数默认-1 即分割所有
实操:
str = "abc ggg rrr"
str.split() # ['abc', 'ggg', 'rrr']python 正则表达式 空格
str.split(" ",maxsplit=1) # ['abc', 'ggg rrr']
⼆、pandas.str.split分列
1.str.split()
使⽤语法为:
Series.str.split(pat=None, n=-1, expand=False)
-- pat 分隔符
-- n 指定分割次数 -1代表全部
-- expand=True 分列返回多列
指定 expand=True 进⾏分列,返回 DataFrame。
import pandas as pd
df = pd.DataFrame({'id':[1, 2],
'code':['A,B,C', 'B,C']})
# 按逗号分割
'''
0    [A, B, C]
1      [B, C]
Name: code, dtype: object
'''
# ⾃动分列
'''
0  1    2
0  A  B    C
1  B  C  None
'''
# 指定参数n 分割次数
'''
0    1
0  A  B,C
1  B    C
'''
⽀持正则表达式分割符
import pandas as pd
s = pd.Series(["1+1=2"])
s.str.split(r"\+|=", expand=True)
'''
0  1  2
0  1  1  2
'''
2.str.rsplit
从右往左寻分列依据,使⽤语法类似 split。df['code'].str.rsplit(',', expand=True, n=1)
'''
0  1
0  A,B  C
1    B  C
'''
参考链接:
参考链接:
参考链接:
参考链接: