来源:python中国网 时间:2020-06-26

  任何数据类型都必须具备增删改查的操作,否则就无法对数据进行运算。本文讲解Series数据的增删改查、重新索引、对齐操作。

  1、增加元素

  1、直接设置一个key来添加元素

  2、append()函数,返回新的Series,参数必须是Series or list/tuple of Series(多个Series组成的列表)

# -*- coding: utf-8 -*-

import pandas as pd
import numpy as np

# 添加元素
s = pd.Series([1,2],index=['a','b'])
s['c'] = '不错'  # 添加个索引
print(s)
print('---------------')

# append方式添加元素
s2 = pd.Series([11,22],index=['a','b'])
s = s2.append(s2)  # 追加一个Series
print(s)
a     1
b     2
c    不错
dtype: object
---------------
a    11
b    22
a    11
b    22
dtype: int64



  2、删除元素

  drop()函数,inplace参数默认False,返回新的Series。inplace设置为True则修改原来的Series

import pandas as pd
import numpy as np


# 删除操作
arr = np.random.rand(2)
s = pd.Series(arr,index=['a','b'])
s2 = pd.Series(arr)

res = s.drop(['a'])
print(res)
print('-----------')

res2 = s2.drop([0])
print(res2)
print('-----------')

result = s.drop(['a','b'])
print(result)
print('----------')

s = pd.Series(arr,index=['c','d'])
s.drop(['c'],inplace=True) # inplace=True在自身基础上修改
print(s)
b    0.825498
dtype: float64
-----------
1    0.825498
dtype: float64
-----------
Series([], dtype: float64)
----------
d    0.825498
dtype: float64


  3、更改元素

  1、直接通过索引改

  2、通过apply函数更改

# 通过key更改元素
arr = np.random.rand(2)
s = pd.Series(arr,index=['a','b'])
print(s)
print('---------')

s['a'] = 100
print(s)
print('---------')

# 通过apply函数更改元素
arr = np.random.rand(2)
s = pd.Series(arr,index=['a','b'])
print(s)
print('---------')

s_new = s.apply(lambda x:x+10)
print(s_new)
a    0.682174
b    0.976155
dtype: float64
---------
a    100.000000
b      0.976155
dtype: float64
---------
a    0.771326
b    0.984102
dtype: float64
---------
a    10.771326
b    10.984102
dtype: float64


  4、查看元素

  1、head() 默认前5条数据,可以设置参数显示几条。

  2、tail() 默认后5条数据,可以设置参数显示几条。

import pandas as pd
import numpy as np


arr = np.random.rand(2)
s = pd.Series(arr,index=['a','b'])
print(s)
print('---------')
print(s.head(1))
print('----------')
print(s.tail(1))
a    0.989174
b    0.474133
dtype: float64
---------
a    0.989174
dtype: float64
----------
b    0.474133
dtype: float64


  5、重新索引

  不是修改索引名,而是按照新的索引排序生成新Series。

  1、reindex()函数实现,返回新的Series,如果新索引和旧索引有重复则会保留原有的索引及对应的值。

  2、通过fill_value参数填充缺失值。

import pandas as pd
import numpy as np


# 重新索引
d = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(d, index=['a', 'b', 'c', 'd'])
print(s)
print('------------')

s1 = s.reindex(['a','b','aa','bb'])
print(s1)
print('------------')

s2 = s1.reindex(['a','b','cc','dd'],fill_value='哈哈')
print(s2)
a    1.0
b    2.0
c    3.0
d    NaN
dtype: float64
------------
a     1.0
b     2.0
aa    NaN
bb    NaN
dtype: float64
------------
a      1
b      2
cc    哈哈
dd    哈哈
dtype: object



  6、对齐操作

  1、两个Series求和,索引相同的会自动相加

  2、创建Series时如果index参数的值(索引值)有两个相同的话也可以相加计算,但是避免这样。

import pandas as pd
import numpy as np


# 对齐操作
arr = [10,20]
s = pd.Series(arr,index=['a','b'])
print(s)
print('----------------')

s2 = pd.Series(arr,index=['a','c'])
print(s2)
print('=================')
print(s + s2)

print('----------------')
s3 = pd.Series(arr,index=['a','a']) # 索引值相同
print(s3)
print('================')
print(s + s3)

a    10
b    20
dtype: int64
----------------
a    10
c    20
dtype: int64
=================
a    20.0
b     NaN
c     NaN
dtype: float64
----------------
a    10
a    20
dtype: int64
================
a    20.0
a    30.0
b     NaN
dtype: float64