Pandas Series对象常用的属性和方法

Pandas Series对象是一维标签数组,主要用于存储不同数据类型的数据。

Series常用属性

下面我们介绍 Series 的常用属性和方法。在下表列出了 Series 对象的常用属性。

名称 属性
index 返回一个Index对象,代表Series的索引。
values 返回一个numpy数组,代表Series的值。
dtype 返回Series中的数据类型。
name 返回Series的名称。
size 返回Series中的元素个数。

现在我们创建一个 Series 对象,并演示如何使用上述表格中的属性。代码如下所示:

import pandas as pd

# 创建Series
s = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])

# Series属性
print("shape:", s.shape)
print("size:", s.size)
print("index:", s.index)
print("values:", s.values)
print("dtype:", s.dtype)

输出结果为:

shape: (5,)
size: 5
index: Index(['a', 'b', 'c', 'd', 'e'], dtype='object')
values: [1 2 3 4 5]
dtype: int64

Series常用方法

Series常用方法有以下:

名称 方法
head(n) 返回Series的前n个元素,默认为前5个
tail(n) 返回Series的后n个元素,默认为后5个
describe() 返回Series的基本统计信息,包括元素数量、均值、标准差、最小值、25%分位数、50%分位数、75%分位数和最大值
sort_values() 对Series按值进行排序
sort_index() 对Series按索引进行排序
unique() 返回Series中的唯一值
value_counts() 返回Series中每个元素出现的次数
apply(func) 对Series的每个元素应用函数func
map(mapping) 对Series的每个元素应用字典mapping,将元素映射为另一个值
replace(to_replace, value) 将Series中的值to_replace替换为value

下面是一些示例代码:

import pandas as pd

# 创建Series
s = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])

# 方法
print("head:\n", s.head(2))
print("tail:\n", s.tail(2))
print("describe:\n", s.describe())
print("sort_values:\n", s.sort_values())
print("sort_index:\n", s.sort_index())
print("unique:\n", s.unique())
print("value_counts:\n", s.value_counts())
print("apply:\n", s.apply(lambda x: x**2))
print("map:\n", s.map({1: 'one', 2: 'two', 3: 'three', 4: 'four', 5: 'five'}))
print("replace:\n", s.replace(2, 20))

输出结果为:

head:
 a    1
b    2
dtype: int64
tail:
 d    4
e    5
dtype: int64
describe:
 count    5.000000
mean     3.000000
std      1.581139
min      1.000000
25%      2.000000
50%      3.000000
75%      4.000000
max      5.000000
dtype: float64
sort_values:
 1    1
2    2
3    3
4    4
5    5
dtype: int64
sort_index:
 a    1
b    2
c

本文链接:https://my.lmcjl.com/post/19940.html

展开阅读全文

4 评论

留下您的评论.