Python的Series用法

大家好，我是考100分的小小码，祝大家学习进步，加薪顺利呀。今天说一说Python的Series用法,希望您对编程的造诣更进一步.

Python是一种高级编程语言，被广泛应用于数据分析、人工智能、机器学习等领域。在Python的标准库pandas中，Series是一种核心数据结构，用于存储一维数组，并且支持基于标签的索引和数据处理。

一、Series基础用法

在pandas中，使用Series的代码示例如下：

import pandas as pd

data = pd.Series([1, 2, 3, 4, 5])
print(data)

以上代码中，pd.Series()是创建Series对象的函数，方括号内是Series对象的数据。Series对象包含两部分数据：一维数组Data和与之对应的标签Index。默认情况下，Index是从0开始的整数序列，但也可以自定义Index。

可以通过访问Index和Data属性来获取Series的Index和Data，如下示例：

import pandas as pd

data = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])
print(data.index)
print(data.values)

以上代码中，pd.Series()函数中通过参数index指定了Series对象的Index为[‘a’, ‘b’, ‘c’, ‘d’, ‘e’]，通过访问Index属性和values属性分别输出了Index和Data。

二、Series数据处理

Series对象支持多种数据处理方式，如数值运算、数据过滤、条件筛选等。下面介绍几种常用的Series数据处理方法。

1.数值运算

Series对象支持多种数值运算，如加、减、乘、除、求平均值、最大值、最小值等。具体示例如下：

import pandas as pd

data = pd.Series([1, 2, 3, 4, 5])
print(data+1)
print(data*2)
print(data.mean())
print(data.max())
print(data.min())

以上示例中，代码分别实现了Series对象的加、乘、求平均值、最大值和最小值等操作，可以直接对Series对象进行操作，无需遍历整个数组。

2.数据过滤

在实际的数据分析中，我们经常需要对数据进行过滤，如筛选出某个时间段的数据、筛选出特定类型的数据等。Series对象支持基于条件的过滤，具体示例代码如下：

import pandas as pd

data = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])
print(data[data>3])

以上示例代码中，使用了大于号(>)来筛选出Series对象中大于3的数据。

3.条件筛选

在实际的数据分析中，我们需要根据某个条件来对数据进行筛选，如筛选出特定日期的数据。Series对象支持基于条件的筛选，具体代码如下：

import pandas as pd
from datetime import datetime

data = pd.Series([1, 2, 3, 4, 5], index=[datetime(2022,5,1), datetime(2022,5,2), datetime(2022,5,3), datetime(2022,5,4), datetime(2022,5,5)])
print(data['2022-05-02':'2022-05-04'])

以上示例代码中，使用了切片操作符(:)来按日期范围筛选出Series对象中的数据。

三、Series与DataFrame的关系

pandas中的DataFrame可以看作是一个表格，其中行代表数据记录，列代表数据字段。而Series则可以看作是DataFrame的一列或一行。在DataFrame中，可以通过Series的标签进行数据的选择、修改、删除、插入等操作，下面展示了一些常用DataFrame的操作方法。

1.选择数据

可以通过DataFrame的loc和iloc方法来按照行列标签或索引来选择数据。其中loc方法根据标签来选择数据，iloc方法根据索引来选择数据。具体代码如下：

import pandas as pd

data = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}, index=['a', 'b', 'c'])
print(data.loc['a', 'B'])
print(data.iloc[0, 1])
print(data.loc[:, 'B'])
print(data.iloc[:, 1])

以上示例代码中，分别对DataFrame对象进行了按标签和按索引的数据选择。

2.修改数据

在DataFrame中，也可以按照标签或索引来修改数据。具体代码示例如下：

import pandas as pd

data = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}, index=['a', 'b', 'c'])
data.loc['a', 'B'] = 10
data.iloc[0, 1] = 11
data.loc[:, 'C'] = [15, 16, 17]
data.iloc[:, 0] = [12, 13, 14]
print(data)

以上示例代码中，分别对DataFrame对象进行了按标签和按索引的数据修改，即修改了标签为’a’的’B’列数据、第一行第二列数据，以及’C’列和第一列数据。

3.删除数据

在DataFrame中，也可以按照标签或索引来删除数据。具体代码示例如下：

import pandas as pd

data = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}, index=['a', 'b', 'c'])
data = data.drop('a')
print(data)

以上示例代码中，使用了drop方法按照标签’a’来删除了DataFrame对象的一行，即删除了标签为’a’的行。

综上所述，pandas中的Series是一种核心数据结构，常用于存储一维数组，并支持多种数据处理方法。在DataFrame中，Series可以看作是DataFrame的一列或一行，可以通过Series的标签进行数据的选择、修改、删除、插入等操作。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。
转载请注明出处: https://daima100.com/21369.html