大家好,我是考100分的小小码 ,祝大家学习进步,加薪顺利呀。今天说一说Python的Series用法,希望您对编程的造诣更进一步.
Python是一种高级编程语言,被广泛应用于数据分析、人工智能、机器学习等领域。在Python的标准库pandas中,Series是一种核心数据结构,用于存储一维数组,并且支持基于标签的索引和数据处理。
一、Series基础用法
在pandas中,使用Series的代码示例如下:
import pandas as pd data = pd.Series([1, 2, 3, 4, 5]) print(data)
以上代码中,pd.Series()是创建Series对象的函数,方括号内是Series对象的数据。Series对象包含两部分数据:一维数组Data和与之对应的标签Index。默认情况下,Index是从0开始的整数序列,但也可以自定义Index。
可以通过访问Index和Data属性来获取Series的Index和Data,如下示例:
import pandas as pd data = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e']) print(data.index) print(data.values)
以上代码中,pd.Series()函数中通过参数index指定了Series对象的Index为[‘a’, ‘b’, ‘c’, ‘d’, ‘e’],通过访问Index属性和values属性分别输出了Index和Data。
二、Series数据处理
Series对象支持多种数据处理方式,如数值运算、数据过滤、条件筛选等。下面介绍几种常用的Series数据处理方法。
1.数值运算
Series对象支持多种数值运算,如加、减、乘、除、求平均值、最大值、最小值等。具体示例如下:
import pandas as pd data = pd.Series([1, 2, 3, 4, 5]) print(data+1) print(data*2) print(data.mean()) print(data.max()) print(data.min())
以上示例中,代码分别实现了Series对象的加、乘、求平均值、最大值和最小值等操作,可以直接对Series对象进行操作,无需遍历整个数组。
2.数据过滤
在实际的数据分析中,我们经常需要对数据进行过滤,如筛选出某个时间段的数据、筛选出特定类型的数据等。Series对象支持基于条件的过滤,具体示例代码如下:
import pandas as pd data = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e']) print(data[data>3])
以上示例代码中,使用了大于号(>)来筛选出Series对象中大于3的数据。
3.条件筛选
在实际的数据分析中,我们需要根据某个条件来对数据进行筛选,如筛选出特定日期的数据。Series对象支持基于条件的筛选,具体代码如下:
import pandas as pd from datetime import datetime data = pd.Series([1, 2, 3, 4, 5], index=[datetime(2022,5,1), datetime(2022,5,2), datetime(2022,5,3), datetime(2022,5,4), datetime(2022,5,5)]) print(data['2022-05-02':'2022-05-04'])
以上示例代码中,使用了切片操作符(:)来按日期范围筛选出Series对象中的数据。
三、Series与DataFrame的关系
pandas中的DataFrame可以看作是一个表格,其中行代表数据记录,列代表数据字段。而Series则可以看作是DataFrame的一列或一行。在DataFrame中,可以通过Series的标签进行数据的选择、修改、删除、插入等操作,下面展示了一些常用DataFrame的操作方法。
1.选择数据
可以通过DataFrame的loc和iloc方法来按照行列标签或索引来选择数据。其中loc方法根据标签来选择数据,iloc方法根据索引来选择数据。具体代码如下:
import pandas as pd data = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}, index=['a', 'b', 'c']) print(data.loc['a', 'B']) print(data.iloc[0, 1]) print(data.loc[:, 'B']) print(data.iloc[:, 1])
以上示例代码中,分别对DataFrame对象进行了按标签和按索引的数据选择。
2.修改数据
在DataFrame中,也可以按照标签或索引来修改数据。具体代码示例如下:
import pandas as pd data = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}, index=['a', 'b', 'c']) data.loc['a', 'B'] = 10 data.iloc[0, 1] = 11 data.loc[:, 'C'] = [15, 16, 17] data.iloc[:, 0] = [12, 13, 14] print(data)
以上示例代码中,分别对DataFrame对象进行了按标签和按索引的数据修改,即修改了标签为’a’的’B’列数据、第一行第二列数据,以及’C’列和第一列数据。
3.删除数据
在DataFrame中,也可以按照标签或索引来删除数据。具体代码示例如下:
import pandas as pd data = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}, index=['a', 'b', 'c']) data = data.drop('a') print(data)
以上示例代码中,使用了drop方法按照标签’a’来删除了DataFrame对象的一行,即删除了标签为’a’的行。
综上所述,pandas中的Series是一种核心数据结构,常用于存储一维数组,并支持多种数据处理方法。在DataFrame中,Series可以看作是DataFrame的一列或一行,可以通过Series的标签进行数据的选择、修改、删除、插入等操作。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/21369.html