索引
‘’’
这种双重抽象虽然看起来没必要,但是pandas索引的数据类型,
可以支持字符串、日期、任意排序的索引,以及重复的索引值。
索引是pandas的核心功能,在序列上的操作,可以按照索引进行查找。特别是时间序列的数据集对象。
cool = {' index ':[ 'Alan' , 'Irina' , 'Lisa' , 'Mark'] ,' data ':[180 , 162 , 165 , 173] ,' name ': 'family'}
print(cool)
结果:
序列
# pandas 序列import pandas as pd'''
该系列是一维的。 但是,这看起来像是二维的。
最左边的列是索引,其中包含索引的条目。'''
cool2 = pd.Series ([180, 162, 165, 173] ,name = 'family')'''
索引的通用名称是轴(axis),索引的值(0、1、2、3)称为轴标签(axis labels),
因此它们是整数。
Series 的值可以包含字符串、浮点数、布尔值或任意 Python 对象。
'''
print(cool2)'''
检查序列(或者数据框)的索引很容易,因为它是对象的属性(索引是序列的一部分)。
'''
print(cool2.index)
基于字符串的索引
'''
索引也可以是基于字符串的,在这种情况下,pandas所表示的索引是对象,不是字符串。
'''
import pandas as pd
cool3 = pd.Series ([180, 162, 165, 173] ,name = 'family' ,index =[ 'Alan' , 'Irin' , 'Lisa' , 'Mark'])'''
我们打印 Series时看到的 dtype是值的类型,而不是索引的数据类型。
'''
print(cool3)'''
如果检查index属性,就会知道数据类型(dtype)是对象(object)了。
'''
print(cool3.index)
序列的元素可以不同质
import pandas as pd# 建立一个对象Smart
class Smart :pass# 建立一个包括foo的序列ringshot = pd.Series(['Eric' , 'Karl' , 73 , Smart()] ,name = 'rings')'''
序列之内的实际数据(数值)不必是数字或同质的。
我们把Smart这个对象插入到rings这个系列。
'''