Pandas 基于 NumPy 构建,它遵循 NumPy 设定的一些规则。因此,当您在使用 Pandas 时,需要额外留意一些事项,避免出现一些不必要的错误。
在 if 语句中,如果您需要将 Pandas 对象转换为布尔值时,需要格外留意,这种操作会引起 ValueError 异常, 下面通过一组示例做简单说明:
import pandas as pd
if pd.Series([False, True, False]):
print('I am True')
输出结果:
从输出结果可以看出,上述代码引发了 ValueError 错误,并告诉我们 Series 的真值是不明确的。下面对其进行了简单分析:
如果 if 语句判断为 True,可能是认为它的长度并不是 0,反之 if 语句判断为 Fasle,可能是认为 Series 的数据值中包含了 False 值,因此是真还是假,无法判断,所以此处抛出了 ValueError 错误。
上述代码给出的修改建议,如下所示:
import pandas as pd
#使用 any()方法解决
if pd.Series([False, True, False]).any():
print("I am 城东书院 www.cdsy.xyz")
输出结果:
如果要是计算单个布尔元素的 Series 对象,那么您可以使用 bool() 方法进行修改,如下所示:
import pandas as pd
print(pd.Series([False]).bool())
输出结果:
如果在 Pandas 对象中使用==(相等)和!=(不相等) 这样的布尔运算符时,将返回一个布尔序列,示例如下:
import pandas as pd
s = pd.Series(range(4))
#返回布尔值序列,行索引为3的位置为True
print(s==3)
输出结果:
isin() 也会返回一个布尔序列,它用来判断元素值是否包含在的 Series 序列中。示例如下:
import pandas as pd
s = pd.Series(list('abc'))
s = s.isin(['a', 'c', 'e'])
print(s)
输出结果:
reindex() 函数表示重置行索引,该方法会生成新的 Pandas 对象,示例如下:
import pandas as pd
import numpy as np
#index行索引使用字符和数字混合的形式
df = pd.DataFrame(np.random.randn(6, 4), columns=['one', 'two', 'three','four'],index=['a','b',2,3,'e',5])
print (df)
#数字与字符混合后取数据
print (df.reindex(['a','b',5]))
print (df.reindex([2,'e']))
输出结果: