pandas中DataFrame和get"/>
pandas中DataFrame和get
1.pandas.DataFrame.apply
DataFrame.apply(self, func, axis=0, raw=False, result_type=None, args=(), **kwds)
作用是对Dataframe的某个轴应用某个函数。
传入到函数的是一个Series对象,其索引是DataFrame的索引(axis=0)或DataFrame的列(axis=1)。默认情况下(result_type=None),根据应用函数的返回类型推断最终的返回类型。否则,它取决于result_type参数。
参数:
-
函数: 应用于每个列或行的函数功能。
-
axis:{0或’index’,1或’columns’},默认为0
- 0或’index’:将函数应用于每一列。
- 1或“列”:将功能应用于每一行。
-
原始:布尔值,默认为False 决定是否将行或列作为Series或ndarray对象传递:
- False :将每个行或列作为Series传递给函数。
- True:传递的函数将改为接收ndarray对象。
-
result_type :{‘expand’,‘reduce’,‘broadcast’,None},默认为None
这些仅在以下情况下起作用axis=1:- ‘expand’:类似列表的结果将变成列。
- ‘reduce’:如果可能,返回一个Series,而不是扩展类似列表的结果。这与“扩展”相反。
- ‘broadcast’:结果将以DataFrame的原始形状进行广播,原始索引和列将保留。 默认行为(无)取决于所应用函数的返回值:类似于列表的结果将作为一系列结果返回。但是,如果apply函数返回Series,则这些列将扩展为列。
-
args: 元组 除array/series外,还传递给func的位置参数。
-
** kwds 作为关键字参数传递给func的其他关键字参数 。
2.pandas.get_dummies
pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None)
官方文档:.get_dummies.html#pandas.get_dummies
哑变量处理,又叫虚拟变量,可以实现离散型数据进行one-hot编码处理。
data:
示例如下:
s = pd.Series(list('abc'))
pd.get_dummies(s)
得出结果如下
df = pd.DataFrame({'A': ['a', 'b', 'a'], 'B': ['b', 'a', 'c'],...: 'C': [1, 2, 3]})
pd.get_dummies(df)
pd.get_dummies(df, prefix=['col1', 'col2'])
更多推荐
pandas中DataFrame和get
发布评论