我有一个字符列和数字列,但我希望对字符列进行分类,并应用随机森林分类器。我知道有OneHotEncoder,但没有任何示例。那么,如何将字符列(例如性别列,包含’f’和’m’)转换为整数如(0,1)呢?
回答:
使用LabelEncoder,它可以将字符串数组转换为整数数组。
示例:
from sklearn.preprocessing import LabelEncoderimport pandas as pddata = pd.DataFrame()data['age'] = [17,33,47]data['gender'] = ['m','f','m']enc = LabelEncoder()print(data)enc.fit(data['gender'])data['gender'] = enc.transform(data['gender'])print(data)
输出:
age gender0 17 m1 33 f2 47 m age gender0 17 11 33 02 47 1