我的数据集中有一列看起来像这样:
我想知道将这些信息纳入分类器模型的最佳实践是什么。
请帮助我解决这个问题。该项目是用Python在Jupyter Notebook中完成的。
回答:
您可以将字符串转换为秒,并将其用作一个特征:
df = pd.DataFrame(['25m 34s', '1m', '22s'], columns=['game_length'])df['game_length_seconds'] = pd.to_timedelta(df['game_length']).apply(lambda x: x.seconds)>>> df game_length game_length_seconds0 25m 34s 15341 1m 602 22s 22