看在上帝的份上!我有101个单列特征,我只想将它们合并、连接或拼接,使它们都具有第一个数据框的索引。我已经将所有数据框放在一个字典中了!我以为那才是难点。下面是我手动完成我想做的事情。我希望能遍历这个字典,获取所有101列。
a=ddict['/Users/cb/Dropbox/Python Projects/Machine Learning/Data Series/Full Individual Stock Data/byd/1byd.xls']b=ddict['/Users/cb/Dropbox/Python Projects/Machine Learning/Data Series/Full Individual Stock Data/byd/2byd.xls']c=ddict['/Users/cb/Dropbox/Python Projects/Machine Learning/Data Series/Full Individual Stock Data/byd/3byd.xls']d=a.join(b['Value'],lsuffix='_caller')f=d.join(c['Value'],lsuffix='_caller')f
回答:
你需要
- 创建一个
first
变量并将其设置为True
。第一次遍历我们的dict()
时,我们没有可以合并的数据框,所以我们只需将value
赋值给一个变量 - 将
first
变量设置为False
,这样下次我们就可以将数据框合并在一起 - 使用
df.merge()
并将left_index
和right_index
参数设置为True
,这样我们的合并操作将基于这些索引进行
下面是一个示例代码。
输入
import pandas as pddf = pd.DataFrame({'col1': [1,2,3,4]})df1 = pd.DataFrame({'col2': [11,12,13,14]})df2 = pd.DataFrame({'col3': [111,112,113,114]})d = {'df':df, 'df1':df1, 'df2':df2}first = Truefor key, value in d.items(): if first: n = value first = False else: n = n.merge(value, left_index=True, right_index=True)n.head()
输出
col1 col2 col30 1 11 1111 2 12 1122 3 13 1133 4 14 114
这里有一个关于merge()
的链接,供更多信息参考 链接