这是我如何创建这些列表的,原本是从逻辑回归的coef_和它们相关的列标签中获取的。
#创建列表
column_labels = X.columns.tolist()
coef = logreg.coef_.squeeze().tolist()
#压缩在一起
labels_coef = list(zip(column_labels, coef))
#排序并以列表形式展示
sorted_labels = sorted(labels_coef, key=lambda x: x[1])
#绘制条形图
plt.barh(*zip(* sorted(sorted_labels[:5] +sorted_labels[-5:],key=lambda x: x[1] )))
#或者
#plt.barh(*zip(* (sorted_labels[:5] +sorted_labels[-5:])))
#显示图表
plt.show()
但如何将它们以值的升序方式绘制在同一个图表上呢?
显然,这并不能解决问题
回答:
你可以将前五个和后五个合并在一起,然后一起绘制:
plt.barh(*zip(* (sorted_labels[:5] +sorted_labels[-5:])))
编辑:这个问题中提到了排序问题:
那里提出的两个解决方案是:
- 将数据作为数值绘制并添加y标签:
labels, values = zip(*(sorted_labels[:5] +sorted_labels[-5:])) plt.barh(range(len(labels)),values) plt.yticks(range(len(values)),values) plt.show()
-
通过使用
pandas
的DataFrame
来绕过这个问题:df = pd.DataFrame(list(zip(labels,values))).set_index(1)
df.plot.barh()