我制作的T-SNE散点图可以正常打印,但所有点都是相同的颜色,而且没有图例。这让我非常头疼。在使用SeaBorn时,这涉及到’hue’参数,而在Matplotlib中,则需要定义’c’参数。总之,我非常需要帮助来定义一个图例,其中包含A、B、C(这些是列名)并将它们(A、B、C)与散点图上的颜色关联起来。
我的数据如下:
A B C 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0a = pd.DataFrame(data_files, columns = ['A'])b = pd.DataFrame(data_files, columns = ['B'])c = pd.DataFrame(data_files, columns = ['C'])test_array = [a,b,c]data_elem = pd.concat(test_array, axis = 1, sort = False)model = TSNE(n_components = 2, perplexity = 50, learning_rate = 100, random_state = None)tsne_data = model.fit_transform(data_elem)tsne_df = pd.DataFrame(tsne_data)htw = tsne_df.to_numpy(copy = True)tsne_df['tsne_x'] = htw[:, 0]tsne_df['tsne_y'] = htw[:, 1]sns.scatterplot( x = "tsne_x", y = "tsne_y", #hue = "", <--issue is here palette = "Greens", data = tsne_df, legend = "full", alpha = 0.3 )plt.xlabel("Dimension_X")plt.ylabel("Dimension_Y")plt.legend(loc = 'upper right')plt.show()
我尝试过的所有方法都不起作用。我总是遇到错误,比如KeyError或者在尝试定义’hue’或’c’(如果使用Matplotlib)时出现的其他错误。
回答:
我认为我已经解决了这个问题。在将DataFrame放入T-SNE之前,请确保将数据和标签分开。
data_elem_data = data_elemdata_elem_label = labels go here (must be 1 dimensional)
对我来说,我需要在将data_elem_label与其他数据结合之前将其展平。
data_elem_label = data_elem_label.values.flatten()
T-SNE会创建两个列(x,y),所以添加第三列作为标签列。因此…将分离的标签列(从一开始就分离的)添加到完成的T-SNE中。
例如:
tsne_df = pd.concat([tsne_df, pd.Series(data_elem_label)], axis = 1)
这对我来说是有效的解决方案。