如何计算两个X和Y对之间的相似度的最佳实践

我有一些关于一个元素的值。例如，element1: values1, values2。对于每个元素，我需要计算给定数量特征的“分数”。假设我们有一个特征表示如下：

特征1的高分是由value1的高分和value2的低分决定的。

所以，如果我假设value1的高分（1）和value2的低分（0）对应于特征1的高分，那么给定value1和value2的两个不同分数（例如value1=0.7，value2=0.2），计算特征1分数的最佳实践是什么？我使用Python作为编程语言，偏好使用sklearn模块，但任何合适的解决方案都是可以接受的。

回答：

首先标准化你的数据。一种标准化方法是使你的values1和values2在[0,1]范围内。
假设基于标准化数据的特征1的平均2值特征为（.7，.2）。对于任何新的2值（x，y），计算（x，y）与（.7，.2）之间的距离。

在机器学习中计算距离时，通常不计算平方根部分。

dist^2 = (x-.7)^2 + (y-.2)^2

你可能还对计算2值（x，y）相对于（.7，.2）的误差感兴趣，可以研究分类交叉熵。

学技术

如何计算两个X和Y对之间的相似度的最佳实践

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复