神经网络中的单元是什么(反向传播算法)

请帮助我理解神经网络中的单元概念。根据书中所述,输入层中的一个单元代表训练元组的一个属性。然而,具体它是如何代表的并未详细说明。

这是相关的图表:enter image description here

关于输入单元有两种“思考路径”。第一种可能是X1代表attr1X2代表attr2…另一种可能是X1X2X3都代表attr1,但X1代表Value.VALUE_ONE,…,X3代表Value.VALUE_THREE。因此,在最少的情况下,如果attr1 = Value.VALUE_TWO,它将被加权并同时馈送到第二层。

public class Tuple{  private Value attr1  private Value attr2  private Value attr3}public enum Value{  VALUE_ONE,  VALUE_TWO,  VALUE_THREE}

第二个问题是关于隐藏层单元的。如何决定隐藏层中应该有多少单元,以及它们在模型中代表什么?


回答:

“单元”只是浮点值。

所有在这里发生的计算都是向量乘法,因此可以使用矩阵乘法和GPU硬件很好地并行化。

一般的计算看起来像这样:

double v phi(double[] x, double[] w, double theta) {  double sum = theta;  for(int i = 0; i < x.length; i++)    sum += x[i] * w[i];  return tanh(sum);}

但你不希望自己在Java代码中这样做。你希望在GPU上以并行方式进行,因为这将快100倍。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注