如何向量化SVM的损失函数

我想在不使用循环的情况下计算SVM的损失，但总是做不对。需要一些启发。

$L = \frac{1}{N} \sum_{i=1}^{N} L_{i}$ 和 $L_{i} = \sum_{j\neq y_{i}}^{} max(0, S_{j} - S_{y_{i}} + 1 )$

def svm_loss_vectorized(W, X, y, reg):    loss = 0.0    scores = np.dot(X, W)    correct_scores = scores[y]    deltas = np.ones(scores.shape)    margins = scores - correct_scores + deltas    margins[margins < 0] = 0  # max -> Boolean array indexing    margins[np.arange(scores.shape[0]), y] = 0  # Don't count j = yi    loss = np.sum(margins)    # Average    num_train = X.shape[0]    loss /= num_train    # Regularization    loss += 0.5 * reg * np.sum(W * W)    return loss

它应该输出与以下函数相同的损失值。

def svm_loss_naive(W, X, y, reg):    num_classes = W.shape[1]    num_train = X.shape[0]    loss = 0.0    for i in range(num_train):        scores = X[i].dot(W)        correct_class_score = scores[y[i]]        for j in range(num_classes):            if j == y[i]:                continue            margin = scores[j] - correct_class_score + 1 # note delta = 1            if margin > 0:                loss += margin    loss /= num_train # mean    loss += 0.5 * reg * np.sum(W * W) # l2 regularization    return loss

回答：

这里是一个向量化的方法 –

delta = 1N = X.shape[0]M = W.shape[1]scoresv = X.dot(W)marginv = scoresv - scoresv[np.arange(N), y][:,None] + deltamask0 = np.zeros((N,M),dtype=bool)mask0[np.arange(N),y] = 1mask = (marginv<0) | mask0marginv[mask] = 0loss_out = marginv.sum()/num_train # meanloss_out += 0.5 * reg * np.sum(W * W) # l2 regularization

此外，我们可以用np.tensordot来优化np.sum(W * W)，如下所示 –

float(np.tensordot(W,W,axes=((0,1),(0,1))))

运行时间测试

提出的方法作为函数 –

def svm_loss_vectorized_v2(W, X, y, reg):    delta = 1    N = X.shape[0]    M = W.shape[1]    scoresv = X.dot(W)    marginv = scoresv - scoresv[np.arange(N), y][:,None] + delta    mask0 = np.zeros((N,M),dtype=bool)    mask0[np.arange(N),y] = 1    mask = (marginv<=0) | mask0    marginv[mask] = 0    loss_out = marginv.sum()/num_train # mean    loss_out += 0.5 * reg * float(np.tensordot(W,W,axes=((0,1),(0,1))))    return loss_out

时间测量 –

In [86]: W= np.random.randn(3073,10)    ...: X= np.random.randn(500,3073)    ...: y= np.random.randint(0,10,(500))    ...: reg = 4.56    ...: In [87]: svm_loss_naive(W, X, y, reg)Out[87]: 70380.938069371899In [88]: svm_loss_vectorized_v2(W, X, y, reg)Out[88]: 70380.938069371914In [89]: %timeit svm_loss_naive(W, X, y, reg)100 loops, best of 3: 10.2 ms per loopIn [90]: %timeit svm_loss_vectorized_v2(W, X, y, reg)100 loops, best of 3: 2.94 ms per loop

学技术

如何向量化SVM的损失函数

发表回复取消回复

相关文章：

使用 LibSVM 计算与均值/标准差对最接近的匹配项

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复