我想知道在Tensorflow的seq2seq框架中是否有办法可以知道对某个输入的回复是否可以达到x%的置信度。
下面是一个例子:
我有hi
作为hello
的回复。这运作得很好。我还有一堆其他训练过的句子。然而,假设我输入了一些乱码,比如sdjshj sdjk oiqwe qw
。Seq2seq仍然试图给出回应。我理解这是它的设计方式,但我想要知道是否有办法可以表明框架无法自信地回答这个问题。或者说这些词没有被训练过。
这将非常有帮助。
回答:
对输出logits使用逻辑函数(或Sigmoid函数):因为logit函数基本上是sigmoid函数的逆函数:
Logit函数:
你可以看到它们是相似的。在Tensorflow中,有sigmoid函数,但我发现直接编写sigmoid函数时程序运行得更快:
如果你使用sigmoid函数,你将得到一个从0到1的值,这就是你所寻找的置信度。更多信息可以在这里找到: