我目前正在将 https://developer.apple.com/machine-learning/models/#text 列出的 BERT 模型集成到 iOS 应用程序中,遇到了删除低确定性答案的困难。
我使用了上述链接中找到的示例代码,但由于我想基于更大体量的文本回答问题,我循环处理了一个段落数组,并为每个段落预测答案。然而,如果没有找到答案,模型不会返回 nil 或“无答案”,而是返回一个(看似)随机的子字符串。我想问的是:是否有可能访问 BERT 响应的确定性,以过滤掉不太可能的结果?或者,有没有其他方法可以让 BERT 只返回超过设定确定性阈值的结果?
回答:
经过几个小时的搜索,我现在找到了一个解决方案。具有讽刺意味的是,这只需要三行代码,但无论如何,这里是解决方案:
if bestSum < 7.5 { return nil}
我在 BERTOutput.swift
文件中的 findBestLogitPair()
方法中实现了这一点,这是 Apple 提供的使用 BERT 进行文本分析的示例代码。我现在发现,统计学中的术语 logit 确实有点类似于概率的意思——但作为一个程序员,我之前对此一无所知!