Home IT技术如何使用词向量测量偏见

如何使用词向量测量偏见

IT技术 xiaolong · 2025年5月24日 · 0 Comment

我试图理解如何使用词嵌入来测量偏见。我阅读了这篇文章 https://towardsdatascience.com/gender-bias-word-embeddings-76d9806a0e17

上述陈述中识别出的偏见是什么？这里的偏见是否意味着当涉及男性时，女性不能被视为医生？

是否识别了一种中性偏见，即对于男性或女性来说，女性医生和男性医生之间的差异很小，用向量表示为：$woman + doctor \approx man + doctor$ ？

回答：

你会期望

woman + doctor = man + doctor

或者重写为：

woman + doctor - man = doctor

但由于在那个词嵌入空间中是’nurse’（护士），这表明在医疗保健领域存在对女性的偏见，即女性更容易被视为护士。在用于训练嵌入的语料库中，医生更多地与男性相关联，因此可以得出结论，该语料库（以及学习到的词嵌入）存在性别偏见。

deep-learning machine-learning word2vec

发表回复取消回复