我试图理解如何使用词嵌入来测量偏见。我阅读了这篇文章 https://towardsdatascience.com/gender-bias-word-embeddings-76d9806a0e17
上述陈述中识别出的偏见是什么?这里的偏见是否意味着当涉及男性时,女性不能被视为医生?
是否识别了一种中性偏见,即对于男性或女性来说,女性医生和男性医生之间的差异很小,用向量表示为:$woman + doctor \approx man + doctor$ ?
回答:
你会期望
woman + doctor = man + doctor
或者重写为:
woman + doctor - man = doctor
但由于在那个词嵌入空间中是’nurse’(护士),这表明在医疗保健领域存在对女性的偏见,即女性更容易被视为护士。在用于训练嵌入的语料库中,医生更多地与男性相关联,因此可以得出结论,该语料库(以及学习到的词嵌入)存在性别偏见。