我正在学习NLP,试图在一个语料库上进行关系提取。我找到了这些幻灯片,并试图解析高维特征向量的符号(如下所示)。
其中
如何将最上面的方程转换成英文句子?对于每个输入文本单元,x;对于每个可能的特征,y —— 特征x是y可以用特征向量表示?我习惯看到笛卡尔积符号,我习惯看到函数符号,我习惯看到集合构建符号。但是在那条线上有太多我不熟悉的东西,我无法理解它在说什么。冒号是什么意思?箭头是什么意思?
回答:
这是函数符号。它表示有一个函数f,其定义域=X x Y,值域=R^n —— 其中X是某些输入文本,Y是某些标签。
换句话说,它将所有可能的文本和标签组合映射到某个n维空间中。