在CRF模型中可以使用数值特征吗

在CRF模型中添加数值特征是否可行或有益?例如,序列中的位置信息。

我正在使用CRFsuite。看起来所有特征都会被转换为字符串,例如’pos=0’、’pos=1’,这样就失去了作为欧几里得距离的意义。

或者我应该用这些特征训练另一个模型,例如SVM,然后与CRF模型进行集成?


回答:

我发现CRFsuite确实可以处理数值特征,至少根据这份文档来看是这样的:

  • {“string_key”: float_weight, …} 字典,其中键是观察到的特征,值是它们的权重;
  • {“string_key”: bool, …} 字典;True 被转换为1.0权重,False 被转换为0.0;
  • {“string_key”: “string_value”, …} 字典;这相当于 {“string_key=string_value”: 1.0, …}
  • [“string_key1”, “string_key2”, …] 列表;这相当于 {“string_key1”: 1.0, “string_key2”: 1.0, …}
  • {“string_prefix”: {…}} 字典:嵌套字典会被处理,并在每个键前加上“string_prefix”。
  • {“string_prefix”: […]} 字典:嵌套列表会被处理,并在每个键前加上“string_prefix”。
  • {“string_prefix”: set([…])} 字典:嵌套列表会被处理,并在每个键前加上“string_prefix”。

只要满足以下条件:

  1. 我保持输入格式正确;
  2. 我使用浮点数而不是浮点数的字符串;
  3. 我对其进行归一化处理。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注