我想使用机器学习从句子中提取与攀岩相关的名称/地点。我已经对类似这样的数据进行了“分类”:
Bouldering in Central Park!!||Central ParkNot the best angle but check out that latch!!! Golden Bowl (V7) in Squamish||Golden Bowl||Squamish Does anyone have a used crash pad for sale?||
(其中我有一个句子,后面跟||
,然后是所有的名称/地点(再次以||
分隔)
由于我最熟悉C#,所以我在考虑使用ML.NET来做这件事,但似乎找不到如何开始。我认为Iris分类示例可能是最接近我的情况的?但我不确定
对于ML.NET中要使用的分类模型有什么建议吗?或者使用不同的语言/框架?
回答:
你可以轻松尝试一些预训练的命名实体识别(NER)算法,比如斯坦福大学的或Spacy的。可能这些对你来说还不够充分,所以在那个步骤你需要确定你的实体类型,并进行一些标注来训练你自己的NER算法。
编辑:你可以更改分类器类型以获得不同的结果。
在斯坦福在线演示工具上的示例结果: