我是UIMA的新手,目前我遇到了下面的情况。
如何对UIMA中由注释器获得的不同标记集进行分类和关联?例如,对于人名实体标记集如{John,Smith},以及资产实体集如{car,home}。我想编写规则来进行如下XML格式的分类。
<person> <name>john</name> <asset>car</asset> </person>and<person> <name>Smith</name> <asset>home</asset> </person>
感谢您的帮助…
回答:
您可能想看看UIMA Ruta,这是一种基于规则的方法。
在UIMA Ruta中解决这个问题的方法有很多种,这取决于前提条件和需求。
这里有一个简单的例子,处理像“john buys a car. Smith is home.”这样的文档。
DECLARE Name, Asset, Sentence;DECLARE Annotation Person (Name name, Asset asset);// 只是为了获取一些注释"john" -> Name;"Smith" -> Name;"car" -> Asset;"home" -> Asset;// 关系的范围(# PERIOD){-> Sentence};PERIOD (# PERIOD){-> Sentence};// 创建关系Sentence{-> CREATE(Person, "name" = Name, "asset" = Asset)};
(我是UIMA Ruta的开发者)