我正在寻找能够从维基数据返回的结构化信息中生成完整文本的库或方法的指南——如果可能的话,希望能支持多种语言。
为了更清楚地说明:从这里提供的数据(这是JSON版本),我希望能够生成类似于同一项目的维基百科页面的介绍段落的文本:
奥尔维耶托大教堂(意大利语:Duomo di Orvieto;Cattedrale di Santa Maria Assunta)是一座大型的14世纪罗马天主教大教堂,供奉圣母升天,位于意大利中部翁布里亚地区的奥尔维耶托镇。
原因是,对于所有存在页面的情况,维基百科都提供了文本,但我希望对于那些没有维基百科页面的维基数据项目也能有类似的内容。
我的第一个问题是:我不知道这种技术叫什么,所以我不知道该如何搜索。任何起点的指导都将受到欢迎,包括服务或API。
回答:
这个问题属于数据到文本生成任务。我不知道目前有哪些服务提供解决方案。你可以查看WEBNLG挑战赛,它具有相同的目标和类似数据。据我所知,大多数方法都是基于模板的,用于自动将维基数据插入到维基百科的文本中。