许多历史资料包含大量位置详细信息,手动分配需要大量资源。为了解决这种情况,我们描述了一种可用于自动对此类城市名称进行地理编码的算法。还可以根据共同的历史行政隶属关系对这些地方进行聚类。地名重名等问题主要通过加入来自同一上下文(同一来源)的附加信息来解决。验证以来自家谱数据库GEDBAS 的约 340 万行。综上所述,大约四分之三的相关位置细节可以被识别和定位。超过 90% 的已识别地点均可归属其历史省份。
许多历史资料中包含大量地名,手动分配会占用大量资源。为了简化这一过程,我们描述了一种可以自动对城市名称进行地理编码的算法。还可以根据共同的历史行政隶属关系对这些地点进行聚类。地名术语相同等问题主要通过包含来自同一上下文(同一来源)的更多信息来解决。验证以来自家谱数据库GEDBAS 的约 340 万个主要为德语的地名为基础。综上所述,大约四分之三的相关 巴拿马电报数据 地名能够被识别和定位。已识别地名中90%以上可归属其历史省份。
版本 1.1(2023.10.17)
文本中有微小改动;将“集群”一词澄清为“(位置)集群”;参考书目的增补和删除。