一种面向中文非标建筑地址标准化的自动匹配方法

作者:邹恩岑; 曾诚; 张谦; 徐川; 朱润; 奚雪峰

摘要:建筑标准地址是指公安机关定义的一套具有清晰结构特征的字符编码,这套编码中既包含了采用自然语言描述的地址信息,也包括了该地址信息所对应地理位置的经纬度信息。非标准地址则是指从来自社会不同机构,同样采用自然语言描述建筑物地址信息,但可能不具有标准地址规定的必要组成元素的一类地址。将非标地址准确映射至海量标准地址数据集,有助于开展智慧城市应用中包含非标地址的各类数据发现、分析、统计等工作。提出了一种面向中文非标建筑地址标准化的自动匹配方法,采用标准地址词典、地址淘选、地址相似度计算等方法,自动完成非标地址与标准地址的匹配。基于众包技术标注数据集上的实验初步结果,从准确率和泛化能力两方面验证了模型的可用性及有效性。

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 基础科学
  • >
  • 自然科学理论与方法
收录:
  • CA 化学文摘(美)
  • Pж(AJ) 文摘杂志(俄)
  • 万方收录(中)
  • 知网收录(中)
  • 维普收录(中)
  • 国家图书馆馆藏
  • 上海图书馆馆藏
关键词:
  • 非标建筑地址
  • 建筑地址标准化
  • 自动匹配
  • 地址淘选

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:苏州科技大学学报·自然科学版

期刊级别:省级期刊

期刊人气:1475

杂志介绍:
主管单位:江苏省教育厅
主办单位:苏州科技大学
出版地方:江苏
快捷分类:科学
国际刊号:2096-3289
国内刊号:32-1871/N
邮发代号:
创刊时间:1984
发行周期:季刊
期刊开本:A4
下单时间:1个月内
复合影响因子:0.77
综合影响因子:0.62