中文地名词典维护方法研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:bitdefender2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
地名词典(Gazetteer)是一个具有地理意义的字典或名录,主要描述地名的名称、要素类型、空间位置等重要参考信息,通常包含一个国家、地区或大陆的地理构成,以及社会统计和物理特征,如山脉,水系或道路,在网络电子地图服务、移动位置服务、地理信息检索、自然语言处理等方面有广泛应用。我国历史悠久、民族众多,地名既是社会文化的化石,也是时空的缩影。现有的地名词典管理和维护模式在时空关联以及地名空间关系表达方面较为薄弱。   本文在在地名时空数据模型的基础上,从被动式、大众参与式与主动式维护三种视角,综合运用XML、Web服务、网络爬虫、网页解析和地名识别等技术,探讨中文地名词典的多种维护方法。主要内容与成果包括以下几个方面:   (1)基于XML Schema的多源地名数据集成方法研究:以XML和XMLSchema为基础,通过XSLT映射机制实现了多源异构的批量地名数据集成。该方法是基于数据结构的被动式维护方法,没有考虑地名属性的语义集成问题。但是,实验证明这种方法具有跨平台性、可扩展性高,而且为地名Mashup提供了技术基础。   (2)基于网络爬虫的中文地名词典维护方法研究:利用网络爬虫技术主动获取海量空间敏感的网页文本并进行DOM结构化解析,整合CRY地名识别模型、规则匹配和Geocode(地址编码)技术实现地名词典地名、要素类型和空间位置的获取,有效解决了地名获取难、维护效率低的问题。   (3)基于Neogeography的中文地名词典维护方法研究:利用Web服务和Mashup技术,在国家安全保密规范允许的情况下,实现大众参与的地名词典维护方法。通过提供地名数据的查看、上传、地址编码等服务,Mashup其他地名数据资源,建立了地名服务评估机制,实现了VGI模式的地名词典维护。   (4)中文地名词典维护原型系统设计:在上述三种方法研究的基础上,设计了空间驱动的地名空间定位信息和属性信息的图文一体化管理模式,开发了中文地名词典维护原型系统,实现了大众参与式和主动式地名词典自动维护。
其他文献
大力提高城市化水平是许多发展中国家的首选战略,然而快速城市化引发的生态环境问题却令人担忧,生态环境安全已经引起了国际社会的高度关注。城市化与城市生态环境存在复杂的耦
水资源是维持所有生物生存的基本要素之一,也是人类活动必不可少的自然资源。作为水循环过程的重要环节,径流要素的变化对整个水资源系统起着主导作用,并对生态环境和经济发
在全球区域经济一体化的背景下,边境引起了国内外学者的普遍关注,但是目前中国关于边境的专门研究还比较薄弱。从20世纪90年代中国沿边开放政策实施以来,边境地区已经发生了翻天
土地利用/土地覆盖变化是由各种人文、社会经济与自然生态环境等因子在多种时间与空间尺度上综合作用的结果,具有很复杂的机理与过程。作为一切资源和环境要素的载体——土地,
本文主要研究了佛山市南海区第二次土地调查(农村部分)的数据质量控制技术与方法,在研究了二调的基本流程的基础上,有针对性地分析了主要流程中可能存在的质量问题,并提出了一些
随着城乡一体化的深入,国家对乡村发展越来越重视,但无论是从理论上还是从实践上,乡村交通的研究还没有较多地理学领域的研究成果。近年来国家逐步在政策上考虑到乡村的发展,然而
(一)党校教育要坚持理论联系实际的方针是由党校教育的性质、任务和培训目的决定的。早在党的六届六中全会时,毛泽东同志就对党校工作作了重要指示,强调要用马克思主义理论
鉴于人类社会的发展正面临着日益严重的能源短缺和环境破坏问题,特别是目前严峻的气候变暖趋势,在低碳经济背景下,发展清洁能源已成为时代的共识。风能作为一种清洁永续的能源,与
学位
党的十五大把邓小平理论确定为我们党的指导思想,并把它写入党章,提出用邓小平理论武装全党,高举邓小平理论的伟大旗帜,兴起一个学习邓小平理论的新高潮,把建设有中国特色社
6月初,中共中央政治局常委、全国人大常委会委员长李鹏在北京市考察工作时,再次强调党对人大制度建没和人大工作的领导。李鹏指出,人民代表大会制度是我国的根本政治制度。加